habra.16 / Невизуальные методы защиты сайта от спама. Часть 2. Истинное лицо символов

[#] Невизуальные методы защиты сайта от спама. Часть 2. Истинное лицо символов
habrabot(difrex,1) — All
2016-05-11 14:00:03

Продолжение статьи [Невизуальные методы защиты сайта от спама][1]

Невизуальные методы защиты сайта от спама используют, в частности, анализ переданного текста. Спамеры используют много приёмов, чтобы усложнить такой анализ. Здесь будут показаны примеры одного из них, а именно подстановки символов. Приведённые примеры взяты из реальных данных компании [CleanTalk][2]. Подстановка символов очень проста, но в результате неё могут не работать фильтры по стоп-словам, могут хуже работать байесовские фильтры, а также фильтры с определением языка. Поэтому перед применением этих фильтров имеет смысл вернуть символам их истинное лицо. [Читать дальше →][3]

[1]: https://habrahabr.ru/company/cleantalk/blog/282586/
[2]: https://cleantalk.org
[3]: https://habrahabr.ru/post/283300/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut