Продолжение статьи [Невизуальные методы защиты сайта от спама][1]
Невизуальные методы защиты сайта от спама используют, в частности, анализ переданного текста. Спамеры используют много приёмов, чтобы усложнить такой анализ. Здесь будут показаны примеры одного из них, а именно подстановки символов. Приведённые примеры взяты из реальных данных компании [CleanTalk][2]. Подстановка символов очень проста, но в результате неё могут не работать фильтры по стоп-словам, могут хуже работать байесовские фильтры, а также фильтры с определением языка. Поэтому перед применением этих фильтров имеет смысл вернуть символам их истинное лицо. [Читать дальше →][3]
[1]:
https://habrahabr.ru/company/cleantalk/blog/282586/
[2]:
https://cleantalk.org
[3]:
https://habrahabr.ru/post/283300/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut