![][1]
_Облако слов для кликбейта_
**TL;DR:** Я добился точности распознавания кликбейта 99,2% на тестовых данных по особенностям заголовка и контента. Код доступен в [репозитории GitHub][2].
Когда-то в прошлом я написал [статью][3] о выявлении кликбейта. Та статья получила хорошие отклики, а также много критики. Некоторые сказали, что нужно учитывать содержимое сайта, другие просили больше примеров из разных источников, а некоторые предложили попробовать методы глубинного обучения.
В этой статье я постараюсь решить эти вопросы и вывести выявление кликбейта на новый уровень.
[Читать дальше →][4]
[1]:
https://habrastorage.org/getpro/habr/post_images/06f/e33/dbf/06fe33dbfece2b73856a992675adb1f9.png
[2]:
http://github.com/abhishekkrthakur/clickbaits_revisited
[3]:
http://www.linkedin.com/pulse/identifying-clickbaits-using-machine-learning-abhishek-thakur
[4]:
https://habrahabr.ru/post/324960/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut