В [первой части][1] этого описания попытки решения интересной конкурсной задачи я рассказал о подготовке данных для анализа и о нескольких экспериментах. Напомню, условие [задачи][2] заключалось в том, чтобы с наибольшей вероятностью определить наличие слова в словаре, не имея доступа к этому словарю в момент выполнения программы и с ограничением на объем программы (включая данные) в 64K.
![image][3]
Как и в прошлый раз, под катом много SQL, JS, а также нейронные сети и фильтр Блума.
[Читать дальше →][4]
[1]:
https://habrahabr.ru/company/megalenta/blog/302020/
[2]:
https://habrahabr.ru/company/hola/blog/282624/
[3]:
https://habrastorage.org/files/c4f/f96/10b/c4ff9610be6d4b0aa0d08f4939775b1a.jpg
[4]:
https://habrahabr.ru/post/302066/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut