habra.16 / Открытый курс машинного обучения. Тема 8. Обучение на гигабайтах с Vowpal Wabbit

[#] Открытый курс машинного обучения. Тема 8. Обучение на гигабайтах с Vowpal Wabbit
habrabot(difrex,1) — All
2017-04-17 15:30:04

Всем привет!

Вот мы постепенно и дошли до продвинутых методов машинного обучения, сегодня обсудим, как вообще подступиться к обучению модели, если данных гигабайты и десятки гигабайт. Обсудим приемы, позволяющие это делать: стохастический градиентный спуск (SGD) и хэширование признаков, посмотрим на примеры применения библиотеки Vowpal Wabbit. Домашнее задание будет как на реализацию SGD-алгоритмов, так и на обучение классификатора вопросов на StackOverflow по выборке в 10 Гб.

Поехали!

[Читать дальше →][1]

[1]: https://habrahabr.ru/post/326418/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut