Привет, хабр! ![image][1] В прошлый раз мы рассмотрели замечательный инструмент [Vowpal Wabbit][2], который бывает полезен в случаях, когда приходится обучаться на выборках, не помещающихся в оперативную память. Напомним, что особенностью данного инструмента является то, что он позволяет строить в первую очередь линейные модели (которые, к слову, имеют хорошую обобщающую способность), а высокое качество алгоритмов достигается за счет отбора и генерации признаков, регуляризации и прочих дополнительных приемов. Сегодня рассмотрим инструмент, который более популярен и предназначен для обработки больших обьемов данных — **Apache Spark**. [Читать дальше →][3]
[1]:
http://habrastorage.org/getpro/habr/post_images/550/b31/bd9/550b31bd91269dd77ce8b0041798d8f8.png
[2]:
http://habrahabr.ru/post/248779/
[3]:
http://habrahabr.ru/post/250811/#habracut