habra.14 / Введение в Apache Spark

[#] Введение в Apache Spark
habrabot(difrex,1) — All
2015-02-17 15:30:04

Привет, хабр! ![image][1] В прошлый раз мы рассмотрели замечательный инструмент [Vowpal Wabbit][2], который бывает полезен в случаях, когда приходится обучаться на выборках, не помещающихся в оперативную память. Напомним, что особенностью данного инструмента является то, что он позволяет строить в первую очередь линейные модели (которые, к слову, имеют хорошую обобщающую способность), а высокое качество алгоритмов достигается за счет отбора и генерации признаков, регуляризации и прочих дополнительных приемов. Сегодня рассмотрим инструмент, который более популярен и предназначен для обработки больших обьемов данных — **Apache Spark**. [Читать дальше →][3]

[1]: http://habrastorage.org/getpro/habr/post_images/550/b31/bd9/550b31bd91269dd77ce8b0041798d8f8.png
[2]: http://habrahabr.ru/post/248779/
[3]: http://habrahabr.ru/post/250811/#habracut