_Эта публикация написана по материалам выступления [Александра Сербула][1] на осенней конференции [BigData Conference][2]._ Большие данные — тема модная и востребованная. Но многих по-прежнему отпугивает избыток теоретических рассуждений и некоторый недостаток практических рекомендаций. В этом посте я хочу отчасти заполнить этот пробел и рассказать об использовании параллельных алгоритмов для обработки больших данных на примере кластеризации товарного каталога из 10 млн позиций. [Читать дальше →][3]
[1]:
http://bigdataconf.com.ua/2015/agenda/3125/
[2]:
http://bigdataconf.com.ua/
[3]:
http://habrahabr.ru/post/275455/#habracut