Хочу поделиться опытом участия в конкурсе Kaggle и алгоритмами машинного обучения, с помощью которых добрался [до 18-го места из 1604 в конкурсе Avazu][1] по прогнозированию CTR (click-through rate) мобильной рекламы. В процессе работы попытался воссоздать оригинальный алгоритм Мактрикснета, тестировал несколько вариантов логистической регрессии и работал с характеристиками. Обо всём этом ниже, плюс прикладываю полный код, чтобы можно было посмотреть, как всё работает. Рассказ делю на следующие разделы: 1. Условия конкурса; 2. Создание новых характеристик; 3. Логистическая регрессия – прелести адаптивного градиента; 4. Матрикснет – воссоздание полного алгоритма; 5. Ускорение машинного обучения в Python. [Читать дальше →][2]
[1]:
https://www.kaggle.com/c/avazu-ctr-prediction/leaderboard/private
[2]:
http://habrahabr.ru/post/254151/#habracut