[#] Kaggle Mercedes и кросс-валидация
habrabot(difrex,1) — All
2017-08-23 17:30:05


![image][1]



Всем привет, в этом посте я расскажу о том, как мне удалось занять 11 место в [конкурсе от компании Мерседес на kaggle][2], который можно охарактеризовать как лидера по количеству участников и по эпичности shake-up. Здесь можно ознакомиться с [моим решением][3], там же ссылка на github, здесь можно посмотреть [презентацию моего решения в Yandex][4].

В этом посте пойдет речь о том, как студент консерватории попал в data science, стал призером двух подряд kaggle-соревнований, и каким образом методы математической статистики помогают не переобучиться на публичный лидерборд

Начну я с того, что немного расскажу о задаче и о том, почему я взялся ее решать. Должен сказать, что в data science я человек новый. Лет 7 назад я закончил Физический Факультет СПбГУ и с тех пор занимался тем, что получал музыкальное образование. Идея немного размять мозг и вернуться к техническим задачам впервые посетила меня примерно два года назад, на тот момент я уже работал в оркестре Московской Филармонии и учился на 3 курсе в Консерватории. Начал я с того, что вооружившись книгой Страуструпа стал осваивать C++. Далее были конечно же разные онлайн курсы и примерно год назад я стал склоняться к мысли о том, что Data Science — это пожалуй именно то, чем я хотел бы заниматься в IT. Мое “образование” в Data Science — это [курс от Яндекса и Вышки на курсере][5], несколько курсов из [специализации МФТИ на курсере][6] и конечно же постоянное саморазвитие в соревнованиях.
[Читать дальше →][7]

[1]: https://habrastorage.org/web/bb9/601/13f/bb960113f9df43809a317ba7a1b1515d.jpg
[2]: https://www.kaggle.com/c/mercedes-benz-greener-manufacturing
[3]: https://www.kaggle.com/c/mercedes-benz-greener-manufacturing/discussion/36242
[4]: https://youtu.be/HT3QpRp2ewA
[5]: https://www.coursera.org/learn/vvedenie-mashinnoe-obuchenie
[6]: https://www.coursera.org/specializations/machine-learning-data-analysis
[7]: https://habrahabr.ru/post/336168/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut