habra.15 / Deephack: хакатон по глубокому обучению с подкреплением, или как мы улучшали алгоритм Google Deepmind

[#] Deephack: хакатон по глубокому обучению с подкреплением, или как мы улучшали алгоритм Google Deepmind
habrabot(difrex,1) — All
2015-08-18 13:30:02

С 19 по 25 июля проходил хакатон [Deephack][1], где участники улучшали алгоритм обучения с подкреплением на базе Google Deepmind. Цель хакатона — научиться лучше играть в классические игры Atari (Space Invaders, Breakout и др.). Мы хотим рассказать, почему это важно и как это было. Авторы статьи: Иван Лобов [IvanLobov][2], Константин Киселев [mrKonstantin][3], Георгий Овчинников [ovchinnikoff][4]. Фотографии мероприятия: Мария Молокова, Политехнический музей. Почему хакатон по обучению с подкреплением это круто:

* Это первый в России хакатон с использованием глубокого обучения и обучения с подкреплением;
* Алгоритм Google Deepmind — одно из последних достижений в области обучения с подкреплением;
* Если вас интересует искусственный интеллект, то эта тема — очень близка к этому понятию (хотя мы сами и не хотели бы называть это ИИ).

![][5] [Читать дальше →][6]

[1]: http://deephack.me/
[2]: http://habrahabr.ru/users/ivanlobov/
[3]: http://habrahabr.ru/users/mrkonstantin/
[4]: http://habrahabr.ru/users/ovchinnikoff/
[5]: https://habrastorage.org/files/65d/7a7/969/65d7a7969f204cedab1a6d54427fdc4b.png
[6]: http://habrahabr.ru/post/264871/#habracut