Hello, Habr! Недавно мы получили от “Известий” заказ на проведение исследования общественного мнения по поводу фильма «Звёздные войны: Пробуждение Силы», премьера которого состоялась 17 декабря. Для этого мы решили провести анализ тональности российского сегмента Twitter по нескольким релевантным хэштегам. Результата от нас ждали всего через 3 дня (и это в самом конце года!), поэтому нам нужен был очень быстрый способ. В интернете мы нашли несколько подобных онлайн-сервисов (среди которых [sentiment140][1] и [tweet\_viz][2]), но оказалось, что они не работают с русским языком и по каким-то причинам анализируют только маленький процент твитов. Нам помог бы сервис [AlchemyAPI][3], но ограничение в 1000 запросов в сутки нас также не устраивало. Тогда мы решили сделать свой анализатор тональности с блэк-джеком и всем остальным, создав простенькую рекурентную нейронную сеть с памятью. Результаты нашего исследования были использованы в [статье][4] “Известий”, опубликованной 3 января.
В этой статье я немного расскажу о такого рода сетях и познакомлю с парой классных инструментов для домашних экспериментов, которые позволят строить нейронные сети любой сложности в несколько строк кода даже школьникам. Добро пожаловать под кат. [Читать дальше →][5]
[1]:
http://www.sentiment140.com/
[2]:
https://www.csc.ncsu.edu/faculty/healey/tweet_viz/tweet_app/
[3]:
http://www.alchemyapi.com/developers/getting-started-guide/twitter-sentiment-analysis
[4]:
http://izvestia.ru/news/601050
[5]:
http://habrahabr.ru/post/274027/#habracut