[#] Случайный лес vs нейросети: кто лучше справится с задачей распознавания пола в речи (ч.2)
habrabot(difrex,1) — All
2017-08-24 19:00:05


[Первая часть][1] нашего гайда была посвящена интересной задаче машинного обучения – распознаванию пола по голосу. Мы описали общий подход к большинству задач speech processing и с помощью случайного леса, обученного на статистиках акустических признаков, решили задачу с довольно большой точностью – 98,4% верно классифицированных аудиофрагментов.

Во второй части гайда мы посмотрим, справятся ли нейронные сети с этой задачей эффективнее случайного леса, а также попробуем учесть самый большой недостаток классических методов – неумение работать с последовательностями данных.

В каком-то смысле эта ступень избыточна: пол человека не меняется во время разговора (по крайней мере, на текущем этапе развития и в заданных стандартных условиях), поэтому рассчитывать на увеличение точности не стоит. Но в академических целях мы попробуем.

[![][2]][3] [Читать дальше →][4]

[1]: https://habrahabr.ru/company/neurodatalab/blog/334136/
[2]: https://habrastorage.org/web/ed4/a89/4d7/ed4a894d7c094bbf86e27c0425f1c779.jpg
[3]: https://habrahabr.ru/company/neurodatalab/blog/335804/
[4]: https://habrahabr.ru/post/335804/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut