Компания Mozilla представила обновление наборов голосовых данных Common Voice, включающих примеры произношения около 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением объём речевого материала в коллекции увеличился на 30% - с 13.9 до 18.2 тысяч часов речи. Число поддерживаемых языков возросло с 67 до 87.
Ссылка:
https://www.opennet.ru/opennews/art.shtml?num=56608