Компания Google опубликовала базу данных эталонных смешанных звуков, снабжённую анотациями, которую можно использовать в системах машинного обучения, применяемых для разделения произвольных смешанных звуков на отдельные компоненты. Также опубликована универсальная модель глубинного машинного обучения (TDCN++), которая может быть использована в Tensorflow для разделения звуков. Данные подготовлены на основе коллекции freesound.org и опубликованы под лицензией CC BY 4.0.
Ссылка:
https://www.opennet.ru/opennews/art.shtml?num=52722