17 и 19 июня состоялись выпуски 1.9.0 и 1.9.1 высокопроизводительной системы автоматического распознавания речи [ whisper.cpp ](
https://github.com/ggml-org/whisper.cpp ) , реализующей модель [ Whisper ](
https://github.com/openai/whisper ) от OpenAI, и основанной на тензорной библиотеке машинного обучения [ GGML ](
https://github.com/ggml-org/ggml ) и двоичном формате [ GGUF ](
https://github.com/ggml-org/ggml/blob/master/docs/gguf.md ) .
Предоставляется библиотека libwhisper, демонстрационные примеры и консольные утилиты: whisper-bench, whisper-cli, whisper-command, whisper-lsp, whisper-quantize, whisper-server, whisper-stream, whisper-vad-speech-segments, parakeet-cli и parakeet-quantize.
Проекты написаны на языках C и C++ и распространяются по лицензии MIT.
Изменения:
• добавлена консольная утилита parakeet-cli, поддерживающая модель [ NVIDIA Parakeet ](
https://developer.nvidia.com/blog/pushing-the-boundaries-of-speech-recognition-with-nemo-parakeet-asr-models/ ) ;
• во враппер Ruby также добавлена поддержка NVIDIA Parakeet.
( [ читать дальше... ](
https://www.linux.org.ru/news/ai/18322379#cut ) )