У меня есть веб-приложение на PHP, и я ищу реализацию высокоточного распознавания речи с открытым исходным кодом, которая будет принимать голосовые команды для открытия веб-страниц от пользователей. Примеры: «Сделать продажиmsgstr «(откроется страница создания продаж PHP)»Сделать заказ на покупку«,»Открытые отчеты в конце дня«, так далее.
Мой вопрос :
Я хочу знать, можем ли мы использовать Mozilla DeepSpeech взять аудио .wav с Fire Fox браузер и вернуть речь в текст. Если да, каков будет процесс записи голоса из Firefox с помощью микрофона, чтобы преобразовать текст с помощью движка DeepSpeech?
Как сделать пробуждение / запуск вызова похожим на OK-GOOGLE что будет готов слушать команды?
Задача ещё не решена.
Других решений пока нет …