Я знаю, что это общая тема вопроса, но все же я хочу знать, какая библиотека для быстрого распознавания речи в C ++?
В настоящее время я использую Microsoft SAPI с kniect. Он отлично работает и распознает слова, но его скорость медленная, иногда требуется 1,2 секунды, чтобы распознать слово, и в моем случае это отставание вызывает много проблем взаимодействия для пользователя.
Я проверил образец, предоставленный kinect, в котором черепаха движется влево вправо в соответствии с распознанными словами, но даже это немного медленно.
Поэтому мне было интересно, есть ли более быстрая библиотека, чем sapi, которую можно использовать в случаях, когда робот использует распознавание голоса, вы говорите «влево», а затем «вправо», но робот продолжает двигаться влево и поворачивает вправо через 1,2 секунды, это немного разочарование для пользователя.
Проблема не в быстром, а в правильном способе использования API. Распознавание речи — это трудоемкий процесс, поэтому основная хитрость заключается в том, чтобы начать распознавание звука. как только это записано, параллельно с записью. Затем к моменту окончания фразы вы получите почти все результаты и сможете немедленно отреагировать.
Таким образом, можно достичь времени отклика 0,2 секунды, но для его реализации требуется более гибкий API. Хороший выбор CMUSphinx, платформа распознавания речи с открытым исходным кодом, которую вы можете использовать для своей реализации
Других решений пока нет …