kinect — самая быстрая библиотека распознавания речи переполнение стека

Я знаю, что это общая тема вопроса, но все же я хочу знать, какая библиотека для быстрого распознавания речи в C ++?

В настоящее время я использую Microsoft SAPI с kniect. Он отлично работает и распознает слова, но его скорость медленная, иногда требуется 1,2 секунды, чтобы распознать слово, и в моем случае это отставание вызывает много проблем взаимодействия для пользователя.

Я проверил образец, предоставленный kinect, в котором черепаха движется влево вправо в соответствии с распознанными словами, но даже это немного медленно.

Поэтому мне было интересно, есть ли более быстрая библиотека, чем sapi, которую можно использовать в случаях, когда робот использует распознавание голоса, вы говорите «влево», а затем «вправо», но робот продолжает двигаться влево и поворачивает вправо через 1,2 секунды, это немного разочарование для пользователя.

19

Решение

Проблема не в быстром, а в правильном способе использования API. Распознавание речи — это трудоемкий процесс, поэтому основная хитрость заключается в том, чтобы начать распознавание звука. как только это записано, параллельно с записью. Затем к моменту окончания фразы вы получите почти все результаты и сможете немедленно отреагировать.

Таким образом, можно достичь времени отклика 0,2 секунды, но для его реализации требуется более гибкий API. Хороший выбор CMUSphinx, платформа распознавания речи с открытым исходным кодом, которую вы можете использовать для своей реализации

9

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]