Подтвердить что ты не робот

Самая быстрая библиотека распознавания речи С++

Я знаю его общий вопрос, но все же я хочу знать, какая самая быстрая библиотека распознавания речи в С++?

В настоящее время я использую Microsoft SAPI с kniect. Он отлично работает и распознает слова, но его скорость медленная, иногда требуется 1,2 секунды, чтобы распознать слово, и в моем случае это отставание вызывает много проблем взаимодействия для пользователя.

Я проверил образец, снабженный кинектом, в котором черепаха движется вправо вправо, согласно признанным словам, но даже немного медленным.

Итак, мне было интересно, есть ли какая-нибудь более быстрая библиотека, а затем sapi, которая может использоваться в таких случаях, как робот с использованием распознавания голоса, который вы говорите "слева", а затем "справа", но робот продолжает двигаться влево и поворачивается сразу после 1,2 секунды его немного расстраивает для пользователя.

4b9b3361

Ответ 1

Проблема заключается не в быстром, а в правильном способе использования API. Распознавание речи - это трудоемкий процесс, поэтому основной трюк заключается в том, чтобы начать распознавание аудио сразу после записи параллельно с записью. Затем, когда речь заходит о конце фразы, вы получите почти все результаты и можете немедленно отреагировать.

Время ответа 0,2 секунды может быть достигнуто таким образом, но для этого вам потребуется более гибкий API. Хорошим выбором является CMUSphinx, система распознавания речи с открытым исходным кодом, которую вы можете использовать для своей реализации