Существует ли API для технологии распознавания речи Google? - программирование

Существует ли API для технологии распознавания речи Google?

Я хочу попробовать создать слайд-шоу jQuery, используя простые голосовые команды, такие как "следующий" или "предыдущий". Есть ли способ использовать распознавание голоса Google? Я знаю о Chrome x-webkit-speech, но я должен нажать кнопку, чтобы использовать его.

Я пробовал MIT WAMI, но я нашел его более медленным и менее точным, чем речевое познание Google.

4b9b3361

Ответ 2

Для простого способа сделать это с помощью JavaScript, проверьте annyang, который является библиотекой, которая упрощает работу с распознаванием речи.

Ответ 3

Проблема заключается в том, что захватит вашу речь пользователя и отправит на него какой-то речевой сервер для обработки. x-webkit-speech встроена в браузер, и браузер использует звуковую карту ПК для записи речи. Javascript/Jquery в браузере не может получить доступ к аппаратным устройствам. Я не знаю, показывает ли Chrome любые объекты x-webkit-speech в DOM, поэтому вы можете выполнять захват через Javascript.

Тем не менее, люди реверсировали речевую речь api и использовали ее из кода. См. http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ для примера.