Существует ли API для технологии распознавания речи Google?

Я хочу попробовать создать слайд-шоу jQuery, используя простые голосовые команды, такие как "следующий" или "предыдущий". Есть ли способ использовать распознавание голоса Google? Я знаю о Chrome x-webkit-speech, но я должен нажать кнопку, чтобы использовать его.

Я пробовал MIT WAMI, но я нашел его более медленным и менее точным, чем речевое познание Google.

Для простого способа сделать это с помощью JavaScript, проверьте annyang, который является библиотекой, которая упрощает работу с распознаванием речи.

12
ответ дан 03 янв. '14 в 2:55
источник

Проблема заключается в том, что захватит вашу речь пользователя и отправит на него какой-то речевой сервер для обработки. x-webkit-speech встроена в браузер, и браузер использует звуковую карту ПК для записи речи. Javascript/Jquery в браузере не может получить доступ к аппаратным устройствам. Я не знаю, показывает ли Chrome любые объекты x-webkit-speech в DOM, поэтому вы можете выполнять захват через Javascript.

Тем не менее, люди реверсировали речевую речь api и использовали ее из кода. См. http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ для примера.

2
ответ дан 12 янв. '12 в 19:30
источник