Подтвердить что ты не робот

API речи Google

Теперь я работаю с моим проектом, и я собираюсь создать приложение, подобное Siri, для настольного компьютера. Я думаю, что если Google Speech API является надежным и точным для распознавания речи? Можете ли вы предложить мне, какой язык речи является наиболее точным с точки зрения распознавания речи? Наиболее предпочтительно свободный API. Спасибо.

4b9b3361

Ответ 1

В то время как API речи Google свободен, это не официальный публичный API. Некоторые люди имеют обратную инженерию, а обсуждаются в этом блоге. Если вы планируете напрямую обращаться к API напрямую для коммерческого продукта, я бы не рекомендовал его, потому что он может отказаться от него или изменить его без предупреждения, взломав ваш продукт. Это недавно произошло с разработчиками, которые использовали Google Weather API. С другой стороны, если вы пользуетесь браузером Chrome с помощью x-webkit-speech, вы, вероятно, безопасны, так как он поддерживается Google. Распознавание речи Google прямо там с множеством более популярных коммерческих решений. Они имеют большой опыт работы с ним в других проектах, таких как Google Voice и ныне несуществующий Google 411. У них есть некоторые из ведущих ученых-речей, работающих на них. Единственная свободная альтернатива, о которой я могу думать, - это Sphinx, который является проектом с открытым исходным кодом из Университета Карнеги-Меллона. Крутая кривая обучения с использованием этого решения, и если вы хотите, чтобы она была настроена как услуга, вам придется ее самостоятельно развивать. Nuance - другой крупный игрок на рынке распознавания речи (я считаю, что это то, что использует Сири), и у них есть решения, предлагающие речь признание как услуга. Но они дорогие.

Обновление ответа на комментарии по языковой поддержке

Windows Speech Recognition поддерживает другие языки, как и большинство систем распознавания речи. Но оговорка в том, что вы должны сказать системе, какой язык использовать, и она должна поддерживать соответствующий язык. У каждого поставщика есть список поддерживаемых им языков, и они специфичны для региона. Например, продавец может поддерживать испанский, испанский и испанский испанский испанский, испанский и испанский; которые имеют несколько разные диалекты. Но механизм распознавания речи может поддерживать только один язык/диалект по таймеру на пользователя. Пользователь не может говорить на нескольких языках в системе распознавания речи, не обратившись сначала к нему на этот язык.

Обновлено 3/7/2014

Поле ввода x-webkit-речи устарело из-за отсутствия поддержки в других браузерах. Это будет заменено на Web Speech API, который является javascript API. Вы можете найти пример использования здесь.