Добавить новый язык в OpenEars - программирование
Подтвердить что ты не робот

Добавить новый язык в OpenEars

Недавно я начал изучать OpenEars распознавание речи, и это здорово! Но мне также нужно поддерживать распознавание речи и диктовку на других языках, таких как русский, французский и немецкий. Я обнаружил, что здесь доступны различные акустические и языковые модели.

Но я не могу понять - достаточно ли того, что мне нужно для интеграции дополнительной поддержки языка в приложении?

Вопрос: какие шаги следует предпринять, чтобы успешно интегрировать, например, русский, в Open Ears?

Насколько я понял - все акустические и языковые модели для английского языка в демонстрации Open Ears находятся в папке hub4wsj_sc_8k. Эти же файлы можно найти в архивах языков voxforge. Поэтому я просто заменил их на демо. Другое дело - на демо-английском языке также был большой файл sendump 2 МБ, который не находится в архивах языков voxforge. В демонстрации Open Ears используются два других файла:

  • OpenEars1.languagemodel
  • OpenEars1.dic

Я заменил:

  • msu_ru_nsh.lm.dmp
  • msu_ru_nsh.dic

как .dmp аналогичен .languagemodel. Но приложение сбой без каких-либо ошибок.

Что я делаю неправильно? Спасибо.

4b9b3361

Ответ 1

Из моих комментариев, отправленных в качестве ответа:

[....] Шаг 1 для таких вопросов, как включить OpenEarsLogging и verbosePocketsphinx, который даст вам очень тонкую информацию о том, что происходит не так (найдите выход консоли для слов error и предупреждения для сохранения время). Инструкции по этому поводу можно найти в документах. Не стесняйтесь задавать вопросы форумам OpenEars [....]: http://politepix.com/forums/openears Вы также можете проверить этот поток: http://politepix.com/forums/topic/other-languages

Решение:

Чтобы следить за более поздними читателями, после включения регистрации мы получили эту работу, используя файл mix_weights в качестве замены sendump и убедившись, что фонетический словарь использовал фонемы, которые присутствовали в акустической модели, а не на английском языке - языковые фонемы.

Полную дискуссию, в которой мы выполнили эту диагностику, можно прочитать здесь: http://www.politepix.com/forums/topic/using-russian-acoustic-model/


UPDATE: поскольку на этой неделе был выпущен OpenEars 1.5, можно передать путь к любой акустической модели в качестве аргумента для основного метода прослушивания, и существует гораздо более стандартизированный метод для упаковки и ссылки на любую акустическую модель, чтобы вы может иметь много акустических моделей в одном приложении. Информация в этом сообщении на форуме заменяет информацию в обсуждении, на которое я ссылался в этом ответе: http://www.politepix.com/forums/topic/creating-an-acoustic-model-bundle-for-openears-1-5-and-up/ Я оставил остальную часть ответа по историческим причинам и потому, что может подробности в этом обсуждении, которые по-прежнему полезны, но его можно пропустить в пользу новой ссылки.