Подтвердить что ты не робот

Синхронизация текста и звука. Есть ли библиотека NLP/речи для текста?

Я хотел бы синхронизировать произносимую запись с известным текстом. Есть ли библиотека обработки речи/текста/естественного языка, которая бы облегчила это? Я предполагаю, что хочу определить границы слов и вычислить совпадения кандидатов из словаря. Большинство вопросов, которые я нашел на SO, касаются письменного языка.

Требуется, но не требуется:

  • Открытый исходный код
  • Совместимость с американским английским готовым
  • Кросс-платформенная
  • Тщательно документированный

Редактировать: Я понимаю, что это очень широкий, даже наивный вопрос, поэтому заранее заблаговременно для вашего руководства.

Что я нашел до сих пор:

  • OpenEars (обертка iOS Sphinx/Flite)
4b9b3361

Ответ 1

Принудительное выравнивание

Похоже, вы хотите сделать принудительное выравнивание между вашим аудио и известным текстом.

Практически все исследовательские/отраслевые системы распознавания речи смогут это сделать, поскольку принудительное выравнивание является важной частью обучения системы распознавания данных, которые не имеют phone выравнивание уровня между аудио и транскрипцией.

Выравнивание CMUSphinx

Sphinx4-1.0 beta 5 release системы распознавания речи с открытым исходным кодом CMU теперь включает в себя демонстрацию о том, как сделать выравнивание между расшифровкой и длинной речевые записи.