Библиотека с открытым исходным кодом в речевой библиотеке
Кто-нибудь знает хорошую текстовую библиотеку. Он должен быть открытым исходным кодом и предоставлять C API?
PS: Я уже выполнил поиск, но мне нужны рекомендации от людей, которые действительно использовали эти API.
Ответ 1
вы можете пойти для Festival, который сработал у меня.
Ответ 2
Festival - это система с открытым исходным кодом для преобразования текста в речь.
Stanford использует его для своего класса обработки естественного языка, и у них есть современные инструкции по установке на этой домашней странице cs224s. Для установки в Mac OS X требуется несколько патчей, которые они завернули в удобный установить script.
Есть альтернативные голоса, которые вы можете использовать, которые звучат заметно лучше, чем обычные. Вы можете найти информацию об этих голосах в этом форуме:
Как настроить более реалистичные голоса в Фестивале. Эти инструкции предназначены для Ubuntu, но голоса работают с любой установкой фестиваля.
Ответ 3
Я использовал flite во встроенном сервере. Он имеет небольшую площадь и поставляется с одним голосом.
Ответ 4
eSpeak - еще одна облегченная TTS. Больше роботов, чем фестиваль.
Ответ 5
Эй, что насчет MARY?
Для меня это выглядит потрясающе, и мы должны продвигаться дальше на корпоративный компьютер с открытым исходным кодом или андроиды или что-то еще? Нам нужно усилить усилия, переложив все ресурсы с открытым исходным кодом на лучшее/наиболее перспективное, которое мы имеем до сих пор.
Кто-нибудь сталкивается с MARY TTS? Или у него есть недостаток (потому что никто не упомянул об этом раньше)?
Дополнительные ссылки: