Мне нужно автоматически расшифровать некоторые короткие MP3 файлы как часть доказательства концепции, над которой я работаю. В настоящее время я просматриваю облачные решения или службы веб-API для отправки MP3 в виде простого HTTP-запроса и получения транскрипции.
Единственное бесплатное решение с открытым исходным кодом, которое я нашел здесь, но демонстрации, похоже, не работают (по крайней мере, не на файлы, которые мне нужно расшифровать). Я нашел некоторые корпоративные решения для центров обработки вызовов, но до сих пор ничего не могу просто интегрировать в проект.
Существуют ли какие-либо службы распознавания речи на веб-сайте? Тот, который способен отфильтровывать небольшой шум, будет плюсом.