Есть ли что-нибудь еще, похожее (по духу) OpenCV, но для обработки звука и получения от него некоторого интеллекта? Возможности могут варьироваться от: -
- Мультиплатформенный аудиозахват и воспроизведение звука
- DSP - Аудио фильтры
- Обнаружение тона
- Анализ свойств Tonal
- Синтез тона (различные стандартные формы сигнала)
- Признание, полученное с помощью некоторого узнаваемого корпуса и модели (например, определение музыкальных инструментов, ритмов, человеческой речи и т.д.) - потенциально может использовать другие проекты с открытым исходным кодом для фактической части распознавания (sphinx).
- Синтез речи/музыки - может снова использоваться и другие проекты с открытым исходным кодом (фестиваль).
Хорошо, если библиотека работает на raw audio s.t. преобразование формата/кодирования - это внешние проблемы, которые обрабатываются другими существующими библиотеками (s.a. из ffmpeg).
Я не эксперт в этой области, но мне нужно использовать такой API и задаваться вопросом, существуют ли такие библиотеки, поэтому мой выбор терминов для определения возможностей, вероятно, не самый лучший, поэтому эксперты могут захотеть отредактировать этот вопрос.