Подтвердить что ты не робот

Распознавание звука с открытым исходным кодом (печать пальцем)

Есть ли какое-либо решение для отпечатков пальцев с открытым исходным кодом, которое предоставляет решение типа "Шазам"?

Shazam использует коммерческое решение от Landmark digital но я ищу альтернативу (даже если уступаю по точности и производительности) с открытым исходным кодом.

Кто-нибудь знает что-нибудь о такой реализации или даже опубликованном не реализованном алгоритме?

4b9b3361

Ответ 1

ок. различные ключевые слова для поиска, все результаты, которые я искал.

http://musicbrainz.org/doc/Audio_Fingerprint

Спасибо за просмотр любого

Ответ 2

  • echoprint выглядит как прочная альтернатива коммерческим библиотекам.

для распознавания речи:

мы только тестировали echoprint и пока настолько хороши.

Я знаю, что ответ немного запоздал, но по мере того, как эта страница появляется в Google, мы можем улучшить ее с течением времени:)

отредактирован, поскольку CMU ориентирован на речь

Ответ 3

Есть несколько проектов распознавания звука с открытым исходным кодом, хотя вы можете забыть о качестве/характеристиках коммерческих служб идентификации аудио, таких как Shazam, SoundHound и т.д. Это также зависит от того, какое распознавание вы хотите сделать (аудио файлы отпечатков пальцев/тегов, идентификации в реальном времени, распознавания OTA (Over-The-Air) и т.д.)

Open Surce

  • AcoustID/MusicBrainz Предоставляет инструменты для выполнения звуковой отпечатки пальцев и ассоциации метаданных (fingerprinter и server). Вы можете установить свой собственный сервер отпечатков пальцев/метаданных или использовать службу MusicBrainz. Хорошее решение для отпечатков пальцев и распознавания аудиофайлов, не подходит для приложений высокой производительности в режиме реального времени (т.е. OTA). Мы также протестировали его для мониторинга аудиопотока (трансляция мониторинга), но результаты были довольно плохими.

  • Echoprint Предоставляет те же инструменты, что и AcoustID (fingerprinter и server + metadata), а также может использоваться для контроля потока аудио, поскольку он может распознавать фрагменты взятый из любого места в аудио с хорошей точностью (но я бы не использовал его для серьезных коммерческих приложений). Они также утверждают, что он подходит для приложений OTA, но характеристики нигде не подходят для производственных целей.

  • Last.fm Не полностью открытый источник, хотя у них есть открытый источник отпечатков пальцев. Вы должны запросить их услуги поставщика услуг идентификации и метаданных, поскольку они не обеспечивают полноценное решение.

Ответ 4

Если вы ищете библиотеку JAVA, переходите на MusicG, я использовал ее в своем прошлом проекте и отлично работает. http://code.google.com/p/musicg/

Ответ 5

Если вы ищете решение в .NET, проверьте SoundFingerprinting.

Он открыт с открытым исходным кодом и построен поверх документа Fingerprinting Content Wavelets.

Алгоритм отличается от Shazaam's, но общая идея аналогична: извлекайте наиболее известные коэффициенты из спектра, а затем используйте их для создания отпечатков пальцев для последующего поиска.

Описание алгоритма можно найти здесь.