Подтвердить что ты не робот

Как работает музыкальная отпечатка пальца (для сайтов, таких как Shazam и Lala.com)?

Моя большая (120 гб) музыкальная коллекция содержит много дубликатов песен, и я пытался отпечатать треки в надежде обнаружить дубликаты. А так как я майор, мне очень любопытно, что там сделано? Ничто из того, что я делаю, почти точно похоже на что-то вроде Shazam или Lala.com. Как они "хэш" отслеживают? Я выполнил стандартный MD5-хэш во всех моих файлах (26 000 файлов), и я нашел сотни одинаковых хэшей на разных дорожках, так что это не сработает.

Меня больше интересует Lala.com, поскольку они работают с полными файлами, в отличие от Shazam, но я предполагаю, что они используют подобный метод. Кто-нибудь может объяснить, как создавать уникальные идентификаторы для музыки?

4b9b3361

Ответ 1

Основная статья по звукоизоляции - работа Хайцмы и Калкера в 2002-03 годах. Для каждого кадра аудио, он препроцессы (различия между временными и частотными диапазонами), а затем сохраняет двоичную версию спектра кадров.

Эта процедура добавляет надежность. Если весь сигнал сдвинут во времени, он все равно работает (по крайней мере, можно получить более низкую оценку ухудшения производительности). Он довольно устойчив к шуму окружающей среды. С момента своего создания было много работ по низкоуровневому музыкальному сходству, поэтому единого ответа нет.

У вас есть абсолютно одинаковые файлы, т.е. сигналы выравниваются по времени, глубина бит одинакова, частота выборки одинакова? Тогда я подумал бы, что хэш, как MD5, должен работать. Но если какой-либо из этих параметров будет изменен, то будут и хеши. В таком случае процедура, подобная предыдущей, будет работать лучше.

Взгляните на материалы ISMIR, доступные бесплатно онлайн. Забавные вещи. http://www.ismir.net/

Ответ 2

Существует множество алгоритмов акустической отпечатки пальцев. Некоторые из наиболее популярных:

Фактически libfooId - это open source, поэтому вы можете проверить его код в коде google!

Ответ 3

Посмотрите на страницу Acoustic Fingerprint в Википедии. Он содержит ссылки для некоторых статей, а также ссылки на реализации (включая открытый источник fdmf).

Ответ 5

После еще нескольких исследований (хотя это вообще не является окончательным!), я столкнулся через wiki на MusicBrainz.org, где подробно описаны некоторые из подходов, которые они используют:

http://musicbrainz.org/doc/Audio_Fingerprint

http://musicbrainz.org/doc/How_PUIDs_Work