Моя большая (120 гб) музыкальная коллекция содержит много дубликатов песен, и я пытался отпечатать треки в надежде обнаружить дубликаты. А так как я майор, мне очень любопытно, что там сделано? Ничто из того, что я делаю, почти точно похоже на что-то вроде Shazam или Lala.com. Как они "хэш" отслеживают? Я выполнил стандартный MD5-хэш во всех моих файлах (26 000 файлов), и я нашел сотни одинаковых хэшей на разных дорожках, так что это не сработает.
Меня больше интересует Lala.com, поскольку они работают с полными файлами, в отличие от Shazam, но я предполагаю, что они используют подобный метод. Кто-нибудь может объяснить, как создавать уникальные идентификаторы для музыки?