Подтвердить что ты не робот

Как работает Shazam или Sound Hound?

Я разрабатываю приложение iOS с SDK для iOS 5.0 и XCode 4.2.

Я хочу разработать приложение, которое распознает звуки. Я вижу, что есть приложение под названием Sound Hound, которое распознает музыку и говорит художнику и название.

Как я могу сделать что-то подобное? Я хочу сравнить звук с существующей звуковой базой данных. Как я могу это сделать?

Возможно, я могу использовать Преобразование Фурье. Я не знаю, как обрабатывать звуки. Или это может быть похоже на распознавание речи, не так ли?

4b9b3361

Ответ 1

Я столкнулся с бумагой, которая объясняет, как работают алгоритмы поиска звука. Вот ссылка . Это было написано одним из разработчиков Shazam, конкурирующего приложения SoundHound.

Ответ 3

Приложение Shazam является одним из лучших примеров для приложений в связанных открытых данных, оно берет короткую музыку образца от конечного пользователя и идентифицирует песню из наборов данных, а также ссылку на покупку альбома.

Пользователь тегирует песню в течение 10 секунд, и приложение создает звуковой отпечаток, основанный на некоторых якорях упрощенной спектрограммы и целевой области между ними.

Для каждой точки целевой области они создают хеш-значение, которое представляет собой комбинацию частоты, на которой расположена опорная точка, частота, с которой расположена точка в целевой зоне, и разность во времени между точки в целевой зоне и когда точка привязки находится в песне.

После создания отпечатка пальца, Shazam начинает поиск совпадений в базе данных. Если есть совпадение, информация возвращается пользователю; в противном случае он возвращает диалог "Неизвестный песня".