Определение наилучшего качества звука

Как вы можете определить наилучшее качество звука в списке аудиофайлов одного и того же аудиоклипа, , не глядя на заголовок звукового файла. Сложная часть состоит в том, что все файлы поступают из разных форматов и бит-скоростей, а все, что перекодировано в один формат и скорость передачи. Как это можно сделать эффективно?

Ответ 1

Многие из приведенных здесь ответов относятся к обычным измерениям звука, таким как THD + N, SNR и т.д. Однако они не всегда хорошо коррелируют с человеческим слухом звуковых артефактов. Способы сжатия с потерями обычно работают за счет увеличения THD + N и SNR, но направлены на то, чтобы сделать это способами, которые трудно обнаружить человеческому уху. Более традиционная методика измерения звука может обнаруживать снижение SNR в определенной полосе частот, но имеет ли значение, если в соседних полосах так много энергии, что никто не заметит разницы?

В исследовании, озаглавленном "" Измерение качества восприятия звука на основе психоакустического представления звука", описывается алгоритм количественной оценки способности человеческого уха для обнаружения слышимых различий, основанных на модели того, как слух слышит. Он принимает факторы, которые коррелируют с качеством звука, воспринимаемым людьми. В документе представлено исследование, сравнивающее результаты их алгоритмов с субъективным двойным слепым тестированием, чтобы дать вам представление о том, насколько хорошо работает их модель.

Я не мог найти бесплатную копию этой статьи, но приличная университетская библиотека должна иметь ее в файле.

Реализация алгоритма потребует некоторого знания обработки звукового сигнала в частотной области. Ученик с опытом DSP должен иметь возможность реализовать его. Если у вас нет эталонной формы сигнала, вы можете использовать информацию в этой статье, чтобы определить, насколько нежелательны артефакты.

Алгоритм будет работать на аудио PCM, предпочтительно с выравниванием по времени, и, конечно же, не требует знания типа или заголовка файла.

Ответ 2

Я не разработчик программного обеспечения (я аудиоинженер), и то, что вы слышите, когда вы сжимаете с помощью mp3-алгоритмов: - менее высокие частоты: поэтому вы можете проверить потерю энергии более высокого диапазона - искаженное стерео: вы можете сделать матрицу Mid/Side и проверить THD на стороне - менее фазовая когерентность: возможно, вы можете проверить это с помощью коррелятора

Надеюсь, это поможет, это сложная задача для компьютера!

Ответ 3

Во-первых, Я не инженер по звукозаписи, но я пытался поддерживать связь с аудио сжатием в целом, потому что у меня есть большая коллекция mp3, и у меня есть некоторые мысли поделиться субъект.

Лучшее качество звука, которое вы ищете с человеческой точки зрения? Если это так, вы не можете измерить "объективными средствами", например, сравнивать спектрограммы и т.д.

Если спектрограмма уродлива, она не обязательно означает, что качество ужасное. Важно то, что кто-то может отличить закодированный файл от исходного источника, делающего слепой тест. Период. Если вы хотите проверить качество кодированной звуковой дорожки, вы должны провести слепой тест ABX.

LAME (и все другие виды потерь MP3, AAC, AC3, DTS, ATRAC... компрессоры) так называемый перцептивный кодировщик. Он использует некоторые факты о характер восприятия звука человека. Таким образом, вы не можете просто полагаться на спектрограмм для оценки его качества.

Источник

Теперь, если ваши цели связаны с объективными манерами/перспективами, вы можете использовать EAQUAL, что означает оценку качества звука:

Это объективное измерение техника, используемая для измерения качества кодированных/декодированных аудиофайлов (очень аналогичный PEAQ)

(...)

Результаты, однако, при использовании объективные методы тестирования все еще неубедительны и в основном только используемых разработчиками кодеков и исследователи.

... или Инструмент статистического анализа Фридмана.

(...) выполняет несколько статистических анализ наборов данных, который особенно подходит для прослушивания данных.

Я не говорю, что анализаторы спектра бесполезны.. Поэтому я опубликовал некоторые утилиты. Я просто говорю, чтобы быть осторожным со всеми этими статистическими методами: как кто-то из сообщества Hydrogenaudio сказал раз, Вы не слушаете с вашими глазами. (проверьте эту тему, которую я опубликовал, это отличный ресурс). Чтобы действительно доказать качество звука с человеческой точки зрения, вы должны проверить уши, а не графики.

Это сложный вопрос, и IMHO я предлагаю вам искать специализированное аудио сообщество, например Hydrogenaudio.

Ответ 4

Если я правильно понял, у вас есть куча аудиофайлов, которые запускались в разных форматах с различным качеством. Все они были преобразованы в один формат, поэтому вы не можете использовать заголовок, чтобы выяснить, какие из них были изначально высокого качества, а какие - нет.

Это сложная проблема. Есть потенциально несколько трюков, которые могут уловить некоторые проблемы с качеством, но обнаружить, скажем, что-то, что было преобразовано из алгоритма сжатия с низким битрейтом, например MP3, было бы очень сложно.

Несколько простых трюков:

Проверьте максимальную амплитуду - если она низкая, качество не будет хорошим.
Измерьте самую высокую частоту - если она низкая, оригинал может иметь более низкую частоту дискретизации.

Ответ 5

Если у вас есть оригинал, вы можете оценить, как он был изменен путем оценки передаточной функции. Вам нужно будет взять некоторую модель, возможно, начать с фильтра нижних частот, добавить некоторую смазку (свертку), а затем запустить оценку, чтобы произвести меру качества. Вы можете посмотреть в статье wikipedia на Estimation_theory

Ответ 6

Я думаю, что ответ от ответа хорош, предполагая, что вы просто пытаетесь оценить набор параметров. К сожалению, вам также необходимо определить функцию сравнения для параметров, которые вы оценили.

Что произойдет, если в двух компрессиях применены фильтр полос пропускания с одинаково большими частотными диапазонами, но одна из них допускает более высокие частоты, чем другой. Один из них лучше? Какой?

Ответ, вероятно, зависит от того, какие частоты используются больше в файлах, с которыми вы работаете.

Объективная мера заключалась бы в том, чтобы увидеть, какой файл потерял меньше entropy. К сожалению, это непросто сделать правильно.

Ответ 7

Я не слишком уверен в этом, но здесь хорошее место для начала:

http://en.wikipedia.org/wiki/Signal-to-noise_ratio

Я не думаю, что вы можете рассчитать SNR из одного сигнала, но если у вас есть набор сигналов, тогда вы сможете определить SNR, сравнивая все из них.

В нижней части страницы есть интересные ссылки, которые также могут предоставить некоторые интересные маршруты, если это невозможно.

Кроме того, я не инженер по звуковому сопровождению, но я немного разбираюсь в обработке сигналов. Есть ли способ измерить уровни квантования в звуковых сигналах? Возможно, что-то заглянуть.

Ответ 8

Если у вас нет оригинального аудио, это, вероятно, большая работа; это почти наверняка принципиально невозможно в абсолютном смысле, так как вы не можете сказать, какие особенности трека являются преднамеренными и какие фиктивные. У вас могут даже быть кодировки из разных записей или смесей, и в этом случае простое сравнение в любом случае бессмысленно.

Таким образом, предполагая, что у вас нет оригинала, лучшее, что вы, вероятно, можете сделать, - это эвристический подход, который, вероятно, будет работать достаточно хорошо, но приложите немало усилий для реализации.

Инвестируйте в какое-то программное обеспечение и навыки обработки аудио; используйте это для создания программного обеспечения для выявления общих ошибок кодировщика, эвристически основанных исключительно на выходе. Такие дефекты могут быть плохой временной локалью звуковых ударов (внушающие перекрывающиеся окна при сжатии), высокая корреляция между левым и правым сигналами, ограниченным диапазоном частот и т.д. (Человек с правильным опытом, вероятно, может перечислить десятки).
Оцените качество звука для каждой эвристики на некоторой скользящей шкале.
Используйте здравый смысл и столько же времени + людей для тестирования, сколько нужно для взвешивания различных факторов. Например, хотя было бы неплохо воспроизводить частоту до 24 кГц, это не очень важно; с другой стороны, недостаток резкости может быть более раздражающим.

Если вам повезет, кто-то выполнил эту работу до вас, потому что это звучит как дорогостоящее предложение.

Ответ 9

Новая мера восприятия качества для Уменьшение битрейта http://citeseer.ist.psu.edu/cache/papers/cs/15888/http:zSzzSzwww-ft.ee.tu-berlin.dezSzPublikationenzSzpaperszSzAES1996Copenhagen.pdf/a-new-perceptual-quality.pdf

Перцептивные алгоритмы кодирования звука совершить резкую нерелевантность сокращения для достижения высокой коэффициент усиления кодирования. Компоненты сигнала, которые считаются необъяснимыми, являются не передается и кодирующий шум имеет спектральную форму в соответствии с порог маскирования аудиосигнала. Простые показатели качества (например, сигнал шум, гармонические искажения), которые не могут отделить эти неслышимые артефакты от слышимых ошибок, не могут для оценки эффективности таких кодеров.

Для оценки качества воспринимаемые аудиокодеки, соответствующие необходимы алгоритмы измерения, которые обнаруживают и оценивают слышимые артефактов путем сравнения результатов кодек с некодированной ссылкой. Модель восприятия на основе банка фильтров, который дает лучшее временное разрешение, чем на основе FFT подходов и, таким образом, позволяет точное моделирование пред- и после маскировки и уточненный анализ конверты в каждом фильтре канал.

См. также
http://academic.research.microsoft.com/Paper/201987.aspx?viewType=1