Я начинаю записывать аудио с помощью своего Android-смартфона.
Я успешно сохранил записи голоса в файл PCM. Когда я разбираю данные и распечатываю подписанные 16-битные значения, я могу создать график, подобный приведенному ниже. Однако я не понимаю значения амплитуды вдоль оси y.
-
Что именно представляют собой единицы для значений амплитуды? Значения подписаны 16-битными, поэтому они должны варьироваться от -32K до + 32K. Но что представляют собой эти значения? Децибел?
-
Если я использую 8-битные значения, значения должны находиться в диапазоне от -128 до +128. Как это будет отображаться на громкость/ "громкость" 16-битных значений? Вы использовали бы только квантование квантования 16 к 1?
-
Почему существуют отрицательные значения? Я думаю, что полное молчание приведет к значениям 0.
Если кто-то может указать мне на сайт с информацией о том, что записывается, я был бы признателен. Я нашел веб-страницы в формате файла PCM, но не те значения данных.