Кодирование звуковой информации
Звук – это звуковая волна, у которой непрерывно меняется амплитуда и частота. При этом амплитуда определяет громкость звука, а частота — его тон. Чем больше амплитуда звуковых колебаний, тем он громче.

Компьютер является мощнейшим устройством для обработки различных типов информации, в том числе и звуковой. Но аналоговый звук непригоден для обработки на компьютере, его необходимо преобразовать в цифровой. Для этого используются специальные устройства — аналого-цифровые преобразователи или АЦП. В компьютере роль АЦП выполняет звуковая карта. Каким же образом АЦП преобразует сигнал из аналогового в цифровой вид? Давайте разберемся.

Пусть у нас есть источник звука с частотой
440Гц, пусть это будет гитара. Сначала звук нужно превратить в электрический сигнал. Для этого используем микрофон. На выходе микрофона мы получим электрический сигнал с частотой 440Гц. (рис. 1, графическое изображение)

Следующая задача — преобразовать этот сигнал в цифровой вид, то есть в последовательность цифр. Для этого используется временная дискретизация — аналоговый звуковой сигнал разбивается на отдельные маленькие временные участки и для каждого такого участка устанавливается определенная величина интенсивности звука, которая зависит от амплитуды. Другими словами, через какие-то промежутки времени мы измеряем уровень аналогового сигнала. Количество таких измерений за одну секунду называется частотой дискретизации. Частота дискретизации измеряется в Герцах. Соответственно, если мы будет измерять наш сигнал 100 раз в секунду, то частота дискретизации будет равна 100Гц.

Вот примеры некоторых используемых частот дискретизации звука:

  • 8 000 Гц — телефон, достаточно для речи;
  • 11 025 Гц;
  • 16 000 Гц;
  • 22 050 Гц — радио;
  • 32 000 Гц;
  • 44 100 Гц — используется в Audio CD;
  • 48 000 Гц — DVD, DAT;
  • 96 000 Гц — DVD-Audio (MLP 5.1);
  • 192 000 Гц — DVD-Audio (MLP 2.0);
  • 2 822 400 Гц — SACD, процесс однобитной дельта-сигма модуляции, известный как DSD — Direct Stream Digital, совместно разработан компаниями Sony и Philips;
  • 5,644,800 Гц — DSD с удвоенной частотой дискретизации, однобитный Direct Stream Digital с частотой дискретизации вдвое больше, чем у SACD. Используется в некоторых профессиональных устройствах записи DSD.
Современные звуковые карты способны оцифровывать звук с частотой дискретизации 96Кгц и даже 192 кГц.
В итоге наш аналоговый сигнал превратится в цифровой, а график станет уже не гладким, а ступенчатым, дискретным. (рис. 2)

Глубина кодирования звука — это количество возможных уровней сигнала, или другими словами, точность измерения сигнала. Глубина кодирования измеряется в битах.
Например, если количество возможных уровней сигнала равно 255, то глубина кодирования такого звука 8 бит. 16-битный звук уже позволяет работать с 65536 уровнями сигнала. Современные звуковые карты обеспечивают глубину кодирования в 16 и даже 24 бита, а это возможность кодирования 65536 и 16777216 различных уровней громкости соответственно.

Зная глубину кодирования, можно легко узнать количество уровней сигнала цифрового звука. Для этого используем формулу:

N=2i, где N — количество уровней сигнала, а i — глубина кодирования.

Например, мы знаем, что глубина кодирования звука 16 бит. Значит количество уровней цифрового сигнала равно 216=65536.

Чтобы определить глубину кодирования если известно количество возможных уровней применяют эту же формулу. Например, если известно, что сигнал имеет 256 уровней сигнала, то глубина кодирования составит 8 бит, так как 28=256.
Как понятно из данного вышеприведенного рисунка, чем чаще мы будем измерять уровень сигнала, т.е. чем выше частота дискретизации и чем точнее мы будем его измерять, тем более график цифрового сигнала будет похож на аналоговый график, соответственно, тем выше качество цифрового звука мы получим. И тем больший объем будет иметь файл.

Кроме того, мы рассматривали монофонический (одноканальный) звук, если же звук стереофонический, то размер файла увеличивается в 2 раза, так как он содержит 2 канала.
Информационный объем звукового файла
Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Оценим информационный объём моноаудиофайла (V), это можно сделать, используя формулу:

V=N⋅f⋅i, где N — общая длительность звучания, выражаемая в секундах, f — частота дискретизации (Гц), k — глубина кодирования (бит).

Пример 1. Если длительность звучания равна 1 минуте и имеем среднее качество звука, при котором частота дискретизации 24 кГц, а глубина кодирования 16 бит, то:

V=60⋅24000⋅16 бит=23040000 бит=2880000 байт=2812,5 Кбайт=2,75 Мбайт.

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Пример 2. Оценим информационный объём цифрового стереозвукового файла, у которого длительность звучания равна 1 секунде при среднем качестве звука (16 битов, 24000 измерений в секунду). Для этого глубину кодирования умножим на количество измерений в 1 секунду и умножить на 2 (стереозвук):

V=60⋅24000⋅16⋅2 бит=46080000 бит=5760000 байт=5625Кбайт=5,49 Мбайт.
Информационный объем звукового файла
Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Оценим информационный объём моноаудиофайла (V), это можно сделать, используя формулу:

V=N⋅f⋅i, где N — общая длительность звучания, выражаемая в секундах, f — частота дискретизации (Гц), k — глубина кодирования (бит).

Пример 1. Если длительность звучания равна 1 минуте и имеем среднее качество звука, при котором частота дискретизации 24 кГц, а глубина кодирования 16 бит, то:

V=60⋅24000⋅16 бит=23040000 бит=2880000 байт=2812,5 Кбайт=2,75 Мбайт.

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Пример 2. Оценим информационный объём цифрового стереозвукового файла, у которого длительность звучания равна 1 секунде при среднем качестве звука (16 битов, 24000 измерений в секунду). Для этого глубину кодирования умножим на количество измерений в 1 секунду и умножить на 2 (стереозвук):

V=60⋅24000⋅16⋅2 бит=46080000 бит=5760000 байт=5625Кбайт=5,49 Мбайт.

Задача.

Какой объем будет иметь звуковой монофонический файл содержащий звук, если длительность звука 1 минута, глубина кодирования 8 бит, а частота дискретизации 22050Гц?

Дано:

f = 22050Гц

t = 1 мин. = 60 сек.

i = 8 бит = 1 байт.

V = ?

Решение:

V = f * t*i = 22050 * 60 * 1 = 1323000 байт = 1291,9921875 Кбайт = 1,26 Мбайт

Зная частоту дискретизации и длительность звука легко установить количество измерений уровня сигнала за все время. Если частота дискретизации 22050Гц — значит за 1 секунду происходит 22050 измерений, а за минуту таких измерений будет 22050*60=1 323 000.

На одно измерение требуется 1 байт памяти, следовательно, на 1 323 000 измерений потребуется 1 323 000 байт памяти. Разделив полученное число на 1024 получим объем файла в килобайтах — 1 291,9921875 Кбайт. А разделив полученное число еще раз на 1024 и округлив до сотых получим размер файла в мегабайтах — 1,26Мбайт.

Ответ: 1,26 Мбайт.

Задачи на кодирование звука
Задача 1.
Оцените информационный объём цифрового звукового стерео файла длительностью 20 секунд при глубине кодирования 16 бит и частоте дискретизации 10000 Гц? Результат представить в Кбайтах, округлить до сотых.

Задача 2.
Определить размер (в байтах) цифрового аудиофайла, время звучания которого составляет 10 секунд при частоте дискретизации 22,05 кГц и разрешении 8 бит.

Задача 3.
Объем свободной памяти на диске — 5,25 Мб, разрядность звуковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 22,05 кГц?

Задача 4.
Определить информационный объем стерео аудио файла длительностью звучания 1 секунда при высоком качестве звука(16 битов, 48 кГц).

Задача 5.
Определить объем памяти для хранения цифрового аудио­файла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 битов.

Задача 6.

Две минуты записи цифрового аудиофайла занимают на дис­ке 5,05 Мб. Частота дискретизации — 22 050 Гц. Какова раз­рядность аудиоадаптера?

Задача 7.
Объем свободной памяти на диске — 0,1 Гб, разрядность зву­ковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44 100 Гц?

This site was made on Tilda — a website builder that helps to create a website without any code
Create a website