MP3 - очередной шаг в развитии аудио технологий

Средства мультимедиа, первоначально задуманные как не очень серьёзное дополнение компьютера, в настоящее время уверенно заняли место в ряду его желательных компонентов. Как самостоятельное направление средства мультимедиа развиваются весьма динамично, что находит своё отражение в появлении новых форматов хранения аудио и видеоинформации и в стремительном обновлении версий програм-много обеспечения для поддержки этих форматов. Заметным событием в истории их развития стало появление формата аудио файлов MP3.

Аббревиатура MP3 читается как MPEG Layer3. Первоначально стандарты MPEG разрабатывались под видеосистемы, для которых проблемы передачи значительных объёмов данных появились давно и стояли наиболее остро. Своё новое развитие они получили в аудио средствах. Сегодня MP3-технология имеет достаточно широкое распространение, серьёзно потеснив на рынке традиционные средства записи/воспроизведения на магнитных носителях и аудио компакт-дисках. Популярность формата определяют его свойства. Основное свойство MP3 это возможность записи звука с очень высокой степенью уплотнения оцифрованных данных при незначительных потерях в качестве воспроизведения.

Как и в случае с кодированием видео, традиционное звуковое кодирование является избыточным. Органы слуха имеют более низкую чувствительность на границах воспринимаемых частот, а в спектре частотных составляющих со значительным различием амплитуд хуже улавливают слабую составляющую. Алгоритм MP3 исключает из спектра слабые и высокочастотные составляющие, что позволяет сократить разрядность оцифровки с наименьшими потерями в качестве. Преобразованный таким образом сигнал записывается с использованием известных алгоритмов кодирования. Величина плотности оцифровки может иметь различные значения от 32 до 320 и имеет размерность kBit/c- объём данных, который необходим для кодирования одной секунды фонограммы. Стоит избегать определений вида "поток", поскольку некоторые разновидности кодирующих программ формата MP3 динамически изменяют параметры оцифровки (например, разрядность) в соответствии с характером фонограммы в текущий момент времени. Поток, имея такую же размерность, имеет несколько иной смысл.

Сравнительная оценка
С момента появления MP3 и до настоящего времени продолжается достаточно оживлённая полемика между его сторонниками и сторонниками традиционных форматов аудио записи. Избегая каких-либо выводов, ограничимся краткой характеристикой формата в контексте очередного частного мнения.

Качество записи формата MP3 зависит от величины плотности оцифровки. При плотности 128 kBit/c и более (например, 96 kBit/c), MP3 несколько уступает аналогичной записи на аудио компакт-диске. Эта разница практически неразличима, когда сравниваются музыкальные композиции, построенные на ритмичной основе, и вовсе исчезает, если тестируются любые эстрадные опусы с маркой "сделано в СНГ". При прослушивании классической музыки разница становится более заметной, однако в любом случае файлы MP3 звучат лучше, чем записи катушечных и тем более кассетных магнитофонов.

Для плотности оцифровки 256 kBit/c (тем более 320 kBit/c) разница практически отсутствует для любых фонограмм. Качественные показатели MP3-файла занимают промежуточное значение между магнитной и оптической записью, приближаясь к последней по мере уменьшения плотности оцифровки. При этом, однако, уменьшается степень сжатия. Так, при плотности оцифровки 128 kBit/c MP3 файл имеет объём в 10-12 раз меньший, чем файл формата WAV либо трек аудио диска, а для 256 kBit/c коэффициент сжатия по отношению WAV составляет величину примерно 1:7.

Противники MP3 апеллируют к качеству, как правило, забывая о возможных различиях в параметрах оцифровки. Граничное значение 256 kBit/c, для которого исчезают различия между MP3 и аудио диском, обещает по результатам тестирования Fraunhofer ISS (разработчик алгоритма MP3). Эти данные получены на высококачественной аппаратуре класса Hi End, далекой от массового потребителя, который в большинстве своём имеет более скромные аппаратные аудиосредства. Для аппаратуры среднего класса различия ещё менее заметны, поскольку искажения фонограммы маскируются искажениями и рабочим шумом оборудования. Для наиболее распространённых звуковых карт и аппаратуры класса Hi Fi закодированная звуковая запись не самое слабое место тракта воспроизведения.

Амплитудно-частотная характеристика большинства акустических систем, тем более из комплекта персонального компьютера, повторяет альпийский рельеф и имеет допуск по неравномерности на порядок превышающий допуск электронного тракта. Показательным является тот факт, что при отсутствии строгих стандартов практически все зарубежные производители аудио аппаратуры забывают указать, для какого коэффициента неравномерности заявлен диапазон частот акустических либо электронных систем.

АЧХ различных кодирующих программ для формата MP3 можно просмотреть на странице http://www.uka.ru/sound/encoders.htm. Графики отображают спектры белого шума, записанного в тестовый MP3 файл. Там же содержится краткая аннотация по этим программам.

Следует заметить, что сравнение по электрическим параметрам в их традиционном составе (АЧХ, коэффициент нелинейных искажений и т.д.) возможно в принципе, но мало о чём говорит реально. Сегодня не сложно получить приемлемо низкий уровень шума, искажений и широкую полосу рабочих частот, поэтому в ряду значимости эти параметры важны, но не самые определяющие. Более важны динамические параметры, описывающие реакцию системы на фронт тестового ступенчатого сигнала. Эти исследования используются при проектировании аудиосистем и разработке алгоритмов кодирования, но едва ли вы увидите их в составе сопроводительной документации ПО либо паспортных данных оборудования. Описание динамических параметров, равно как и тестов по ним, в публикациях не просматриваются.

Такая ситуация порождает весьма неубедительное мнение об отсутствие строгих критериев допустимого качества воспроизведения, заодно под сомнение ставится и психоакустическая модель, заложенная в основу алгоритмов MP3. Истина в том, что фактом своего существования и своей популярностью алгоритмы MP3 подтверждают адекватность этой модели. С другой стороны, мне представляется маловероятным, что какая-либо фирма начнёт публиковать подробные данные по проведённым исследованиям психоакустической модели, по построенным на основе этой модели количественным критериям качества звучания и способам реализации этих численных показателей в параметрах очередного алгоритма кодирования. Подробное описание таких работ можно ожидать только после появления более конкурентоспособных решений.

На сегодня самым распространённым критерием сравнения остаётся тестовое прослушивание. При этом меня, как пользователя, вполне устраивает ситуация интуитивного выбора формата записи на слух, причём для себя этот выбор уже сделал.

Наконец последней причиной "раскольничества" в рядах меломанов являются юридические вопросы, связанные с лицензированием записей в формате MP3. Однако они имеют место только в том случае, если речь идёт о распространении записей, а изготовление единичного экземпляра сборки из полюбившихся композиций для персонального прослушивания в противоречие с законом не входит.

Практическое использование

Можно предположить, что после приобретения звуковой карты вы пробовали записывать фонограммы с линейного входа либо через микрофон. Для этой цели может подойти программа "Фонограф" из поставки ОС Windows. Однако удовлетворение от успешно выполненной записи быстро сменяется разочарованием, как только вы обращаете внимание на размер WAV-файла. Запись обходится по цене около 10 Mb за 1 мин. Тем более запись с линейного входа обычно имеет не очень высокое качество. Преобразование аналогового сигнала в цифровую последовательность задача более сложная, чем обратное преобразование, и производители звуковых карт, как правило, на ней экономят.

Наилучший источник фонограмм для вашей коллекции это компакт-диски. Для преобразования формата аудио диска в формат MP3 вам понадобится программа копирования данных, которая перепишет аудио треки на жёсткий диск в формате WAV, и программа преобразования WAV-файлов в файлы MP3. Существует большой выбор программ для перезаписи треков (WinDac, CDGrab, CDWorx), последующего конвертирования (Plugger, Mp3 Compressor, Sound Limit, SoloH), либо совмещающих обе функции копирования и преобразования в составе одного пакета (Audiograbber). Опуская подробное описание каждой из них, опишем последовательность создания MP3 файлов на примере пары WinDac-SoloH.

WinDac версии 1.41 можно списать с ftp://ftp.chg.ru/.7/pc/windows/cdrom/wdac141.zip. Последняя версия 1.47 находится на сервере http://www.windac.de. Внешний вид программы после запуска представлен на рис.1. Окно программы содержит таблицу со списком треков компакт-диска. После замены диска в приводе список можно обновить командой "Eject/reload" из опции основного меню "Action". В таблице содержится информация о треках: времени воспроизведения, размер и т.д. Совместным нажатием клавиши Ctrl и левой кнопки мыши необходимо отметить копируемые треки. Отметка всех фонограмм может быть выполнена из меню "Action" командой "Select All" либо комбинацией "горячей" клавиши "Ctrl+A". После этого из меню "Action" необходимо выбрать команду "Copy track(s)" (аналог "F9"). При этом будет запущен процесс копирования. Ход процесса копирования отображается графическими индикаторами окна "Copyinc data" и занимает по времени примерно полминуты на 4 минуты фонограммы. По окончании копирования в выходном каталоге формируются файлы формата WAV. Следующий шаг - конвертирование этих файлов в формат MP3 программой SoloH.

Программу SoloH версии 0.07 можно списать с сервера ftp://freeware.ru/pub/mycomputer/multimedia/mpegEnc_v007a.zip. Вид программы после запуска представлен на рис.2. Элементами "Source" в левой части окна задаётся диск и каталог размещения входных файлов. Аналогичные элементы "Target" определяют место размещения выходных файлов. В центральной части окна располагаются элементы для определения параметров кодирования. На рисунке представлены рекомендуемые значения параметров: частота оцифровки 44100 Гц (можно увеличить до 48000 Гц), плотность оцифровки 256 kBit (наиболее популярное значение 128 kBit/c), уровень сжатия - LayerIII, режим канала - Stereo, источник - Drive (конвертирование с жёсткого диска).

Переписанные программой WinDac файлы отображаются в левой части окна. В представленном случае были скопированы треки с 5-го по 9-ый. Для запуска процесса конвертирования необходимо отметить требуемые файлы либо все и нажать кнопку "Encode". Конвертирование выполняется достаточно долго. Даже на компьютерах с хорошей производительностью может потребоваться больше часа на один файл (около 5 мин. воспроизведения). Однако, более быстродействующие программы, как правило, выполняют конвертирование с худшим качеством. Можно поэкспериментировать с различными парами записывающих и кодирующих программ, повторяя процедуру преобразования в MP3 в различных вариациях степени уплотнения, до тех пор, пока не определится компромисс между приемлемым для вас качеством и конечным размером файла.

Самостоятельная подготовка MP3 файлов не единственный способ их получения. В сети Internet можно найти достаточно много уже записанных коллекций, и их поиск занятие увлекательное, если не азартное. В любом случае, для прослушивания MP3 файлов вам понадобится программа "Проигрыватель". В ряду подобных программ (Nad, WinAmp, XTCWplay, Soritorg, Unreal Player и т.д.) заметно выделяется качеством воспроизведения Nad. Nad можно списать с сервера: http://www.uka.ru/sound/nad093.zip. Внешний вид программы представлен на рис.3. Программа имеет скромный интерфейс и не требовательна к ресурсам компьютера. Она содержит минимальный набор органов управления и эквалайзер. Всё, что от вас требуется, - подготовить список файлов и нажать кнопку "Воспроизведение". Для подготовки списка достаточно поместить маркер в окно программы и нажать правую кнопку мыши. В выведенном меню необходимо вызвать окно "Playlist Editor", в котором указывается состав и последовательность воспроизведения файлов.

Другой неплохой проигрывающей программой, и самой распространённой на сегодняшний день, является WinAmp (рис.4.). Последнюю версию WinAmp 2.09 можно списать с сервера http://maz-sound.com/archives/winamp209.exe. Как и большинство проигрывателей, WinAmp имеет интуитивно понятный интерфейс. Мнемоника элементов управления повторяет мнемонику органов управления бытовой аппаратуры. В целом, программа производит хорошее впечатление и содержит многочисленные дополнительные присоединяемые модули для изменения её вида и создания визуальных эффектов. Тут и разнообразные обои для окон программных компонентов и различные вариации на тему "Анализатор спектра", "Осциллограф" и причудливые цветомузыкальные окна. Апофеозом разыгравшейся фантазии разработчиков можно считать салютующую в такт мелодии анимацию. Многочисленные настройки проигрывателя скрыты под не очень заметными опциями режимного меню в окне WinAmp и обозначены начальными буквами: "O" - опции меню, "A" - переключатель, "I" - информация о файле, "D" - двойной размер, "V" - визуализация меню. Самостоятельное изучение этих настроек привнесёт элемент разнообразия в ваши будни.

Перспективы развития

Число аудио форматов составляет на сегодня не один десяток. Каждый из них имеет свою область применения и направления развития. Возвращаясь к теме о двух форматах (аудио компакт, MP3), можно сказать, что для аудио дисков время изысканий почти остановилось на этапе утверждения его стандарта и запуска в серийное производство CD-проигрывателей. Развитие, безусловно, продолжается, но экстенсивно, поскольку любые изменения формата записи требуют адекватных решений со стороны аппаратуры воспроизведения. Характер этого развития укладывается в достаточно очевидную схему: улучшение характеристик за счёт увеличения плотности записи, и/или увеличения разрядности АЦП-ЦАП (аналого-цифровые и цифро-аналоговые преобразователи), и/или увеличения быстродействия АЦП-ЦАП. Ситуация вызывает ассоциации с задачей про яму и землекопа: ...Что нужно сделать, чтобы выкопать более глубокую канаву? Взять большую лопату и копать ещё дольше, а для совсем большой канавы понадобится совсем большая лопата и т.д...

Идея MP3-формата предполагает иные, более гибкие и изящные решения. Этот формат не имеет привязки к аппаратной части, т.к. изначально разрабатывался для мультимедийных компьютерных систем и не является конечным результатом исследований. В недалёком будущем ожидается появление формата MPEG Layer4. Совсем недавно разработан новый формат VQF, который по утверждению авторов не уступает в качестве MP3, позволяя при этом получить ещё более высокую степень сжатия данных при оцифровке фонограммы. Проигрыватель файлов этого формата можно списать со страницы http://trackers.elkatel.ru/prog/vqf_play-er.htm. Возможно, спор на предмет, чей формат лучше, просто потеряет смысл после выхода некой очередной версии стандарта MP либо VQF.

Пока одни занимаются обсуждением вопросов нарушения авторских прав и степенью потери качества MP3 файлов по сравнению с аудио треками, другие, например фирмы Diamond Multimedia, MichaelLY, Siemens, уже приступили к серийному производству MP3-плееров. Можно предположить, что потенциальный покупатель не станет выбирать между практически вечной новинкой и кассетным плеером. Основная часть ресурса автономного источника питания кассетного плеера уходит на то, чтобы мотать ленту, которая сама по себе постоянно теряет свойства вследствие трения, внешних магнитных полей и климатических условий. Таким образом, устраняется один из существенных недостатков MP3 - его привязка к персональному компьютеру. Это первая проба, за которой, вероятно, появятся и более серьёзные разработки. Окончательную точку в приоритетах форматов записи и оборудования для их воспроизведения поставит время.

С.Андросенков


Компьютерная газета. Статья была опубликована в номере 08 за 1999 год в рубрике мультимедиа :: разное

©1997-2022 Компьютерная газета