Методы обработки звука

Методы обработки звука

Современная музыкальная индустрия постоянно развивается и совершенствуется. С улучшением качества звукозаписывающей аппаратуры постоянно повышаются требования к качеству самого звука. Поэтому столь бурно сегодня развиваются и технологии обработки звука. Обработка звука является одной из важнейших операций в творчестве композиторов-электронщиков, да и просто создателей современной музыки. В данной статье рассматриваются далеко не все методы обработки, потому что некоторые из них довольно сложны и трудоемки. Однако основные, наиболее часто используемые, здесь приведены.

Монтаж

Один из наиболее древних методов работы со звуком состоит в вырезании из записи одних участков, вставке других, их замене, размножении и т.п. Называется также редактированием. Все современные аудио и видеозаписи в той или иной степени подвергаются монтажу.

Амплитудные преобразования

Выполняются при помощи различных действий над амплитудой сигнала, которые, в конечном счете, сводятся к умножению значений сэмплов на постоянный коэффициент (усиления/ослабления) или изменяющуюся во времени функцию-модулятор - амплитудная модуляция. Частным случаем амплитудной модуляции является формирование огибающей для придания стационарному звучанию развития во времени. Амплитудные преобразования выполняются последовательно, с отдельными сэмплами, поэтому они просты в реализации и не требуют большого объема вычислений.

Частотные(спектральные) преобразования

Выполняются над частотными составляющими звука. Если использовать спектральное разложение (форму представления звука, в которой по горизонтали отсчитываются частоты, а по вертикали - интенсивности составляющих этих частот), то многие частотные преобразования становятся похожими на амплитудные преобразования над спектром. Например, фильтрация - усиление или ослабление частот - сводится к наложению на спектр соответствующей амплитудной огибающей. Однако частотную модуляцию (frequency modulation - FM) таким образом представить нельзя, - она выглядит как смещение всего спектра или его отдельных участков во времени по определенному закону. Для реализации частотных преобразований обычно применяется спектральное разложение по методу Фурье, которое требует значительных вычислительных ресурсов. Однако имеется алгоритм быстрого преобразования Фурье (БПФ, FFT), который делается в целочисленной арифметике и позволяет, даже на персональных компьютерах (начиная с младших моделей 486-х), разворачивать в реальном времени спектр сигнала среднего качества. Для частотных преобразований, кроме этого, требуется обработка и последующая свертка спектра, поэтому фильтрация, в реальном времени, пока не реализуется на процессорах общего назначения. Вместо этого существует большое количество цифровых сигнальных процессоров (Digital Signal Processor - DSP), которые выполняют эти операции в реальном времени и по нескольким каналам. Такие процессоры широко используются в современной профессиональной и полупрофессиональной студийной аппаратуре, а также в аудиоаппаратуре среднего и высшего класса (HI-FI). Эффект объема (surround) и электронные эквалайзеры (типа Disco, Pop, Rock) - все это работает на DSP.

Фазовые преобразования

Фазовые преобразования сводятся, в основном, к постоянному сдвигу фазы сигнала или ее модуляции некоторой функцией или другим сигналом. Благодаря тому, что слуховой аппарат человека использует фазу для определения направления на источник звука, фазовые преобразования стереозвука позволяют получить эффект вращающегося звука, хора и ему подобных.

Временные преобразования

Заключаются в добавлении к основному сигналу его копий, сдвинутых во времени на различные величины. При небольших сдвигах (порядка менее 20 мс) это дает эффект размножения источника звука (эффект хора), при больших - эффект эха.

Формантные преобразования

Формантные преобразования являются частным случаем частотных и оперируют с формантами (характерными полосами частот, встречающимися в звуках, произносимых человеком). Каждому звуку соответствует свое соотношение амплитуды и частот нескольких формант, которое определяет тембр и разборчивость голоса. Изменяя параметры формант, можно подчеркивать или затушевывать отдельные звуки, менять одну гласную на другую, сдвигать голоса и т.п.

При помощи различных комбинаций и описанных выше преобразований можно делать всевозможные звуковые эффекты. Далее рассматриваются наиболее распространенные из них.

Вибрато

Вибрато - это амплитудная или частотная модуляция сигнала с небольшой частотой (до 10 Гц). Амплитудное вибрато также носит название тремоло. На слух вибрато воспринимается как замирание или дрожание звука (термоло - дрожь), а частотное вибрато - как "завывание" или "плавание" звука (похоже на "плавание" звука в неисправном магнитофоне).

Динамическая фильтрация (wah-wah)

Реализуется изменением частоты среза или полосы пропускания фильтра с небольшой частотой. На слух воспринимается как вращение или заслонение/открывание источника звука (увеличение высокочастотных составляющих ассоциируется с источником, обращенным на слушателя, а их уменьшение - с отклонением от этого направления).

Фленжер (flange - кайма, гребень)

Название происходит от способа реализации этого эффекта в аналоговых устройствах - при помощи так называемых гребенчатых (saw, triangle) фильтров. Заключается в добавлении к исходному сигналу его копий, сдвинутых во времени на небольшие величины (до 20 мс) с возможной частотной модуляцией копий или величин их временных сдвигов и обратной связью (суммарный сигнал снова копируется, сдвигается и т.п.). На слух это ощущается как "дробление", "размазывание" звука, возникновение биений - разностных частот, характерных для игры в унисон или хорового пения, отчего фленжеры с определенными параметрами применяются для получения хорового эффекта (chorus). Меняя параметры фленжера, можно в значительной степени изменять первоначальный тембр звука.

Реверберация (reverberation - повторение, отражение)

Получается путем добавления к исходному сигналу затухающей серии его сдвинутых во времени копий. Это имитирует затухание звука в помещении, когда за счет многократных отражений от стен, потолка и прочих поверхностей звук приобретает полноту и гулкость, а после прекращения звучания источника затухает не сразу, а постепенно. При этом время между последовательными отзвуками (примерно до 50 мс) ассоциируется с величиной помещения, а их интенсивность - с его гулкостью. По сути, ревербератор представляет собой частный случай фленжера с увеличенной задержкой между отзвуками основного сигнала, однако особенности слухового восприятия качественно различают эти два вида обработки. Опытным путем были установлены параметры реверберации, которые позволяют моделировать звучание в различных помещениях (холл, собор, каньон, маленькая комната, большая комната, стадион).

Эхо (echo)

Эхо - реверберация с еще большим временем задержки (выше 50 мс). При этом слух перестает субъективно воспринимать отражения как призвуки основного сигнала и начинает воспринимать их как повторения. Эхо обычно реализуется так же, как и эхо реальное, - с затуханием повторяющихся копий.

Дисторшн(distortion - искажение)

Дисторшн - это намеренное искажение формы звука, что придает ему резкий, скрежещущий оттенок. Наиболее часто применяется в качестве гитарного эффекта (классическая гитара heavy metal). Получается переусилением исходного сигнала до появления ограничений в усилителе (среза верхушек импульсов) и даже его самовозбуждения. Благодаря этому исходный сигнал становится похож на прямоугольный, отчего в нем появляется большое количество новых частотных составляющих, резко расширяющих спектр. Этот эффект применяется в различных вариациях (fuzz, grunge, overdrive и т.п.), различающихся способом ограничения сигнала (обычный или сглаженный, весь спектр или полоса частот, весь амплитудный диапазон или его часть и т.п.), соотношением исходного и искаженного сигналов в выходном, частотными характеристиками усилителей (наличие/отсутствие фильтров на выходе).

Компрессия

Компрессия - сжатие динамического сигнала, когда слабые звуки усиливаются, а сильные слабеют. На слух воспринимается как уменьшение разницы между тихим и громким звучанием исходного сигнала. Используется для последующей обработки методами, чувствительными к изменению амплитуды сигнала. В звукозаписи используется для снижения относительного уровня шума и для предотвращения перегрузок. В качестве гитарной приставки позволяет значительно (на десятки секунд) продлить звучание струны без затухания громкости.

Фейзер (phase - фаза)

Фейзером называется смешивание исходного сигнала с его копиями, сдвинутыми по фазе. По сути дела - это фленжер, но с намного более простой аналоговой реализацией (цифровая реализация одинакова). Изменение фазовых сдвигов, суммируемых сигналов, приводит к подавлению отдельных гармоник или частотных областей, как в многополосном фильтре. На слух такой эффект напоминает качание головки в стереомагнитофоне - физические процессы в обоих случаях примерно одинаковы.

Вокодер (voice coder - кодировщик голоса)

Синтез речи на основе произвольного входного сигнала с богатым спектром. Речевой синтез реализуется при помощи формантных преобразований (выделение из сигнала с достаточным спектром нужного набора формант с нужными соотношениями придает сигналу свойства соответствующего гласного звука). Изначально вокодеры использовались для передачи кодированной речи. Однако нашли они применение и в музыке. Подавая на блок речевого синтеза звучание, например, электрогитары и произнося слова в микрофон блока анализа, можно получить эффект "разговаривающей" гитары; при подаче звучания с синтезатора получается голос робота (любимый прием KRAFTWERK), а подача сигнала, близкого по спектру к колебаниям голосовых связок, но отличающихся по частоте, меняет регистр голоса (мужской на женский или детский, и наоборот).

При подготовке материала использовалась информация из FidoNet.

Ник Худяков I.C.
(Минская ассоциация экспериментальной электронной музыки)
- титульная страница


Компьютерная газета. Статья была опубликована в номере 26 за 1998 год в рубрике мультимедиа :: разное

©1997-2024 Компьютерная газета