Обработка звука для цифровой видеотеки
Если раньше было в моде собирать музыку на компьютере, а видео хранить на полках в стопках DVD и видеокассет, то сейчас на HDD чаще всего можно увидеть каталоги с любимыми фильмами, сериалами, записями телепрограмм (если есть ТВ-тюнер) и памятными съемками. На самом деле это удобно. DVD- диски являются недолговечными носителями, особенно если они активно используются, приводы DVD эксплуатируются в гораздо меньшей степени, да и вообще, появляется множество дополнительных удобств.
Так-то оно так, но очень часто комфорту мешают проблемы со звуком, а именно:
. Каждый фильм имеет разную громкость.
. Иногда само качество звука в том или ином фильме сомнительно, причем довольно часто можно встретить вариант дисбаланса, то есть музыка и спецэффекты звучат громко, а речь еле слышна. В результате приходится постоянно менять громкость, особенно, если у вас есть хорошая акустическая система, но при этом вы живете в многоквартирном доме. У нас строители часто не заботятся о звукоизоляции.
Вообще, проблем можно перечислить много. Начнем с основ.
Оцифровка аналогового видео, обработка звука
Сейчас практически любой ТВ-тюнер работает как конвертор аналогового видео в цифровой вид. Другими словами, внешне вы можете подключить любой источник, будь то VHS (S-VHS) магнитофон, обычную видеокамеру, после чего перегнать запись на винчестер.
Сердцем любого ТВ-тюнера является чип, который в принципе и отвечает за такое преобразование, и в его работе при конвертации не делается ничего особенного. Например, когда вы смотрите через такое устройство телеканалы, подключив обычную антенну, производятся схожие преобразования, то есть входной сигнал также является аналоговым. Главное — знать, как преобразовывать. Конечно, сейчас есть цифровые видеокамеры, и не так далеко в будущем вещание ТВ в массы также станет цифровым, но для этих вариантов в современных моделях тюнеров уже устанавливают цифровой вход.
Для начала давайте рассмотрим вариант, когда вы записали что-то на обычную камеру с аналоговым носителем. Что со звуком? У камеры есть достаточно стандартный микрофон, и возможно, даже встроенный алгоритм компрессии аудио и система шумоподавления.
Тут стоит специально сделать поправку для видеоспециалистов. Под компрессией в данном случае понимается не сжатие объема данных, а сужение разницы между самым тихим и самым громким звуками. В результате все слушается более равномерно.
Звук на камеру записывается с неким уровнем, причем если в камере предусмотрена настройка уровня записи, то ее нужно произвести по двум ключевым правилам:
. Уровень не должен быть слишком маленьким, потому как в «тихой» области находятся шумы, в том числе и самого устройства. В результате полезный сигнал смешается с ними в невыгодной пропорции.
. Уровень не должен быть «пикующим». Визуально это описать проще — индикаторы не должны шкалить в красной области. Объяснить — также. Обрезание пиковых значений дает искажения.
Когда вы подключите видеокамеру к ТВ-тюнеру и начнете перегонять, то есть оцифровывать ваше видео, то большинство программ также предложит вам установить уровень записи звука. Его нужно выстроить идентичным образом.
При этом есть множество тонкостей, которые находятся в прямой зависимости от возможностей программного обеспечения, которым вы пользуетесь. Во- первых, вам предлагается выбрать варианты среди множества настроек, в число которых входят: формат записываемого файла (avi, mpeg и т.п.), стандарт видео (NTSC, PAL, в локализованных вариантах SECAM), разрешение экрана, звуковые характеристики (частота дискретизации, количество каналов), и дальше идут дополнительные настройки, которые в зависимости от ПО разнятся. То есть здесь вы можете найти установку уровня звука (если этого нет, то регулировать вам придется с помощью основной звуковой панели/микшера Windows), могут предлагаться те же компрессоры, шумодавы и даже AGC. AGC — аббревиатура от Auto Gain Control. Такие устройства нередко используются на радио и позволяют регулировать уровень громкости «на лету». То есть если одна песня громче, а другая тише, то с помощью AGC они выравниваются именно по уровню. Не стоит забывать, что наше ощущение громкости напрямую не связано с уровнем сигнала, а имеет прямую взаимосвязь с энергией звуковой волны. Энергетическая составляющая измеряется с помощью параметра RMS (Root Mean Square) — среднеквадратического значения уровней всех элементов, присутствующих в сигнале. Это если простыми словами. То есть при одном и том же максимальном пиковом значении (например, ударили по барабану), все остальные звуки могут слушаться значительно тише по сравнению с оным или громче, если их уровень больше. Хотя максимальный пик в обоих случаях один — удар по барабану.
В принципе, не рекомендуется использовать AGC, и в данном случае лучше особо не усердствовать с предварительной обработкой. Выгоднее исправлять звуковой трек, когда он уже записан. Поэтому при оцифровке вашей основной задачей является просто выставление правильного уровня записи, согласно двум приведенным правилам.
Как вы уже поняли, аудиотрек мы будем обрабатывать отдельно. То есть, во-первых, нам нужна программа, которая будет отделять аудио от видео, во- вторых, она должна иметь арсенал обработки для звука. К сожалению, далеко не все видеопакеты обладают оным, тем более ПО для ТВ-тюнеров. Поэтому рекомендуется использовать что-то более профессиональное, и как самую легкую в освоении порекомендуем программу Sony Vegas. Кстати, оцифровку для получения наиболее качественного результата лучше производить не в сжатые форматы видео, а в avi.
Чем нам выгоден Vegas?
. Программа очень проста и легка в освоении.
. Она «выросла» из сферы профессионального звукового ПО, поэтому имеет все необходимые технологии.
. В рамках интерфейса вы работаете с вариантом «все-в-одном». Например, многие решения предлагают обрабатывать звук и видео в двух разных программах, а потом совмещать. Здесь этого не нужно, и даже есть много хороших модулей для обработки видео.
. Программа поддерживает работу с очень длинными звуковыми файлами.
. Конвертация в сжатые форматы видео здесь тоже есть.
Итак, теперь опишем, что же нам понадобится для обработки звуковой дорожки, которую мы получили, оцифровав видео с камеры. Опишем все этапы обработки:
1. Нормализация (normalize). То есть волна масштабируется таким образом, чтобы максимальный пик соответствовал максимально возможному значению.
2. Удаление гула (de-hum). В ряде случаев может присутствовать гул какого-либо устройства. Под этим понятием подразумевается постоянное присутствие звука на какой-либо частоте. Например, многие устройства гудят на 50 герцах. С видеокамерой вы, может, такого и не встретите, а вот с видеомагнитофоном - наверняка.
3. Удаление шума (de-noize). Шумы есть всегда. При правильном выставлении уровней записи мы оптимизировали соотношение полезный сигнал/шум. Теперь нам нужно избавиться от шумов. Методики, вернее, алгоритмы предусмотрены разные. Самый простой и топорный из них — удаление всех звуков с уровнем ниже некоего порогового значения. Все, что остается в результате, мы теперь будем считать полезным сигналом.
4. Компрессия. Подключаем компрессор и минимизируем разницу между самыми громкими и тихими звуками. В результате все начнет восприниматься на слух достаточно ровно.
5. Эквализация. Теперь самое время подкорректировать частоты, для чего используем эквалайзер.
6. Финализация. Для получения ровной и громкой «картинки» воспользуемся гейтом либо максимайзером.
Как видите, все довольно просто. Причем все это можно собрать только единожды как цепочку из подключенных модулей, а потом применять ее для других файлов.
Если же вы переносите полюбившийся фильм с видеокассеты на винчестер, то обработка звука примерно такая же. Но можно не акцентировать большое внимание на 4-м пункте. Почему? Дело в том, что звуковые дорожки к фильмам уже проходили финальную обработку, а частое использование устройств сжатия динамического диапазона может привести к искажениям. Поэтому в этом вопросе лучше быть аккуратными. В любом случае, нужно слушать.
Цифровое видео. Все фильмы — под одну гребенку
В принципе, схожие проблемы были и раньше, например, когда делались сборники на CD, в которых помещались фонограммы различного происхождения и громкости.
Для этого вам также нужно использовать программы типа Vegas, где вы сможете обрабатывать аудиотреки. Этапы обработки звуковой дорожки:
1. Нормализация.
2. Финализация.
Этап финализации позволит не только подровнять все фильмы под одну и ту же громкость, но и улучшить варианты, когда музыка звучит гораздо громче голосов, и так далее.
Рекомендации по ПО
Итак, в качестве головной программы мы выбрали Vegas. Модули нормализации там встроены (как и во всех других программах), называются Normalize.
De-hum и de-noize есть в стандартном комплекте поставки Vegas, если вы хотите что-то более интеллектуальное, то обратите внимание на плагины фирмы Waves.
Вариантов компрессоров достаточно много. Можно использовать и то, что дается с Vegas.
Эквалайзер лучше использовать какой-нибудь продвинутый в плане количества полос, например, Waves Q10.
Максимайзер… По существу, это многополосный гейт. Поэтому рекомендуются либо Waves Ultramaximizer/Multimaximizer, либо WaveArts MultiDynamics, либо «родной» Sony Wavehummer.
Кристофер christopher@tut.by
Так-то оно так, но очень часто комфорту мешают проблемы со звуком, а именно:
. Каждый фильм имеет разную громкость.
. Иногда само качество звука в том или ином фильме сомнительно, причем довольно часто можно встретить вариант дисбаланса, то есть музыка и спецэффекты звучат громко, а речь еле слышна. В результате приходится постоянно менять громкость, особенно, если у вас есть хорошая акустическая система, но при этом вы живете в многоквартирном доме. У нас строители часто не заботятся о звукоизоляции.
Вообще, проблем можно перечислить много. Начнем с основ.
Оцифровка аналогового видео, обработка звука
Сейчас практически любой ТВ-тюнер работает как конвертор аналогового видео в цифровой вид. Другими словами, внешне вы можете подключить любой источник, будь то VHS (S-VHS) магнитофон, обычную видеокамеру, после чего перегнать запись на винчестер.
Сердцем любого ТВ-тюнера является чип, который в принципе и отвечает за такое преобразование, и в его работе при конвертации не делается ничего особенного. Например, когда вы смотрите через такое устройство телеканалы, подключив обычную антенну, производятся схожие преобразования, то есть входной сигнал также является аналоговым. Главное — знать, как преобразовывать. Конечно, сейчас есть цифровые видеокамеры, и не так далеко в будущем вещание ТВ в массы также станет цифровым, но для этих вариантов в современных моделях тюнеров уже устанавливают цифровой вход.
Для начала давайте рассмотрим вариант, когда вы записали что-то на обычную камеру с аналоговым носителем. Что со звуком? У камеры есть достаточно стандартный микрофон, и возможно, даже встроенный алгоритм компрессии аудио и система шумоподавления.
Тут стоит специально сделать поправку для видеоспециалистов. Под компрессией в данном случае понимается не сжатие объема данных, а сужение разницы между самым тихим и самым громким звуками. В результате все слушается более равномерно.
Звук на камеру записывается с неким уровнем, причем если в камере предусмотрена настройка уровня записи, то ее нужно произвести по двум ключевым правилам:
. Уровень не должен быть слишком маленьким, потому как в «тихой» области находятся шумы, в том числе и самого устройства. В результате полезный сигнал смешается с ними в невыгодной пропорции.
. Уровень не должен быть «пикующим». Визуально это описать проще — индикаторы не должны шкалить в красной области. Объяснить — также. Обрезание пиковых значений дает искажения.
Когда вы подключите видеокамеру к ТВ-тюнеру и начнете перегонять, то есть оцифровывать ваше видео, то большинство программ также предложит вам установить уровень записи звука. Его нужно выстроить идентичным образом.
При этом есть множество тонкостей, которые находятся в прямой зависимости от возможностей программного обеспечения, которым вы пользуетесь. Во- первых, вам предлагается выбрать варианты среди множества настроек, в число которых входят: формат записываемого файла (avi, mpeg и т.п.), стандарт видео (NTSC, PAL, в локализованных вариантах SECAM), разрешение экрана, звуковые характеристики (частота дискретизации, количество каналов), и дальше идут дополнительные настройки, которые в зависимости от ПО разнятся. То есть здесь вы можете найти установку уровня звука (если этого нет, то регулировать вам придется с помощью основной звуковой панели/микшера Windows), могут предлагаться те же компрессоры, шумодавы и даже AGC. AGC — аббревиатура от Auto Gain Control. Такие устройства нередко используются на радио и позволяют регулировать уровень громкости «на лету». То есть если одна песня громче, а другая тише, то с помощью AGC они выравниваются именно по уровню. Не стоит забывать, что наше ощущение громкости напрямую не связано с уровнем сигнала, а имеет прямую взаимосвязь с энергией звуковой волны. Энергетическая составляющая измеряется с помощью параметра RMS (Root Mean Square) — среднеквадратического значения уровней всех элементов, присутствующих в сигнале. Это если простыми словами. То есть при одном и том же максимальном пиковом значении (например, ударили по барабану), все остальные звуки могут слушаться значительно тише по сравнению с оным или громче, если их уровень больше. Хотя максимальный пик в обоих случаях один — удар по барабану.
В принципе, не рекомендуется использовать AGC, и в данном случае лучше особо не усердствовать с предварительной обработкой. Выгоднее исправлять звуковой трек, когда он уже записан. Поэтому при оцифровке вашей основной задачей является просто выставление правильного уровня записи, согласно двум приведенным правилам.
Как вы уже поняли, аудиотрек мы будем обрабатывать отдельно. То есть, во-первых, нам нужна программа, которая будет отделять аудио от видео, во- вторых, она должна иметь арсенал обработки для звука. К сожалению, далеко не все видеопакеты обладают оным, тем более ПО для ТВ-тюнеров. Поэтому рекомендуется использовать что-то более профессиональное, и как самую легкую в освоении порекомендуем программу Sony Vegas. Кстати, оцифровку для получения наиболее качественного результата лучше производить не в сжатые форматы видео, а в avi.
Чем нам выгоден Vegas?
. Программа очень проста и легка в освоении.
. Она «выросла» из сферы профессионального звукового ПО, поэтому имеет все необходимые технологии.
. В рамках интерфейса вы работаете с вариантом «все-в-одном». Например, многие решения предлагают обрабатывать звук и видео в двух разных программах, а потом совмещать. Здесь этого не нужно, и даже есть много хороших модулей для обработки видео.
. Программа поддерживает работу с очень длинными звуковыми файлами.
. Конвертация в сжатые форматы видео здесь тоже есть.
Итак, теперь опишем, что же нам понадобится для обработки звуковой дорожки, которую мы получили, оцифровав видео с камеры. Опишем все этапы обработки:
1. Нормализация (normalize). То есть волна масштабируется таким образом, чтобы максимальный пик соответствовал максимально возможному значению.
2. Удаление гула (de-hum). В ряде случаев может присутствовать гул какого-либо устройства. Под этим понятием подразумевается постоянное присутствие звука на какой-либо частоте. Например, многие устройства гудят на 50 герцах. С видеокамерой вы, может, такого и не встретите, а вот с видеомагнитофоном - наверняка.
3. Удаление шума (de-noize). Шумы есть всегда. При правильном выставлении уровней записи мы оптимизировали соотношение полезный сигнал/шум. Теперь нам нужно избавиться от шумов. Методики, вернее, алгоритмы предусмотрены разные. Самый простой и топорный из них — удаление всех звуков с уровнем ниже некоего порогового значения. Все, что остается в результате, мы теперь будем считать полезным сигналом.
4. Компрессия. Подключаем компрессор и минимизируем разницу между самыми громкими и тихими звуками. В результате все начнет восприниматься на слух достаточно ровно.
5. Эквализация. Теперь самое время подкорректировать частоты, для чего используем эквалайзер.
6. Финализация. Для получения ровной и громкой «картинки» воспользуемся гейтом либо максимайзером.
Как видите, все довольно просто. Причем все это можно собрать только единожды как цепочку из подключенных модулей, а потом применять ее для других файлов.
Если же вы переносите полюбившийся фильм с видеокассеты на винчестер, то обработка звука примерно такая же. Но можно не акцентировать большое внимание на 4-м пункте. Почему? Дело в том, что звуковые дорожки к фильмам уже проходили финальную обработку, а частое использование устройств сжатия динамического диапазона может привести к искажениям. Поэтому в этом вопросе лучше быть аккуратными. В любом случае, нужно слушать.
Цифровое видео. Все фильмы — под одну гребенку
В принципе, схожие проблемы были и раньше, например, когда делались сборники на CD, в которых помещались фонограммы различного происхождения и громкости.
Для этого вам также нужно использовать программы типа Vegas, где вы сможете обрабатывать аудиотреки. Этапы обработки звуковой дорожки:
1. Нормализация.
2. Финализация.
Этап финализации позволит не только подровнять все фильмы под одну и ту же громкость, но и улучшить варианты, когда музыка звучит гораздо громче голосов, и так далее.
Рекомендации по ПО
Итак, в качестве головной программы мы выбрали Vegas. Модули нормализации там встроены (как и во всех других программах), называются Normalize.
De-hum и de-noize есть в стандартном комплекте поставки Vegas, если вы хотите что-то более интеллектуальное, то обратите внимание на плагины фирмы Waves.
Вариантов компрессоров достаточно много. Можно использовать и то, что дается с Vegas.
Эквалайзер лучше использовать какой-нибудь продвинутый в плане количества полос, например, Waves Q10.
Максимайзер… По существу, это многополосный гейт. Поэтому рекомендуются либо Waves Ultramaximizer/Multimaximizer, либо WaveArts MultiDynamics, либо «родной» Sony Wavehummer.
Кристофер christopher@tut.by
Компьютерная газета. Статья была опубликована в номере 29 за 2009 год в рубрике мультимедиа