Дизеринг аудио что это
Что такое дизеринг в аудио?
Думаю нет более занудной темы, чем дизеринг. И в связи с этим, это понятие многие понимают неправильно. Давайте ответим на самый просто вопрос, что такое дизеринг?
Дизеринг — это просто шум. Это шум, добавленный к сигналу, чтобы сделать квантование менее заметным. Дизеринг необходимо применять каждый раз, когда уменьшается битовая глубина. Если идет уменьшение с 32 бит до 24 бит — сила дизеринга почти не имеет значения. Если же идет уменьшение до 16 бит (или меньше), вероятно, лучше всего подойдет низкий или средний уровень дизеринга с некоторым формированием шума.
Дизеринг — это решение одной из фундаментальных проблем цифрового звука, поэтому, если мы хотим понять, что он делает, сначала нужно понять проблему. Проблематика заключается в разрешении по амплитуде или в том, насколько точно мы можем измерить уровень сигнала, используя единицы и нули.
Когда мы пытаемся измерить бесконечно изменяемый аналоговый источник (наш звук) с использованием конечного числа цифровых значений (этих единиц и нулей), неизбежно возникают ошибки. Иногда аналоговый уровень будет немного выше ближайшего цифрового значения, а в других случаях — ниже. Это похоже на попытку измерить чей-то рост с помощью рулетки, на которой показаны только ноги. В цифровом аудио эта ошибка округления известна как искажение квантования. Использование 32-битной системы с плавающей запятой — как это делают почти все современные аудиоредакторы — делает искажения настолько низкими, что вам действительно не нужно о них беспокоиться (к слову, заказывая сведение и мастеринг в нашей студии, вы получите материал в этом формате без потерь качества). Однако по мере того, как битовая глубина уменьшается, уровень этого искажения увеличивается. Когда вы приближаетесь к 16 битам, звук может начать получать довольно заметное и неприятное звучание на хвостах реверберации, дилеях и других тихих участках. Это связано с тем, что количество битов определяет, сколько дискретных значений вы можете сохранить.
Вот такая же синусоида, но уменьшенная до 20 бит, без дизеринга (в 24 бит разницу трудно оценить визуально).
И для сравнения синусоида пониженная до 16 бит, также без дизеринга
Что происходит со звуком?
Самые высокие пики были сложными для округления, поэтому они оставлены вытянутыми, в то время как остальные были округлены до нуля. В зависимости от того, где упал пик синусоидальной волны по отношению к времени выборки, один или два отсчета были округлены в большую сторону.
Так что же делает дизеринг в аудио и как он может помочь?
По своей сути дизеринг — это просто шум, а шум по самой своей природе является случайным. Еще на заре цифрового звука некоторые умные инженеры поняли, что могут использовать случайный шумовой сигнал в своих интересах. Смешивая его с квантованным сигналом, они могли добавить достаточно вариаций, чтобы можно было сохранить исходный сигнал.
Ключевым моментом здесь является то, что шум дизеринга не должен быть полностью связан с квантованным сигналом, иногда называемым «декоррелированным». Когда это условие выполняется и уровень шума дизеринга правильный, любая заданная входная выборка может быть округлена в большую или меньшую сторону в зависимости от значения входящего сигнала. Это не только помогает сохранить сигнал, но и фактически устраняет искажения, связанные с его частотным содержанием.
Теперь давайте уменьшим ее до 16 бит (без дизеринга).
Здесь следует обратить внимание на три весьма примечательные вещи:
Следует подчеркнуть ключевую мысль: вы заменили тональное искажение шумом, который, в свою очередь, является собственной формой искажения. Тем не менее, последовательный, равномерно распределенный тихий шум — предпочтительнее гармонических искажений благодаря случайным вариациям.
Иногда можно слышать, что не нужно применять дизеринг, если вы используете тот или иной vst плагин, потому что он (шум) самовосстанавливается. Технически это может быть правдой, но только в некоторых конкретных случаях. Вы не поверите, но не все шумы одинаковы. Поэтому, если в программе не задана конкретная настройка дизеринга, вам следует его добавить, если планируете уменьшать битовую глубину. Разные звуковые рабочие станции работают по-разному, но большинство из них предлагают какой-либо метод фиксации сложной цепочки звуковых эффектов в файл. Если вы не изучали возможности сделать это в своей DAW программе, возможно, пришло время настроить ее. По возможности, лучше использовать 32- или 64-битные числа с плавающей запятой, но если вы вынуждены использовать 24-битные, проверьте, есть ли возможность включить дизеринг. Надеюсь, это поможет вам понять, почему дизеринг так важен для цифрового звука, как и почему он работает и когда его следует применять.
Сведение для чайников. Дизеринг.
Всем привет. Сегодня простыми и не очень словами о дизеринге.
Для начала, заглянем в Вики:
Дизеринг, дитеринг (англ. dither от среднеанглийского didderen — дрожать) — при обработке цифровых сигналов представляет собой подмешивание в первичный сигнал псевдослучайного шума со специально подобранным спектром. Применяется при обработке цифрового звука, видео и графической информации для уменьшения негативного эффекта от квантования.
Не очень понятно, да?
Тогда, разберем по порядку.
Начнем с того, как секве́нсер видит наш сигнал:
Абсолютно знакомая всем картинка.
Это называется «квантование сигнала» методом усечения. Именно так секвенсер оценивает наши звуки, нашу дорожку.
Дизеринг заключается в подмешивании к сигналу шума перед квантованием. Проще говоря, чтобы все «квадратики» были ровные, и секвенсер мог их правильно посчитать, без лишних искажений. Исправляет все нелинейные искажения.
Обычно используют дизеринг при переводе в другую разрядность.
Если представить это в виде фото\картины, то если мы захотим увеличить или уменьшить масштаб, что станет с качеством? Поплывет, правильно. Такое, как в оригинале не останется.
Дизеринг поможет аккуратно и бережно перенести полностью все элементы картины в другой масштаб.
Так это и работает с музыкой.
Один момент: если амплитуда дизеринга будет мала, то нелинейные искажения будут устранены не полностью, либо амплитуда ошибки квантования будет меняться вместе с сигналом.
Если амплитуда дизеринга будет велика, то шум станет заметным в записи.
P.P.S.: А да, в лимитерах обычно стоит кнопка дизеринга. Кидаю картинку)
Звукорежиссура
150 постов 1.3K подписчиков
Правила сообщества
— в сообществе запрещены оскорбления;
— посты, не соответствующие тематике сообщества, будут переноситься в ленту;
— в сообществе отключена премодерация, поэтому, добавляя посты, убедитесь, что они наполнены качественным контентом, а так же, не повторяют предыдущие посты;
я на фл 2.7 несколько песен свел и этот фишак еще тогда юзал
15 ПРАВИЛ ЗВУКОРЕЖИССЕРА
2) Убавление уродливых частот более эффективно, чем усиление приятных.
3) Каждый звук должен иметь назначение. Не выбирайте много семплов с целью набрать больше 50-ти звуков в треке, если вам действительно нужны лишь 25. Минималистичная работа позволяет избежать грязи в финальном миксе.
5) Обрабатывайте звуки по отдельности. Плагины помогут вашему звуку быть неповторимым в общем миксе.
7) Тренируйте ваши уши: если вы слушаете музыку, уделяйте внимание отдельным инструментам в отношении громкости, эквалайзинга, использования фильтров, и т.д. звучит поверхностно, но это не так: если вы постигните принцип музыкальной функциональности, вы получите абсолютное преимущество в продюсинге.
8) Если можете, работайте быстро. Чаще всего проще закончить проект, если вы работаете над ним в один или несколько подходов. Иначе, это может быть дорогостоящая победа, включающая множество потраченных часов и пошатнувшуюся мотивацию.
9) Пытайтесь закончить один звук, прежде чем приступить к другому, концентрируйтесь на одной теме и не прыгайте на другие, после переключения между темами вы больше не сможете обнаружить ошибки. Акцентрируйтесь на вашей идее
10) Эффективность дать некоторым проектам отдохнуть и переработать их впоследствии со свежими идеями, но делайте так, только если вас устраивает столь глубокая работа. Продвигайтесь детскими шажками, но заканчивайте их.
11) Не работайте на очень большой громкости. Ваши уши очень быстро устанут и не смогут «сказать» вам правду о ваших идеях. Работайте на постоянной громкости в течении сессии.
12) Не делайте детальную аранжировку или эквализацию под влиянием чего-либо
14) Помогает спектральный анализ. Люди несовершенны в работе ушами, но профессиональны в работе глазами. Вы можете увидеть то, что не можете услышать.
Микрофоны Октава МЛ-51 1986г
Приобрел пару микрофонов на авито. Переделаны под фантомное питание (по дефолту вставляется батарейка). Перед покупкой конечно проверил, да и цена была приятная, неплохое пополнение в мой микрофонный парк. Но! Вопрос к знатокам! Это нормально что они дают легкий шум, как на старых записях. Шум особо не бесит, даже немного приятен.
Трейлерные звуки
Звук — очень эффективный инструмент для создания эмоций. Не зря фильмы (и вообще видеоролики) называют АУДИО-визуальными произведения и говорят, что звук несёт 50% важности. Но говоря о Трейлерных звуках, процент важности и ответственности бесспорно выше.
Они обладают ярко выраженной эмоциональной нагрузкой и непростой комплексной структурой. Благодаря этому они стали такими популярными в трейлерной музыке, когда необходимо за короткий промежуток времени успеть окунуть зрителя в нужную атмосферу, ошеломить, заинтриговать, испугать и, конечно же, заинтересовать «что будет дальше?».
Если вы занимаетесь видео и желаете сделать свои произведение более яркими, то, конечно же, тоже можете использовать их сами, но есть нюансы. Попробуем разобраться.
Возможно вы замечали, что зачастую трейлерная музыка имеет схожие черты, особую узнаваемую структуру. С годами индустрия выкристаллизовала эффективные способы формирования эмоций у аудитории и поэтому сейчас нам зачастую приходится слышать в рекламе фильмов музыку, написанную по уже сформировавшимся и устоявшимся шаблонам. И более того — даже звуки, из которых состоит трейлерная музыка тоже имеют свои признаки.
Итак, для себя я делю их на следующие группы:
1. Различные удары: Hit, Boom, Impact, Slam
2. Звуки для движений и перемещений: Whoosh/swish
3. Грозные звуки Braaam и подобные им
4. Нарастающие звуки Riser/Uplifter и, наоборот, спадающие по интенсивности звуки Downer/Downlifter
5. Продолжительные фоновые звуки Atmosphere/Drone
Есть и другие звуки, составные и производные. А эти можно назвать «базовыми».
Конечно же, чтобы было понятнее, лучше эти звуки слышать.
Я сделал видеоролик про то, как отличить одни звуки от других, в каких случаях их применять в своих видеороликах, где вообще брать такие звуки и каким образом можно сделать такие звуки своими руками. Приятного просмотра!
Создание глубины в миксе
Опубликовано в журнале «Sound on Sound» в феврале 2009 года.
Перевод: Бережной Вячеслав
В реальной жизни мы слышим звук в трёх измерениях, и хотя в стереозаписи все источники, очевидно, размещены перед слушателем (в диапазоне слева – справа звуковой сцены), но существуют определённые методы, позволяющие получить ощущение того, что они находятся также и ближе – дальше (то есть, вглубь звуковой сцены). К примеру, близкие звуки имеют тенденцию быть громче, чем дальние – и это очень легко воссоздать в миксе. Но кроме этого, имеется много других факторов. Таким образом, используя их, Вы сможете добиться намного больших результатов, чем если будете полагаться только лишь на фейдеры, управляющие громкостью. В этой статье я расскажу о многих путях, которыми Вы можете управлять этим аспектом своего микса.
Эквализация для создания расстояния
Если Вы хотите поместить кое-что на задний план микса, это должно быть не только тише фронтальных звуков. В этой партии должно быть меньше и высоких частот, чтобы подражать тому способу, которым их поглощает воздух. Чтобы усилить иллюзию расстояния, Вы можете также срезать и низкие частоты (ниже 150 – 200Гц). Если рассматриваемый инструмент записывается через микрофон, то размещение его дальше от инструмента (на стадии записи) поможет ещё больше укрепить иллюзию.
Срез высоких и низких частот поможет заставить звуки казаться более отдалёнными.
Используйте правильную реверберацию
Обрабатывая ревербератором отдалённые звуки, выбирайте диффузный (рассеянный) тип реверберации – то есть, другими словами, без слишком большого количества деталей. Кроме того, уберите на ней некоторые высокие частоты (так же, как и на источнике). Отдалённые звуки обычно сталкиваются с большим количеством отражающих поверхностей, чем близкие, поэтому Вы можете позволить себе добавить к этим звукам больше реверберации. Тем не менее, не слишком переусердствуйте с этим эффектом, если у Вас нет художественной потребности в нём – современные записи имеют тенденцию быть очень сухими по сравнению с миксами, сделанными в 70 – 80-х годах. Как правило, чем более просторна и разрежена аранжировка, тем больше реверберации Вы можете использовать, не опасаясь затопить всё содержимое. Миксы с плотными аранжировками обычно извлекают выгоду или из меньшего количества реверберации, или из использования так называемой «окружающей» реверберации – то есть такого эффекта, где присутствуют только ранние отражения.
Комбинирование повторяющегося эха и реверберации является отличным способом создания расстояния, особенно если у Вас есть ленточный дилэй (или его виртуальная эмуляция). По сравнению со стандартными цифровыми задержками, их повторы менее стерильны и однородны. Однако, если в наличии только обычный цифровой дилэй,попытайтесь срезать частоты ниже 200Гц и выше 4кГц. Также стоит поэкспериментировать с аналоговой задержкой (или её эмуляцией), потому что она имеет довольно тусклые и неясные повторы.
Чтобы создать впечатление от расстояния, могут использоваться плагины-эмуляторы ленточного эха, такие, как Universal Audio RE201 Space Echo. Если у Вас нет доступа к такому процессору, Вы можете попытаться использовать цифровую задержку, при этом срезав частоты ниже 200Гц и выше 4кГц.
Такие эффекты, как хорус, имеют тенденцию отодвигать звуки назад, заставляя их казаться менее сфокусированными. Таким образом, вы можете использовать его (или подобный ему эффект) на клавишных подкладах, которые предназначены для того, чтобы сидеть позади микса. Вы также можете достичь подобного результата, используя двухканальный питч-шифтер, чтобы создать два дополнительных слоя – один, смещённый на 7 центов вверх, а другой – на такое же количество вниз. Roland Dimension D (или эквивалентный ему плагин) может создать подобное хорусу пространственное распространение, но не давая слишком очевидного ощущения своего присутствия. Если Вы должны использовать хорус на звуке, который должен находиться во фронте микса (как например гитара), то держите этот звук ярким и свободным от чрезмерной реверберации. Обычно это приводит к хорошим результатам.
Модуляционные эффекты, такие, как хорус Roland Dimension D (или его виртуальная версия от UAD), могут помочь расфокусировать звук, убирая его с фронта звуковой сцены и оставляя место для других звуков, которые требуется выдвинуть вперёд. В качестве альтернативы, Вы можете использовать питч-шифтер, немного расстроив каналы и панорамировав их в противоположные стороны.
Вся перспектива – в контрасте: если какие-то звуки убраны назад, и сделаны менее яркими и более реверберирующими, то они должны быть уравновешены более яркими и сухими звуками, находящимися впереди микса. Не делайте ошибку, пытаясь полностью сохранить исходные звуковые качества каждого инструмента. В итоге Вы можете обнаружить, что задник звуковой сцены пуст, а фронт – переполнен (или наоборот).
Ведущий вокал будет казаться очень близким к слушателю, если на нём будет мало (или вообще не будет) реверберации. Вы можете создать очень драматичные эффекты, если сделаете некоторые вокальные элементы абсолютно сухими и добавите «воздуха», подняв частоты между 7 и 10кГц. Вероятно, такую вещь не стоит использовать для всего вокала, звучащего на протяжении всей песни, но для некоторых особенных фраз, которые должны звучать прямо в лицо слушателю, это может быть очень эффективно. Компрессор может усилить дыхание в таких близких вокальных партиях, заставляя их приблизиться ещё больше.
Задержка для глубины
Примите во внимание, что использование задержек вместо реверберации добавляет вокалам больше свободного места. Альтернативно, Вы можете скомбинировать задержку с небольшим количеством реверберации, или использовать реверберацию с большой пред-задержкой (в районе 90 – 110 мс). Как Вы уже знаете, близкие звуки обычно более яркие, чем отдалённые. Поэтому, обрабатывая ведущий вокал, Вы часто сможете позволить себе использовать более яркую реверберацию с яркими ранними отражениями. Зачастую, полезно настраивать два ревербератора: один с искусственным звуком, типа пластины, другой – с ранними отражениями или образцом окружения. Этим путём Вы сможете сбалансировать характер ранних отражений с более очевидным характером листовой реверберации. Также, задержка может быть замечательной для того, чтобы создать звук гитарного соло на большом рок-стадионе, но при этом не отдалить его от слушателя.
Распланируйте свою аранжировку так, чтобы выбранные Вами звуки не входили в противоречие с концепцией микса. Например, яркие подклады гораздо труднее поместить на задний план звуковой сцены, чем более тусклые. Точно так же, если подпевки будут более яркими, чем ведущие вокалы, то они вряд ли усядутся позади его. Есть, конечно, и исключения, где бэки нарочно выдвинуты вперёд (как например в «Video Killed the Radio Star»), но, как правило, ведущий вокал должен быть всегда на первом месте. Чтобы было легче поместить подпевки назад, добавьте к ним большое количество реверберации или сделайте к каждой из партий несколько дабл-треков (по сути дела – это естественный хорус).
Если Вы используете барабанные сэмплы, попытайтесь не очень сильно обрабатывать их эквалайзером – даже если перед Вами стоит искушение сделать их ещё более яркими и большими. Если музыкальный жанр не требует, чтобы барабаны сидели впереди микса, то выбрав для них более естественный звук, Вы облегчите задачу построения правильной перспективы.
Освобождая место для вокалов, Вы можете использовать не только автоматизацию громкости, «наклоняя» такие вещи, как гитары и подклады, но и автоматизацию эквалайзеров, аккуратно срезая в нужных местах высокие частоты. Обычно применяется low pass фильтр с крутизной 12 или 18dB/октава. Он должен сделать аккомпанирующие партии менее яркими в тех местах, где они играют вместе с вокалами. Вы можете использовать эту технику как самостоятельно, так и в комбинации с автоматизацией громкости. Но не слишком переусердствуйте с уменьшением высоких частот, иначе это станет заметным для слушателя – а Вы вряд ли этого хотите. Проверьте свои субъективные ощущения, слушая микс снаружи студии (с открытой дверью). Если Вам удалось создать чувство глубины в миксе, то это будет слышно и здесь. И, заодно, Вы проверите общий баланс всех элементов.
Настройка в контексте
Всегда имеется искушение включать в соло разные индивидуальные элементы и решать, какую же обработку применить к ним. Но если у Вас мало опыта, это может привести к большому количеству больших и ярких звуков, борющихся друг с другом за место во фронте Вашего микса. Поэтому, основное решение о той или иной обработке индивидуальных партий следует принимать с учётом общего контекста микса. В большинстве поп-миксов вокалы находятся ближе всего к слушателю, гитары и основные клавишные партии – немного позади их, примерно рядом с барабанами. Дополнительные элементы, такие, как подклады и бэк-вокалы, могут быть отодвинуты ещё дальше. Послушайте вещь «Won’t Get Fooled Again» группы The Who. Вы заметите, что мощные гитарные и барабанные партии не настолько ярки, как Вы могли бы себе вообразить, и реально помогают вокалу проникнуть в самое сердце слушателя. Таким образом, современная тенденция эквализовывать всё до хрустального блеска не всегда является хорошей стратегией!
Тренируйте свой профессиональный слух – слушайте свои любимые коммерческие записи и пытайтесь определить, какие из описанных методик в них применялись. Скоро Вам легко будет это сделать, и Вы сможете применить эти знания и в своём музыкальном производстве.
Дизеринг аудио что это
Мы создали специальную тему в конференции, где собрали вопросы по теме «Дизеринг и нойз-шейпинг». Любой желающий мог задать свой вопрос Алексею Лукину, известному эксперту по цифровой обработке сигналов, разработчику алгоритмов компании iZotope (США). К вопросам читателей мы добавили и несколько редакционных. Благодарим читателей за активное участие!
Введение
Преобразование звукового сигнала из аналоговой в цифровую форму можно представить в виде двух этапов: дискретизации по времени и квантования по амплитуде. На первом этапе (дискретизация) мгновенные значения сигнала замеряются с некоторым шагом по времени. На втором этапе (квантование) каждое из измеренных значений сигнала представляется в виде числа с некоторой точностью — разрядностью квантования.
На заре цифровой звукозаписи бытовало представление о разрушительном действии оцифровки на звуковой сигнал. И даже сейчас можно услышать мнение, что искажения в цифровом звуке зависят от уровня сигнала. В этой статье мы рассмотрим, как возникают искажения квантования и как их можно предотвратить.
Квантование сигнала
В начале эпохи цифровой звукозаписи разрядность АЦП и ЦАП была невысокой: 8 либо 16 бит в бытовой технике и 16–18 бит в профессиональной. Эффективных алгоритмов компрессии (типа mp3) еще не существовало, дисковое пространство было дорогим, а интернет — медленным. Поэтому нередко первые цифровые звукозаписи распространялись в формате 8 бит. Всем, конечно, знаком их хрустящий и искаженный звук. Вскоре 8-битный формат сменился 16-битным CD-форматом, и качество звука значительно выросло. Однако даже при 16-битном квантовании требуется уделять внимание возможным искажениям тихих звуков.
При квантовании сигнала амплитуда каждого отсчета округляется до ближайшего значения разрядной сетки (рис. 1). Нетрудно видеть, что для звуков малой амплитуды это может приводить к значительному искажению формы сигнала (рис. 2). Такой простейший способ квантования называется усечение (truncate, транкейт) либо округление (rounding).
Разница между исходным и квантованным сигналом называется ошибкой квантования или шумом квантования. Для сигналов малой амплитуды ошибка квантования сильно коррелирует с сигналом, что приводит к нелинейным искажениям и грязному звучанию (в этом смысле, термин «шум квантования» не очень удачен, так как ошибка квантования не похожа на шум). При 16-битном квантовании мощность ошибки квантования составляет приблизительно −98 дБ RMS (за 0 дБ RMS принимается мощность синусоиды максимального уровня, согласно стандарту AES-17).
Дитеринг
К счастью, существует метод сделать ошибку квантования практически не зависимой от исходного сигнала. Он называется английским словом дитеринг (dithering, в русской транскрипции также встречается «дизеринг») и заключается в подмешивании к сигналу шума перед квантованием (рис. 3).
Амплитуда шума дитеринга выбирается особым образом, чтобы устранить нелинейные искажения при последующем квантовании. Если амплитуда дитеринга мала, то нелинейные искажения будут устранены не полностью, либо амплитуда ошибки квантования будет меняться вместе с сигналом. Если амплитуда дитеринга велика, то шум станет заметным в записи.
Наиболее распространенным типом дитеринга является стандартный TPDF-дитеринг — белый шум с пиковой амплитудой ±1 LSB (least significant bit — шаг квантования) и треугольным распределением вероятности амплитуд. Почти любая цифровая рабочая станция (DAW) умеет генерировать дитеринг такого типа.
Важным моментом в применении дитеринга является его добавление к сигналу до, а не после квантования. Неправильно понимать дитеринг как шум, скрывающий или маскирующий искажения квантования. На самом деле дитеринг предотвращает появление искажений. Попытка замаскировать уже возникшие искажения потребовала бы шума значительно большей амплитуды.
Продемонстрируем работу дитеринга на тестовом сигнале «плавающий синус» с уровнем −80 дБ и плавным затуханием в конце (рис. 4). Для лучшей слышимости искажений сигнал после квантования в 16 бит был усилен на 55 дБ. Будем изучать как форму волны, так и спектрограмму.
| наведите мышь На спектрограмме сигнала, квантованного без дитеринга, видны сильные нелинейные искажения, усиливающиеся при уменьшении уровня сигнала. В конце записи сигнал полностью исчезает, так как его амплитуда становится меньше половины шага квантования. Спектрограмма с дитерингом показывает, что после квантования искажений в сигнале не появилось, а добавившийся шум однороден. Однако его мощность превышает мощность искажений при транкейте (−98 дБ) и составляет −93 дБ. Нойз-шейпингПовышенная мощность ошибки квантования при дитеринге порождает вопрос: можно ли проводить дитеринг не белым шумом, а таким, который будет менее заметен? Например, высокочастотным шумом. К сожалению, напрямую этот метод не работает. Если вместо белого шума дитеринга подмешать окрашенный шум, то ошибка квантования все равно будет близка к белому шуму. Кроме того, существует опасность неполного подавления нелинейных искажений квантования. Чтобы придать спектру ошибки квантования нужную форму, существует более сложный метод, называемый нойз-шейпингом (noise shaping, формирование спектра шума). В этом методе присутствует обратная связь: разница между квантованным и исходным сигналами пропускается через фильтр и прибавляется к следующему отсчету сигнала (рис. 5). Варьируя частотную характеристику фильтра, можно добиться нужного спектра ошибки квантования. Наиболее часто ошибку квантования вытесняют в диапазон высоких частот и ультразвука, где она будет наименее слышна. В слышимом диапазоне частот спектр нойз-шейпинга обычно приблизительно повторяет кривую порога слышимости. При нойз-шейпинге общая мощность ошибки квантования возрастает (по сравнению с дитерингом), но ее субъективная громкость снижается (рис. 4). Чем сильнее требуется снизить мощность шума в слышимой полосе (нижние и средние частоты), тем больше шума появляется в области верхних частот. Слишком большая мощность верхних частот в аудиосигнале нежелательна: она может затруднить последующую обработку сигнала, его кодирование в mp3, восстановление царапин при ошибках чтения с CD. Поэтому при 16-битном квантовании принято использовать нойз-шейпинг, не превышающий по уровню −60 дБ. Снижение субъективной слышимости шума при этом достигает 10–15 дБ по сравнению со стандартным TPDF-дитерингом. Обратите внимание, что файл с нойз-шейпингом звучит чисто. Так же, как при дитеринге, ошибка квантования представляет собой ровный шум без нелинейных искажений, не зависящий от сигнала. Понижение разрядностиКвантование сигнала происходит не только при оцифровке звука в АЦП, но и при последующей работе с цифровым сигналом: обработке, преобразовании формата, изменении уровня. Когда сигнал определенной разрядности (например, 16 бит) подвергается пересчету, его разрядность автоматически увеличивается (например, до 32 бит). Далее, если сигнал необходимо записать в файл исходного формата (16 бит), то происходит повторное квантование: из 32 бит в 16. При этом квантовании возможны те же искажения, что и в АЦП. Поэтому процесс дитеринга должен быть встроен в любые программы и алгоритмы, обрабатывающие сигнал. Чтобы минимизировать эффект от операций повторного квантования, обработка сигнала часто происходит в повышенной разрядности (24 или 32 бита), а окончательное снижение разрядности (до 16 бит) применяется после всех остальных операций. Понижение разрядности сигнала используется также в звуковых ЦАП: большинство из них имеют небольшую разрядность (1–5 бит), но высокую частоту дискретизации (порядка 10 МГц). При этом ЦАП заявляется как 24-битный, в том смысле, что он принимает на вход 24-битный аудиосигнал. Но внутри сигнал подвергается передискретизации (oversampling) — повышению частоты дискретизации и понижению разрядности с нойз-шейпингом. Поскольку финальная частота дискретизации очень высока, то в ультразвуковом диапазоне (выше 20 кГц) присутствует много места для шума нойз-шейпинга. Поэтому даже при малой разрядности сигнала (1–5 бит) агрессивный нойз-шейпинг способен создать динамический диапазон порядка 120 дБ в слышимой области частот. На рис. 5 показано сравнение типичных спектров шума нескольких звуковых форматов высокого разрешения: CD-формата (PCM 16 бит, 44 кГц) со стандартным TPDF-дитерингом, формата «24 бита 96 кГц» и двух форматов DSD с различными частотами дискретизации. Поскольку DSD-форматы имеют разрядность 1 бит, в них присутствует значительный нойз-шейпинг. У формата «DSD-2.8 МГц» быстрый подъем мощности шума начинается сразу за 20 кГц. У формата «DSD-5.6 МГц» шум лежит вдвое выше (уже за пределами графика на рис. 5). Квантование изображенийПохожие алгоритмы квантования используются и в обработке изображений, когда надо представить цвет малым числом доступных градаций. Проиллюстрируем это на примере 4-битного квантования (16 градаций яркости). наведите мышь |
Эффект от простого квантования цветов называется постеризацией: на изображении появляются ложные контуры, а часть деталей исчезает (рис. 6). Постеризации можно избежать, добавив перед квантованием шум дитеринга. Однако более качественного результата достигает алгоритм диффузии ошибки. Аналогично нойз-шейпингу, он вытесняет ошибку квантования в область верхних частот, где чувствительность глаза невысока. Диффузия ошибки часто применяется в офсетной печати для смешивания цветов.
Вопросы и ответы
Нужен ли дитеринг при работе в формате 32-bit float?
Нет, не нужен. Для этого формата не существует правильного дитеринга, так как ошибка квантования зависит от уровня сигнала: она имеет уровень примерно −150 дБ по отношению к уровню каждого отсчета. Точность этого формата составляет примерно 25 бит, так что быстрого накопления ошибок квантования можно не опасаться.
Нужен ли дитеринг при преобразовании из 32-bit float в 24-битный формат?
Да, при квантовании сигнала в разрядность 24 бита (и менее) нужен дитеринг. При 24 битах дитеринг в большинстве случаев не будет заметно влиять на результат, но его применение должно быть автоматическим, без лишних раздумий.
Нужен ли дитеринг при конвертировании файла в mp3?
Все зависит от того, сохраняете ли вы файл с низкой разрядностью перед конвертацией в mp3 или конвертируете в mp3 непосредственно из формата высокой разрядности. Дитеринг нужен для сохранения файла с низкой разрядностью, а не для mp3. Некоторые mp3-кодеры умеют компрессировать звук из форматов с высокой разрядностью, что позволяет избежать лишних конвертаций. Впрочем, артефакты mp3 обычно намного сильнее, чем искажения от конвертации разрядности.
Какой вид нойз-шейпинга использовать?
Это вопрос личных предпочтений и даже отчасти аудиофильский. Многие профессиональные инженеры мастеринга используют стандартный TPDF-дитеринг без нойз-шейпинга с отличными результатами. Другие — имеют предпочтения и считают, что тип нойз-шейпинга влияет на окончательное звучание фонограммы. Например, Боб Кац активно участвовал в создании нескольких режимов нойз-шейпинга MBIT+ для плагина Ozone 5. Я считаю, что в дитеринге и нойз-шейпинге важнее повсеместное и своевременное применение, нежели конкретный вид или алгоритм.
Достаточно ли уже имеющегося в записи шума для дитеринга?
В некоторых случаях — да, но не всегда. Шум дитеринга должен иметь определенные статистические свойства: требуемую мощность в каждой полосе частот, случайность распределения амплитуд. Поэтому надежнее применять дитеринг в любом случае, автоматически и без лишних раздумий.
Что применять сначала: дитеринг или преобразование частоты дискретизации (SRC)?
Так как SRC повышает разрядность сигнала (аналогично любой другой обработке), то сначала выполняется SRC, а затем дитеринг. Причем, между ними необходимо проверить, нет ли клиппирования, так как SRC может повысить пиковый уровень записи.
В статье Н. Сухова «Hi-Fi правда и High-End сказки» написано, что у аналоговой записи на пленке динамический диапазон определяется шумом снизу, а у цифровой — нет, потому что у 16-битного цифрового сигнала динамический диапазон равен 50 дБ из-за шумов квантования, которые дают 1% искажений. Верно ли это?
Статья Н. Сухова была написана в 1998 году, когда понимание дитеринга еще не было повсеместным. В статье рассматривается только случай квантования транкейтом. Однако при корректном использовании дитеринга и нойз-шейпинга никаких нелинейных и интермодуляционных искажений не возникает. При этом динамический диапазон компакт-диска составляет честные 93 дБ, а структура шума такая же, как у магнитной пленки.
Можно ли говорить о том, что нойз-шейпинг увеличивает динамический диапазон в наиболее слышимой СЧ-области?
Да, нойз-шейпинг увеличивает динамический диапазон в области средних частот (либо даже во всем диапазоне 0–15 кГц, в зависимости от алгоритма). В частности, может улучшиться A-взвешенный динамический диапазон.
Вопрос о возможном конфликте нойз-шейпинга в файле и нойз-шейпинга в конвертере. Не повредит ли нойз-шейпинг в исходном файле ЦАП-у с агрессивным нойз-шейпингом?
Нет. Насколько я понимаю, они не мешают друг другу и повсеместно используются вместе.
Благодарим Алексея Лукина за подробные ответы
и за потраченное время на обсуждение в нашей конференции!