Dst аудио формат что это
Цифровой звук: DSD vs PCM
Цифровой звук. Как же много мифов крутится вокруг этой фразы. Сколько споров возникало между любителями удобства и качества цифры и приверженцами «живого воздушного» винилового звука помноженного на «тёплое ламповое» звучание. Кроме того, есть немало споров и между любителями «цифры»: достаточно ли 16х44.1 или нужно 24х192? Что лучше: мультибит или дельта-сигма? CDDA или SACD? PCM или DSD? В этой статье я попробую простым языком изложить азы цифрового звука, а так же более подробно остановлюсь на сравнении двух типов кодирования аналогового сигнала в цифровой: DSD и PCM.
Для начала ответим на вопрос, что есть цифровой звук? Чем он отличаются от аналогового? Если говорить кратко, математическим языком, аналоговый звуковой сигнал — непрерывная функция, цифровой звуковой сигнал — дискретная функция. Что это значит?
Аналоговый сигнал
Если нарисовать в воображении график синусоиды (именно так в чаще всего изображают звуковую волну): то, как бы мы его не увеличивали, стараясь рассмотреть все детали, — всегда будем видеть плавную гладкую линию: это аналоговый звуковой сигнал (рис. 1).
Рис. 1. Аналоговый сигнал
Аналоговый звук (запись) имеет множество параметров, с помощью которых можно оценить его качество. Рассмотрим три самых важных: частотный диапазон, динамический диапазон, искажения.
Частотный диапазон — набор частот, содержащихся в звуке. Принято считать, что частотный диапазон человеческого слуха 20… 20.000 Гц (иногда указывается 16 — 22.000 Гц). Сам по себе частотный диапазон музыки никакого интереса в плане оценки качества не представляет (к примеру, частотный диапазон все того же взлетающего самолета будет очень широк, а вокальной партии тенора — намного уже). Качественным параметром, скажем, наушников является потенциальный частотный диапазон, а оценивается он с помощью амплитудно-частотной характеристики (АЧХ). Идеальная АЧХ — прямая линия на всем диапазоне частот слуха – означает, что источник звука не усиливает и не ослабляет какие-то отдельные частоты, а значит извлекаемый звук совпадает с оригиналом.
Рис. 2. АЧХ MP3 файла 256 kbps
Динамический диапазон (ДД) — разность между самым тихим и самым громким звуком. Измеряется громкость в децибелах (дБ). Принято считать, что максимальная громкость, не наносящая травм человеку — это 130 дБ — звук взлетающего самолета, а минимальная слышимая громкость — 5… 10 дБ — на уровне шелеста листьев в маловетреную погоду. Естественно, что шелест листьев на фоне взлетающего самолета разобрать будет невозможно, да и слушать музыку с уровнем 130 дБ крайне неприятно. Поэтому принято считать, что комфортный ДД для прослушивания музыки — 80… 100 дБ.
Искажения – не что иное, как отклонение сигнала от оригинала.
Принципы представления звука в цифровом виде
Что же происходит при оцифровке аналогового звука? Не будем углубляться в технические аспекты, разберем все, как говорится, на бумаге: для этого нарисуем нашу воображаемую «идеальную» синусоиду и будем измерять величину сигнала через равные промежутки времени (этот процесс называется дискретизацией или квантованием): мы получим некий последовательный набор значений — это и будет наш цифровой сигнал, полученный методом импульсно-кодовой модуляции (PCM) (рис. 3).
Рис. 3. Преобразование аналогового сигнала в PCM
Два основных параметра качества PCM сигнала — это частота и разрядность. Частота — это количество измерений за одну секунду, чем их больше — тем с большей точностью передаётся сигнал. Частота измеряется в герцах: 44100 Hz, 192000 Hz и др. Разрядность — количество возможных значений величины сигнала (точность передачи величины). Чем больше вариантов — тем больше точность сигнала. Разрядность измеряется в битах: 16 bit (65.536 возможных значений, ДД 96 дБ), 24 bit (16.777.216 значений, ДД 144 дБ) и др.
Рис. 4. Преобразование аналогового сигнала в DSD
Такой вид представления цифрового звука называется импульсно-плотностной модуляцией, чаще всего для него используется аббревиатура DSD. Фактически, единственный качественный параметр такого сигнала — частота. Но так как частоты используются очень высокие (от 2.822.400 Hz), такие цифры сложно запомнить, принято делить частоту DSD сигнала на 44.100 Hz. Полученное число и является показателем качества: DSD64 (ДД 120 дБ), DSD128, DSD256 и т.д.
Восстановление аналогового сигнала из «цифры»
Но оцифровка аналогового сигнала – это полдела. Для прослушивания цифровой музыки нужно выполнить обратное преобразование. Для начала рассмотрим, каким образом превратить в звук цифровой DSD поток. Как мы уже знаем, этот поток представляет из себя высокочастотный (2,8 МГц и более) двухуровневый сигнал, средняя величина этого сигнала меняется со звуковой частотой. То есть, если подходить к решению задачи максимально просто, — нужно отфильтровать все высокочастотные составляющие DSD потока, оставив только полезный звуковой сигнал (частоты до 20. 22 кГц). Делается это с помощью аналогового фильтра низкой частоты (ФНЧ). Простейший ФНЧ – это RC цепочка. Сигнал полученный, после прохождения этой цепочки, показан на рис. 5.
Рис. 5. Восстановление аналогового сигнала из DSD
Как видим, полученный график лишь отдаленно напоминает исходную синусоиду. Но не забываем, что мы «применили» простейший фильтр, улучшая схему фильтра можно добиться практически полного отсутствия высокочастотного шума и получить аналоговый звук с хорошими качественными показателями.
Для восстановления аналогового сигнала из цифрового PCM недостаточно только лишь аналогового ФНЧ, нужно предварительно расшифровать цифровые данные, для этого используются цифро-аналоговые преобразователи (ЦАПы). Бывают они разных типов, но описывать их все в задачи данной статьи не входит. Остановимся на 2-х самых распространённых типах в звуковой технике. Во-первых, это так называемый ЦАП лестничного типа (его ещё называют мультибитным). Как вы, наверное, догадались, такой ЦАП преобразует PCM поток цифровых данных в поток величин звукового сигнала, которые на графике выглядят как лестница (рис. 6). Как и в случае DSD, обязательно использование аналогового фильтра для сглаживания «ступенек».
Рис. 6. Восстановление аналогового сигнала из PCM
Зачастую, в таких преобразователях используется промежуточная передискретизация цифрового PCM сигнала в более высокие значения частоты (например, 192 кГц): это уменьшает «ступеньки», что позволяет упростить схему аналогового фильтра.
Второй тип ЦАП – дельта-сигма – использует передискретизацию в ещё большие значения частоты с одновременным уменьшением разрядности до одного бита. Ничего не напоминает? Это же знакомый нам DSD сигнал! Как далее обработать такой сигнал и превратить его в аналоговый, мы уже рассматривали выше.
Применение PCM и DSD, достоинства/недостатки
Где же мы можем встретить каждый из способов кодирования? PCM формат очень распространён: CDDA диски, DVD Audio, файлы MP3, FLAC, ALAC, AAC, звук в фильмах, и далее, и далее, проще сказать, когда не-PCM. Super Audio CD диски, DSD диски, файлы DSF, DFF — это DSD формат. Что же всё-таки лучше? При воспроизведении какого формата мы получим более качественный звук?
В статьях, посвященных DSD формату, описано множество преимуществ перед PCM, но все ли описываемые преимущества верны или это мифы, придуманные для обывателей, не разбирающихся в технической составляющей, чтобы отвоевывать рынок, плотно занятый PCM форматом? Давайте кратенько пройдемся по списку.
Рис. 7. Динамический диапазон / шум при преобразовании между DSD и PCM
DSD-конвертация: фейк или благо?
Рекламные анонсы ЦАПов часто хвастают поддержкой DSD, хотя новых DSD-релизов в этом формате выходит даже меньше, чем кассет. Однако существует и другая почетная ипостась для этого режима — облагораживать дубовость PCM-формата.
Пожалуй, ни один цифровой аудиокодер не был окутан одеялом противоречивых слухов и домыслов. Одни говорят, что DSD — это наиболее близкий к аналогу формат, другие, что Sony нельзя верить, третьи — что редактировать его невозможно, а потому все SACD — это фейк. Четвертые уверены в том, что SACD скопировать невозможно, пятые — что возможно. Словом, в этот раз я решил испытать DSD на тестовом стенде лично.
Речь пойдет не о сравнении коммерческих фонограмм, изданных в PCM- и DSD- формате. Это уже все было. Куда больший практический интерес представляет идея конвертации вообще любой музыки в DSD с последующим воспроизведением. Ранее я уже сталкивался с тем, что даже китайский нонейм лучше обрабатывал PCM-поток, если он был предварительно закодирован и поступил на чип в DSD-виде. К этому времени ряд производителей позволил выполнять эту процедуру не внешней программой, а непосредственно на уровне железа аудиокомпонента, так что настал момент изучить это явление с линейкой.
В роли линейки, как всегда, выступит наша стандартная RMAA-процедура. Разработчики по понятным причинам не предусматривали в ней тесты в DSD-домене — его нельзя «посчитать». Но можно «посчитать» аналоговый выхлоп источника, воспроизводящего DSD. Разумеется, это должен быть ЦАП высокого класса с минимумом собственных искажений, чтобы тонко отследить все отличия.
Эта роль сегодня предназначается новенькому TEAC UD-505 с новейшими чипами Asahi Kasei AK4497. В числе различных вариантов апсемплинга UD-505 предлагает закинуть в DSD256 или DSD512 любой сигнал, хоть с Bluetooth-приемника. Вот и запустим в таком режиме тестовый RMAA-трек с дискретностью 24 бит / 44 кГц.
В первой колонке приведены результаты работы ЦАПа в PCM-режиме с цифровым фильтром SD (т.е. Short Delay) Sharp. Если судить только по цифрам, то TEAC в роли самостоятельного DSD-PCM конвертера выступил хуже всех. Хотя апсемплирование ориентировалось на рекордные частоты DSD256 (11,2 МГЦ) и DSD512(22,4 МГц); по сравнению с оригиналом уровень шумов вырос почти на 20 дБ. Динамический диапазон 24-битного сигнала сократился до 99 дБ, а это практически CD-разрешение. Изменилась и АЧХ, которая своим спадом теперь больше напоминает работу ЦАПа в NOS-режиме.
Теперь сравним еще пару вариантов DSD-воспроизведения. Вторым выступит еще раз TEAC, но теперь конвертация будет проведена аудиоредактором Tascam Hi-Res Editor. Программа позволяет получить на выходе DSD-файлы из РСМ-оригиналов. А третьим вариантом будет конвертация PCM-DSD «на лету», выполненная силами софта плеера Jriver. Забегая вперед спешу сообщить, что хотя сигнал снимался с одного и того же выхода ЦАПа, во всех случаях были получены совершенно разные результаты. Вот вам и «дельта-сигма, которая и в Африке дельта-сигма».
Здесь еще следует добавить, что количество замеров удвоилось из-за того, что UD-505, в свою очередь, имеет два фильтра для DSD-декодирования — wide и narrow. И если в случае аппаратного апсемплинга на UD-505 их работа не слишком отличалась друг от друга, то воспроизведение «чужих» DSD выявило заметную разницу.
Из эксперимента были исключены режимы DSD256 и DSD512, поскольку в сравнении с младшими они не продемонстрировали прибавки в качестве, а апсемплирование до DSD512 на Jriver еще и перегружало процессор компьютера, вплоть до выпадений звука.
Итого: рассматриваем работу двух режимов DSD64 (2,8 МГц), DSD128 (5,6 МГц), пропущенных через фильтры wide и narrow у TEAC UD-505. Вот, кстати, официальные параметры указанных фильтров из мануала к ЦАПу:
Начнем с базового DSD64 (2,8 МГц). Кривые АЧХ показывают, что у всех сигналов имеется некая общая точка в районе 4,4 кГц, где они все сходятся, а затем разбегаются в разные стороны. Оригинал PCM (серый график) имеет небольшой подъем в области ВЧ из-за Sharp-фильтра — это вот такая имеется особенность AK4497 в данном режиме. Подъем небольшой, менее 0,25 дБ, я специально увеличил шкалу для наглядности разницы.
Различия работы wide- и narrow-фильтра уже не столь очевидны на частоте 5,6 МГц, но на картинках по-прежнему четко видна разница подходов Jriver и Tascam Hi-Res Editor. У Jriver АЧХ ближе к оригинальному PCM, при этом у всех вариантов графики шумов слились воедино. Нойз-шейпинга уже не видно — он вынесен за пределы слышимого диапазона 20 кГц.
Какие можно сделать выводы? Как видим, даже такой, казалось бы, устойчивый к трансформации формат демонстрирует на выходе совершенно разное поведение. Т.е. кодеры и декодеры DSD могут работать по нескольким протоколам. Имеет ли смысл пробовать DSD как промежуточный контейнер перед подачей РСМ-оригинала на ЦАП? Короткий ответ — да, имеет смысл пробовать. DSD128 (5,6 МГц) обеспечивает формально сопоставимые с РСМ показатели базовых измерений RMAA. Использование более высоких частот дискретизации в DSD не имеет смысла при хранении данных и не демонстрирует своих преимуществ с точки зрения аудиоопыта. И здесь (кроме приведенных цифр) следует поделиться личными впечатлениями как слушателя.
Возможно, это не столь очевидно из приведенных замеров RMAA, но у DSD, несомненно, есть свой почерк и подход к звуку. Дело в том, что микрофон и человеческое ухо «воспринимают» звучание по-разному. В PCM Hi-Res-разрешение фонограммы растет единым фронтом. Микрофон с одинаковым усердием потащит в запись и полезную музыкальную фактуру, и вредные артефакты и переотражения. А потому даже на очень детальных акустических записях нас не покидает ощущение присутствия при некоем «искусственном событии».
Ключевой момент DSD-процесса, что он как бы, наоборот, скрадывает «лишнюю» реверберацию, извлекая главный солирующий инструмент. Сложно прокомментировать эту особенность в рамках технического инструментария. Вероятно, речь идет об определенных временных характеристиках сигнала, что в комбинации с нойз-шейпингом дает ту специфику обращения с музыкальным тембром, которая так угодна человеческому уху.
Все, кто бывал в концертном зале, помнят, что там нет никакой «сцены» и других характеристик, которыми принято оперировать в аудиожурналистике. В жизни звук, как дух святой, живет где хочет. Вы можете сидеть не в самом удачном ряду, но прекрасно сфокусируетесь на первых тихих звуках виолончели. Этот момент «узнавания» весьма важен. А вот после микрофона РСМ-рекордера данное мгновение будет описано не столь драматично: к шорохам зала просто «прибавится» еще и музыкальный инструмент, который постепенно перекроет их по громкости. Понимаете разницу событий? В этом смысле избирательная тактика DSD стоит несколько ближе к реальному слуховому опыту, чем PCM.
И именно поэтому я бы рекомендовал DSD только для записей натуральных инструментов — симфонических, камерных и других ансамблей, где не было дополнительной обработки студийной машинерией. Не зря Кевин Грей говорил, что студийный микс в DSD не похож на то, что они слышали за консолью. Да, это правда. DSD снижает остроту студийного глянца. Многоканальным, эквализованным, отфильтрованным и компрессированным на различных уровнях фонограммам DSD не нужен. Ну, или нужен по крайней мере для маскировки слишком агрессивного мастеринга. Поэтому пользуйтесь DSD с удовольствием, но не забывайте периодически его отключать!
DSD формат аудио | Простое объяснение | Прочтите это сейчас >
Конвертация HD аудио файлов
1. Параметры DSD
Аббревиатура | Direct Stream Digital |
---|---|
Метод кодирования аудио данных | сигма-дельта модуляция (читайте подробности и смотрите видео) |
Битовая разрядность | 1 бит или выше (читайте подробности о качестве звука) |
Частота дискретизации | DSD 64 (2.8 МГц), DSD 128 (5.6 МГц, double), DSD 256 (11.2 МГц, quad), etc. (читайте подробности) |
Количество каналов | Стерео и многоканальный |
Носители | SACD оптический диск, включая hybrid SACD (с CD-аудио слоем), компьютерные файлы [SACD ISO (риппинг альбомов с SACD) и DSF, DFF, CUE+DSF/DFF] (читайте подробности) |
Спецификация | «Scarlet book» (1999) |
Использование | Производство музыки, домашнее hifi/hiend аудио |
Direct Stream Digital является обним из аудиофильских форматов высокого разрешения (high resolution audio). Он был создан для улучшения динамического диапазона CD-аудио в слышимой частотной области звука.
Читайте далее о вопросах качества звука (шум, битовая глубина, полоса, частота дискретизации DSD audio по сравнению с PCM).
2. 1-бит и шум
Как правило, этот формат имеет битовую глубину 1 бит. Поэтому уровнень шума значителен из-за ошибок квантования.
Нойз-шейпинг (НШ) спектра 1-битного сигнала.
Сигма-дельта модуляция
Когда такая 1-битная запись проигрывается, низко-частотный фильтр вырезает «усиленный» высокочастотный шум.
Таким образом, уровень шума 1-битного сигнала после нойз-шейпинга (сигма-дельта модуляции) становится сравнимым с уровнем шума мультибитного сигнала PCM (импульсно-кодовая модуляция).
То есть 1-битная сигма-дельта модуляция может иметь разрешение аудио одинаковое с мультибитным сигналом. Читайте подробности и смотрите видео здесь
3. Частоты дискретизации
Также в качестве основы может быть использовано 48000 кГц. С технической точки зрения не существует ограничения на частоту дискретизации сигма-дельта модулированного сигнала. Но возможно возникновение проблем с совместимостью.
4. Перегрузка и устойчивость
Когда разрабатывается сигма-дельта модулятор, инженеры обращают особое внимание на:
Для решения этих проблем разработчики могут варьировать:
Эти параметры должны рассматриваться в связи друг с другом.
Битовая глубина
Увеличение битового разрешения уменьшает шумы квантования (шумы ошибки квантования).
Нойз-шейпинг
Нойз-шейпинг «выталкивает» энергию ошибки квантования из слышимого диапазона.
Для «выталкивания» большего количества энергии нужно более крутой нойз-шейпинг.
Более крутой нойз-шейпинг увеличивает вероятность срыва стабильности работы сигма-дельта модулятора при перегрузке на входе.
Когда модулятор в нестабильном состоянии, на его выходе отсутствует сигнал или генерируются колебания.
После срыва стабильности модулятор должен быть принудительно перезапущен.
Устойчивость сигма-дельта модулятора к перегрузке
Частота дискретизации
Более высокая частота дискретизации уменьшает уровень спектра ошибки квантования. Потому, что энергия шума распределяется в более широкой полосе. Это позволяет использовать более пологий нойз-шейпинг.
Частота дискретизации и уровень шума квантования
В правой и левой частях изображения площади фигур шума одинаковы. Но фигура, более растянутая по горизонтальной оси, дает более низкий уровень шума.
Увеличение частоты дискретизации позволяет снизить уровень шума в полосе слышимого звука. Это позволяет уменьшить крутизну нойз-шейпинга и увеличить устойчивость модулятора к перегрузке.
Resume
Мы можем видеть, что более низкий уровень шума и более высокая устойчивость модулятора к перегрузке на входе могут быть достигнуты разными путями.
5. DSD в цифрах
Профессиональные аудио модуляторы имеют уровень шума в слышимом звуковом диапазоне для частот дискретизации:
Уровень шума в слышимом диапазоне почти не зависит от демодулятора. Но уровень шума должен быть максимально подавлен вне этой полосы. Так как ультразвуковой шум может привести к интермодуляционным искажениям.
Читайте о DSD vs DSF vs DFF >
6. DSD vs PCM
Direct Stream Digital (сигма-дельта модуляция) очень похожа на импульсно-кодовую модуляцию (PCM), но форма спектра уровня шумов квантования изменена для уменьшения уровня шума в звуковом диапазоне.
Также возможно применение нойз-шейпинга для обычной PCM. Но разница заключена в запасе полосы для «выталкивания» энергии шума из звукового диапазона.
DSD против PCM
PCM имеет меньший резерв полосы (выше звукового диапазона), чем сигма-дельта модуляция, и это обусловлено более высокой битовой глубиной и переходной полосой выходного фильтра ЦАП (цифрово-аналогового преобразователя).
Нойз-шейпинг также может быть использован и для импульсно-кодовой модуляции.
Таким образом, формат сам по себе не имеет преимуществ. Но его реализация может иметь различия в качестве звука.
Читайте подробности здесь >
Посмотрите статью с инфографикой DSD против FLAC >
Читайте статью о ЦАП >
7. Форматы сжатия DSD
SACD диск может быть конвертирован без потерь (losslessly) в SACD ISO файл [1], [2], [3].
SACD ISO файл может быть распакован без потерь в DSF или DFF файлы.
Читайте подробности о файлах DSF и DFF.
1-битные аудио файлы (DSF, DFF, SACD ISO) и диски могут быть сжаты по размеру с помощью метода DST (Direct Stream Transfer).
Также 1-битное аудио может вещаться через сеть.
Несжатое DSD64 требует пропускную способность 2.7 Мбит/с = 44100 Гц * 64 / 1024 / 1024.
Источники, носители Direct Stream Digital
Также связка индексного файла CUE и DSF/DFF аудио файла может содержать 1-битный альбом.
8. DSD проигрыватели
Для вопроизведения DSD на компьютере используются программные аудио плееры. Они могут проигрывать один или несколько 1-битных форматов файлов. Аппаратные DSD проигрыватели могут проигрывать как оптические SACD диски, так и файлы DSF, DFF.
1-битные файлы могут быть воспроизведены непосредственно через DSD ЦАП/проигрыватель или конвертированы в PCM «на лету» для проигрывания с помощью PCM ЦАП. О конвертировании SACD читайте здесь
1-битное проигрывание может быть реализовано через специальный ASIO-драйвер (программные) под Windows, включая DoP (DSD over PCM) формат упаковки аудио (пример).
Оптический SACD диск может быть проигран на аппаратном плеере. Автор не располагает информацией о доступных SACD-приводах для обычных компьютеров, чтобы воспроизводить SACD оптические диски.
Стерео проигрыватель может на лету конвертировать (downmix) многоканальный звук в стерео. Как альтернатива, многоканальные файлы могут быть предварительно конвертированы в стерео. Это позволяет сэкономить ограниченное место на жестком диска портативного проигрывателя аудио (DAP). Даунмикс является обработкой с потерями. Его качество зависит от конкретной реализации.
Читайте еще об аудио плеерах здесь > и здесь >
9. DSD конвертеры
DSD конвертеры предназначены для:
Прочитайте как работают DSD аудио конвертеры здесь >
Список конвертеров (конвертируют все или некоторые виды DSD файлов [DSF, DFF, SACD ISO])
10. Редактирование DSD
Читайте основную статью о редактировании DSD >
DSD редактирование достаточно сложный процесс по причине модулирующего шума в области высоких частот. Нелинейные обработки могут привести к слышимым продуктам интермодуляционных искажений ультразвукового шума.
В настоящее время автор не располагает информацией о «естественной» (native) обработке аудио 1-бит (например: изменение уровня, ресемплинг и пр.) без конвертации 1-бит в мильтибитный формат и обратно. Кроме слияния/разрезания аудио файлов.
Редактирование DSD
PCM в данном контексте может быть рассмотрено, как «мультибитное DSD». Импульсно-кодовая модуляция не обязательно обозначает «24 бит / 352 кГц» и т.п. Автор рекоммендует использовать 32- or 64-bit float (с плавающей запятой) форматы. Рассматриваемый PCM содержит высокочастотный модуляционный шум. Но, для конвертирования этого «мультибитного DSD» в 1-бит необходима модуляция с нойз шейпингом.
Потери при редактировании с 1-бит/мультибит преобразованием примерно сравнимы с ресемплингом.
Звукозаписывающие студии могут распространять DSD записи без редактирования.
Также существует DXD формат. Это PCM (как правило, «24 bit / 352 kHz» и т.п.) с высокими частотами дискретизации, битовыми разрешениями и «наследственным» высокочастотным шумом DSD. К сожалению, этот шум может привести к слышимым продуктам нелинейных искажений. рекомендуется вырезать (фильтровать) этот шум перед нелинейными обработками.