Dsd audio что это
Цифровой звук: DSD vs PCM
Цифровой звук. Как же много мифов крутится вокруг этой фразы. Сколько споров возникало между любителями удобства и качества цифры и приверженцами «живого воздушного» винилового звука помноженного на «тёплое ламповое» звучание. Кроме того, есть немало споров и между любителями «цифры»: достаточно ли 16х44.1 или нужно 24х192? Что лучше: мультибит или дельта-сигма? CDDA или SACD? PCM или DSD? В этой статье я попробую простым языком изложить азы цифрового звука, а так же более подробно остановлюсь на сравнении двух типов кодирования аналогового сигнала в цифровой: DSD и PCM.
Для начала ответим на вопрос, что есть цифровой звук? Чем он отличаются от аналогового? Если говорить кратко, математическим языком, аналоговый звуковой сигнал — непрерывная функция, цифровой звуковой сигнал — дискретная функция. Что это значит?
Аналоговый сигнал
Если нарисовать в воображении график синусоиды (именно так в чаще всего изображают звуковую волну): то, как бы мы его не увеличивали, стараясь рассмотреть все детали, — всегда будем видеть плавную гладкую линию: это аналоговый звуковой сигнал (рис. 1).
Рис. 1. Аналоговый сигнал
Аналоговый звук (запись) имеет множество параметров, с помощью которых можно оценить его качество. Рассмотрим три самых важных: частотный диапазон, динамический диапазон, искажения.
Частотный диапазон — набор частот, содержащихся в звуке. Принято считать, что частотный диапазон человеческого слуха 20… 20.000 Гц (иногда указывается 16 — 22.000 Гц). Сам по себе частотный диапазон музыки никакого интереса в плане оценки качества не представляет (к примеру, частотный диапазон все того же взлетающего самолета будет очень широк, а вокальной партии тенора — намного уже). Качественным параметром, скажем, наушников является потенциальный частотный диапазон, а оценивается он с помощью амплитудно-частотной характеристики (АЧХ). Идеальная АЧХ — прямая линия на всем диапазоне частот слуха – означает, что источник звука не усиливает и не ослабляет какие-то отдельные частоты, а значит извлекаемый звук совпадает с оригиналом.
Рис. 2. АЧХ MP3 файла 256 kbps
Динамический диапазон (ДД) — разность между самым тихим и самым громким звуком. Измеряется громкость в децибелах (дБ). Принято считать, что максимальная громкость, не наносящая травм человеку — это 130 дБ — звук взлетающего самолета, а минимальная слышимая громкость — 5… 10 дБ — на уровне шелеста листьев в маловетреную погоду. Естественно, что шелест листьев на фоне взлетающего самолета разобрать будет невозможно, да и слушать музыку с уровнем 130 дБ крайне неприятно. Поэтому принято считать, что комфортный ДД для прослушивания музыки — 80… 100 дБ.
Искажения – не что иное, как отклонение сигнала от оригинала.
Принципы представления звука в цифровом виде
Что же происходит при оцифровке аналогового звука? Не будем углубляться в технические аспекты, разберем все, как говорится, на бумаге: для этого нарисуем нашу воображаемую «идеальную» синусоиду и будем измерять величину сигнала через равные промежутки времени (этот процесс называется дискретизацией или квантованием): мы получим некий последовательный набор значений — это и будет наш цифровой сигнал, полученный методом импульсно-кодовой модуляции (PCM) (рис. 3).
Рис. 3. Преобразование аналогового сигнала в PCM
Два основных параметра качества PCM сигнала — это частота и разрядность. Частота — это количество измерений за одну секунду, чем их больше — тем с большей точностью передаётся сигнал. Частота измеряется в герцах: 44100 Hz, 192000 Hz и др. Разрядность — количество возможных значений величины сигнала (точность передачи величины). Чем больше вариантов — тем больше точность сигнала. Разрядность измеряется в битах: 16 bit (65.536 возможных значений, ДД 96 дБ), 24 bit (16.777.216 значений, ДД 144 дБ) и др.
Рис. 4. Преобразование аналогового сигнала в DSD
Такой вид представления цифрового звука называется импульсно-плотностной модуляцией, чаще всего для него используется аббревиатура DSD. Фактически, единственный качественный параметр такого сигнала — частота. Но так как частоты используются очень высокие (от 2.822.400 Hz), такие цифры сложно запомнить, принято делить частоту DSD сигнала на 44.100 Hz. Полученное число и является показателем качества: DSD64 (ДД 120 дБ), DSD128, DSD256 и т.д.
Восстановление аналогового сигнала из «цифры»
Но оцифровка аналогового сигнала – это полдела. Для прослушивания цифровой музыки нужно выполнить обратное преобразование. Для начала рассмотрим, каким образом превратить в звук цифровой DSD поток. Как мы уже знаем, этот поток представляет из себя высокочастотный (2,8 МГц и более) двухуровневый сигнал, средняя величина этого сигнала меняется со звуковой частотой. То есть, если подходить к решению задачи максимально просто, — нужно отфильтровать все высокочастотные составляющие DSD потока, оставив только полезный звуковой сигнал (частоты до 20. 22 кГц). Делается это с помощью аналогового фильтра низкой частоты (ФНЧ). Простейший ФНЧ – это RC цепочка. Сигнал полученный, после прохождения этой цепочки, показан на рис. 5.
Рис. 5. Восстановление аналогового сигнала из DSD
Как видим, полученный график лишь отдаленно напоминает исходную синусоиду. Но не забываем, что мы «применили» простейший фильтр, улучшая схему фильтра можно добиться практически полного отсутствия высокочастотного шума и получить аналоговый звук с хорошими качественными показателями.
Для восстановления аналогового сигнала из цифрового PCM недостаточно только лишь аналогового ФНЧ, нужно предварительно расшифровать цифровые данные, для этого используются цифро-аналоговые преобразователи (ЦАПы). Бывают они разных типов, но описывать их все в задачи данной статьи не входит. Остановимся на 2-х самых распространённых типах в звуковой технике. Во-первых, это так называемый ЦАП лестничного типа (его ещё называют мультибитным). Как вы, наверное, догадались, такой ЦАП преобразует PCM поток цифровых данных в поток величин звукового сигнала, которые на графике выглядят как лестница (рис. 6). Как и в случае DSD, обязательно использование аналогового фильтра для сглаживания «ступенек».
Рис. 6. Восстановление аналогового сигнала из PCM
Зачастую, в таких преобразователях используется промежуточная передискретизация цифрового PCM сигнала в более высокие значения частоты (например, 192 кГц): это уменьшает «ступеньки», что позволяет упростить схему аналогового фильтра.
Второй тип ЦАП – дельта-сигма – использует передискретизацию в ещё большие значения частоты с одновременным уменьшением разрядности до одного бита. Ничего не напоминает? Это же знакомый нам DSD сигнал! Как далее обработать такой сигнал и превратить его в аналоговый, мы уже рассматривали выше.
Применение PCM и DSD, достоинства/недостатки
Где же мы можем встретить каждый из способов кодирования? PCM формат очень распространён: CDDA диски, DVD Audio, файлы MP3, FLAC, ALAC, AAC, звук в фильмах, и далее, и далее, проще сказать, когда не-PCM. Super Audio CD диски, DSD диски, файлы DSF, DFF — это DSD формат. Что же всё-таки лучше? При воспроизведении какого формата мы получим более качественный звук?
В статьях, посвященных DSD формату, описано множество преимуществ перед PCM, но все ли описываемые преимущества верны или это мифы, придуманные для обывателей, не разбирающихся в технической составляющей, чтобы отвоевывать рынок, плотно занятый PCM форматом? Давайте кратенько пройдемся по списку.
Рис. 7. Динамический диапазон / шум при преобразовании между DSD и PCM
Что такое DSD-аудио? Как это работает и где взять файлы?
Сохранить и прочитать потом —
Похоже, формат DSD вновь входит в моду. Большинство новых цифровых устройств обеспечивают его поддержку, а каталог доступных альбомов внушает уважение – особенно у любителей джаза и классики.
Что же это такое и чем отличается от других систем записи цифровых сигналов, применяющихся в компакт-дисках и других форматов Hi-Res-аудио? Давайте узнаем.
Подробнее о PCM
Цифровые потоки записываются в виде комбинации двух состояний, 0 и 1; но для того, чтобы эту информацию можно было использовать, она должна быть организована особым образом. Почти во всех случаях используется система под названием PCM (Pulse Code Modulation, импульсно-кодовая модуляция).
Давайте вначале вспомним, как именно работает PCM.
При использовании PCM исходная форма аналогового аудиосигнала описывается при помощи двух параметров. Первый – это величина. На компакт-диске она представлена 16-разрядными цифровыми данными, что дает возможность задавать 65 536 различных уровней сигнала.
Для адекватного представления исходной формы сигнала ее необходимо измерять с точно отмеренными регулярными интервалами. Эти отсчеты выполняются 44 100 раз в секунду. Число выглядит случайным, однако его выбор был очень продуманным – оно обеспечивает покрытие полного диапазона слышимых человеком частот (от 20 Гц до 20 кГц).
DSD and SACD
Технология DSD (Direct Stream Digital) использует другой подход. Она была разработана в середине 90-х как способ архивирования старых аналоговых записей.
Предполагалось, что это будет более простой и экономичный с точки зрения занимаемой памяти способ хранения цифровых музыкальных данных по сравнению с PCM. Что особенно важно, DSD также изначально разрабатывался с учетом возможности преобразования в файлы формата PCM с частотой дискретизации, кратной 44,1 кГц.
Примерно в то же время компании Sony и Philips работали над заменой CD, который в конечном итоге принял форму SACD. Система DSD представлялась идеальной основой для создания нового формата – в частности, благодаря превосходной защите от копирования.
Основным достоинством DSD была простота и вытекающая из нее дешевизна реализации. Эта технология требовала меньшего уровня обработки, чем PCM, благодаря чему можно было применять более простые и намного менее дорогие ЦАП.
Как работает DSD?
DSD использует один бит информации, который говорит только о том, больше или меньше предыдущего фрагмента аналогового сигнала оказывается текущий. По сравнению с 65 тысячами разных значений, которые может принимать сигнал PCM, всего лишь два (0 в случае, если уровень сигнала нового отсчета ниже, и 1 – если он выше) у сигнала DSD кажутся категорически недостаточными для передачи нужной информации.
Однако нехватка информации компенсируется очень высокой частотой дискретизации – более 2,8 миллиона раз в секунду, что в 64 раза превышает соответствующий параметр для CD. Из-за этого DSD-формат стандартного разрешения нередко обозначают как DSD64, а его версии с удвоенной и учетверенной частотой дискретизации – как DSD128 и DSD256, соответственно. Существует даже спецификация DSD512, хотя нам не доводилось слышать, чтобы с ее применением был записан какой-то материал.
Записи в стандартном формате DSD по-прежнему достаточно редки по сравнению с альтернативными вариантами в PCM, а с повышенным разрешением встречаются еще намного реже. Однако поклонники DSD утверждают, что этот формат обеспечивает максимальную близость к аналоговому звучанию.
Если бы можно было увидеть цифровой поток формата DSD, нарисовать соответствующий аналоговый сигнал стало бы возможно, просто взглянув на распределение нулей и единиц. Чем больше нулей, тем меньше его величина; чем больше единиц, тем она больше. Если два значения встречаются примерно поровну, уровень сигнала близок к нулевому.
В чем недостатки формата DSD?
Плеер Astell & Kern AK70 mkII перед воспроизведением преобразует файлы формата DSD в PCM
Все это прекрасно, но у формата DSD есть и минусы. В частности, в нем сложно работать с записями.
Для выполнения любых обработок записи – например, эквализации, редактирования, управления динамическим диапазоном и добавления реверберации – обычно приходится преобразовывать DSD в PCM, выполнять необходимые преобразования и затем конвертировать обратно в DSD.
Этот способ сложно назвать простым и прямолинейным, однако он применяется практически для каждой студийной записи, выполненной по технологии DSD. Все дело в отсутствии подходящего оборудования и соответствующего программного обеспечения.
В описании диска может встретиться обозначение DXD. Это означает, что исходный сигнал в DSD был преобразован в PCM с параметрами 24 бит/352 кГц и обрабатывался в этом виде. Несмотря на то, что название, намеренно или нет, звучит похоже на DSD, по сути, это просто PCM с очень высоким разрешением.
Кроме того, аналоговому сигналу, полученному из DSD, присущ высокий по сравнению с PCM уровень шума. Продуманные технологии позволяют инженерам вывести эти шумы за границу слышимого диапазона частот и оптимизировать качество звука и шкалу динамики в пределах слышимого спектра. Высокочастотный шум обычно отфильтровывается.
Относится ли формат DSD к Hi-Res-аудио?
Насколько высокое разрешение имеют записи в DSD? Точно установить соотношение между PCM и DSD невозможно, но базовый формат примерно соответствует PCM с параметрами дискретизации 24 бит/88,2 кГц.
Заявленный динамический диапазон DSD составляет около 120 дБ в пределах слышимости. Для сравнения, у обычных CD он равен 96 дБ, а теоретический максимум записей в 24/192 достигает 144 дБ.
Большие числа смотрятся впечатляюще, но на деле даже диапазона CD более чем достаточно для любой записи.
Как воспроизводить DSD-файлы?
Chord Hugo 2 способен воспроизводить файлы вплоть до DSD512
В последние годы цифровые компоненты все чаще поддерживают воспроизведение DSD; это связано с повышением доступности скачиваемых аудиозаписей. Проверьте, поддерживают ли этот формат ваши портативный музыкальный, сетевой плеер и/или ЦАП.
Самые современные цифровые устройства среднего и высшего класса, как правило, обладают такой поддержкой; если ваши компоненты относятся к их числу, обязательно добавьте этот формат к уже привычным FLAC и WAV. Некоторые флагманские смартфоны также совместимы с DSD. И даже пользователи Apple iPhone могут воспроизводить DSD-файлы при помощи дополнительного оборудования.
На сайтах для скачивания музыки время от времени можно встретить обозначения DSF и DFF. Это две разновидности DSD-файлов; все, что реально нужно о них знать – всегда выбирайте версию DSF, если ваш плеер ее поддерживает, поскольку она лучше работает с метаданными (такими как имя исполнителя, название песни, обложка альбома и тому подобные).
Где купить аудиофайлы в формате DSD?
Альбомы в DSD можно приобрести на сайте HDtracks
Большинство крупных сайтов для аудиофилов предлагают возможность покупки DSD-файлов для скачивания. Можно начать с таких источников, как HDtracks, Highresaudio и Primephonic.
Если же вы предпочитаете физические форматы и являетесь обладателем совместимого проигрывателя, SACD можно найти почти повсюду.
Подготовлено по материалам портала «What Hi-Fi?», май 2020 г.
DSD-конвертация: фейк или благо?
Рекламные анонсы ЦАПов часто хвастают поддержкой DSD, хотя новых DSD-релизов в этом формате выходит даже меньше, чем кассет. Однако существует и другая почетная ипостась для этого режима — облагораживать дубовость PCM-формата.
Пожалуй, ни один цифровой аудиокодер не был окутан одеялом противоречивых слухов и домыслов. Одни говорят, что DSD — это наиболее близкий к аналогу формат, другие, что Sony нельзя верить, третьи — что редактировать его невозможно, а потому все SACD — это фейк. Четвертые уверены в том, что SACD скопировать невозможно, пятые — что возможно. Словом, в этот раз я решил испытать DSD на тестовом стенде лично.
Речь пойдет не о сравнении коммерческих фонограмм, изданных в PCM- и DSD- формате. Это уже все было. Куда больший практический интерес представляет идея конвертации вообще любой музыки в DSD с последующим воспроизведением. Ранее я уже сталкивался с тем, что даже китайский нонейм лучше обрабатывал PCM-поток, если он был предварительно закодирован и поступил на чип в DSD-виде. К этому времени ряд производителей позволил выполнять эту процедуру не внешней программой, а непосредственно на уровне железа аудиокомпонента, так что настал момент изучить это явление с линейкой.
В роли линейки, как всегда, выступит наша стандартная RMAA-процедура. Разработчики по понятным причинам не предусматривали в ней тесты в DSD-домене — его нельзя «посчитать». Но можно «посчитать» аналоговый выхлоп источника, воспроизводящего DSD. Разумеется, это должен быть ЦАП высокого класса с минимумом собственных искажений, чтобы тонко отследить все отличия.
Эта роль сегодня предназначается новенькому TEAC UD-505 с новейшими чипами Asahi Kasei AK4497. В числе различных вариантов апсемплинга UD-505 предлагает закинуть в DSD256 или DSD512 любой сигнал, хоть с Bluetooth-приемника. Вот и запустим в таком режиме тестовый RMAA-трек с дискретностью 24 бит / 44 кГц.
В первой колонке приведены результаты работы ЦАПа в PCM-режиме с цифровым фильтром SD (т.е. Short Delay) Sharp. Если судить только по цифрам, то TEAC в роли самостоятельного DSD-PCM конвертера выступил хуже всех. Хотя апсемплирование ориентировалось на рекордные частоты DSD256 (11,2 МГЦ) и DSD512(22,4 МГц); по сравнению с оригиналом уровень шумов вырос почти на 20 дБ. Динамический диапазон 24-битного сигнала сократился до 99 дБ, а это практически CD-разрешение. Изменилась и АЧХ, которая своим спадом теперь больше напоминает работу ЦАПа в NOS-режиме.
Теперь сравним еще пару вариантов DSD-воспроизведения. Вторым выступит еще раз TEAC, но теперь конвертация будет проведена аудиоредактором Tascam Hi-Res Editor. Программа позволяет получить на выходе DSD-файлы из РСМ-оригиналов. А третьим вариантом будет конвертация PCM-DSD «на лету», выполненная силами софта плеера Jriver. Забегая вперед спешу сообщить, что хотя сигнал снимался с одного и того же выхода ЦАПа, во всех случаях были получены совершенно разные результаты. Вот вам и «дельта-сигма, которая и в Африке дельта-сигма».
Здесь еще следует добавить, что количество замеров удвоилось из-за того, что UD-505, в свою очередь, имеет два фильтра для DSD-декодирования — wide и narrow. И если в случае аппаратного апсемплинга на UD-505 их работа не слишком отличалась друг от друга, то воспроизведение «чужих» DSD выявило заметную разницу.
Из эксперимента были исключены режимы DSD256 и DSD512, поскольку в сравнении с младшими они не продемонстрировали прибавки в качестве, а апсемплирование до DSD512 на Jriver еще и перегружало процессор компьютера, вплоть до выпадений звука.
Итого: рассматриваем работу двух режимов DSD64 (2,8 МГц), DSD128 (5,6 МГц), пропущенных через фильтры wide и narrow у TEAC UD-505. Вот, кстати, официальные параметры указанных фильтров из мануала к ЦАПу:
Начнем с базового DSD64 (2,8 МГц). Кривые АЧХ показывают, что у всех сигналов имеется некая общая точка в районе 4,4 кГц, где они все сходятся, а затем разбегаются в разные стороны. Оригинал PCM (серый график) имеет небольшой подъем в области ВЧ из-за Sharp-фильтра — это вот такая имеется особенность AK4497 в данном режиме. Подъем небольшой, менее 0,25 дБ, я специально увеличил шкалу для наглядности разницы.
Различия работы wide- и narrow-фильтра уже не столь очевидны на частоте 5,6 МГц, но на картинках по-прежнему четко видна разница подходов Jriver и Tascam Hi-Res Editor. У Jriver АЧХ ближе к оригинальному PCM, при этом у всех вариантов графики шумов слились воедино. Нойз-шейпинга уже не видно — он вынесен за пределы слышимого диапазона 20 кГц.
Какие можно сделать выводы? Как видим, даже такой, казалось бы, устойчивый к трансформации формат демонстрирует на выходе совершенно разное поведение. Т.е. кодеры и декодеры DSD могут работать по нескольким протоколам. Имеет ли смысл пробовать DSD как промежуточный контейнер перед подачей РСМ-оригинала на ЦАП? Короткий ответ — да, имеет смысл пробовать. DSD128 (5,6 МГц) обеспечивает формально сопоставимые с РСМ показатели базовых измерений RMAA. Использование более высоких частот дискретизации в DSD не имеет смысла при хранении данных и не демонстрирует своих преимуществ с точки зрения аудиоопыта. И здесь (кроме приведенных цифр) следует поделиться личными впечатлениями как слушателя.
Возможно, это не столь очевидно из приведенных замеров RMAA, но у DSD, несомненно, есть свой почерк и подход к звуку. Дело в том, что микрофон и человеческое ухо «воспринимают» звучание по-разному. В PCM Hi-Res-разрешение фонограммы растет единым фронтом. Микрофон с одинаковым усердием потащит в запись и полезную музыкальную фактуру, и вредные артефакты и переотражения. А потому даже на очень детальных акустических записях нас не покидает ощущение присутствия при некоем «искусственном событии».
Ключевой момент DSD-процесса, что он как бы, наоборот, скрадывает «лишнюю» реверберацию, извлекая главный солирующий инструмент. Сложно прокомментировать эту особенность в рамках технического инструментария. Вероятно, речь идет об определенных временных характеристиках сигнала, что в комбинации с нойз-шейпингом дает ту специфику обращения с музыкальным тембром, которая так угодна человеческому уху.
Все, кто бывал в концертном зале, помнят, что там нет никакой «сцены» и других характеристик, которыми принято оперировать в аудиожурналистике. В жизни звук, как дух святой, живет где хочет. Вы можете сидеть не в самом удачном ряду, но прекрасно сфокусируетесь на первых тихих звуках виолончели. Этот момент «узнавания» весьма важен. А вот после микрофона РСМ-рекордера данное мгновение будет описано не столь драматично: к шорохам зала просто «прибавится» еще и музыкальный инструмент, который постепенно перекроет их по громкости. Понимаете разницу событий? В этом смысле избирательная тактика DSD стоит несколько ближе к реальному слуховому опыту, чем PCM.
И именно поэтому я бы рекомендовал DSD только для записей натуральных инструментов — симфонических, камерных и других ансамблей, где не было дополнительной обработки студийной машинерией. Не зря Кевин Грей говорил, что студийный микс в DSD не похож на то, что они слышали за консолью. Да, это правда. DSD снижает остроту студийного глянца. Многоканальным, эквализованным, отфильтрованным и компрессированным на различных уровнях фонограммам DSD не нужен. Ну, или нужен по крайней мере для маскировки слишком агрессивного мастеринга. Поэтому пользуйтесь DSD с удовольствием, но не забывайте периодически его отключать!