DSD (англ. Direct Stream Digital)—однобитный аудиоформат, разработанный компаниями Sony и Philips, в котором используется кодирование плотностно-импульсной модуляцией (англ. Pulse Density Modulation (PDM), разновидность сигма-дельта-модуляции) и применяется для хранения звукозаписей на оптическом носителе SACD. Изначально предполагался как архивный формат звукозаписывающей компании Sony Music для перевода музыкального архива в цифровой формат.
Одноразрядное квантование
Аналоговый звуковой сигнал конвертируется в цифровой с помощью дельта-сигма модуляции при частоте дискретизации 2 822,4 кГц (в 64 раза больше, чем у CD Audio), но с разрешением всего 1 бит, в отличие от используемых в формате CD 16 бит при частоте 44,1 кГц. Такое преобразование, при котором отсчеты аналогового сигнала берутся с частотой, многократно превышающей верхнюю граничную частоту сигнала называется семплирование с передискретизацией (англ. oversampling).
Избыточное семплирование имеет большое значение при устранении шумов квантования, вносимых квантователем. Поскольку сигнал передискретизирован, соседние отсчеты коррелируют друг с другом. В итоге так называемого «сетевого эффекта» мощность шума в частотном диапазоне, занимаемом полезным сигналом, уменьшается пропорционально повышению частоты дискретизации. Таким образом, отношение сигнал/шум увеличивается, когда частота дискретизации становится больше. Передискретизация позволяет избежать необходимости предварительного фильтрования и сохраняет гармоники в их первоначальном состоянии (хотя они могут оказаться задавленными шумом квантования, особенно на высоких частотах). Фазовая характеристика становится более схожей с высокочастотной характеристикой аналоговых систем.
Чтобы иметь меньший уровень шумов в пределах частотного диапазона полезного сигнала применяется технология формированием шума (англ. noise shaping), которая перемещает шумы за пределы слышимого диапазона. Затем одноразрядные импульсы записываются напрямую на носитель.
Положительное изменение амплитуды будет представлено всеми «1». Отрицательное — всеми «0». Нулевая точка будет представлена сменой двоичного числа. Поскольку значение амплитуды аналогового сигнала в каждый момент представлено в виде плотности импульсов, этот метод иногда называют плотностно-импульсной модуляцией Pulse Density Modulation (PDM).
Цифро-аналоговое преобразование состоит в простом отфильтровывании одноразрядного представления для удаления сверхзвуковых шумов.
Преимущества формата
• превосходные частотные и фазовые характеристики;
• помехоустойчивость;
• более простая обработка и коммутация;
• снижение влияния ошибок;
• возможность усовершенствования без ущерба для совместимости носителей.
• однобитный формат DSD не нуждается в кадровой структуре и не требует многоразрядных шин, что дает несколько важных технических преимуществ:
cоединение осуществляется одной парой проводников (как в аналоговой технике);
нет необходимости создания буфера для хранения многоразрядного слова. Поскольку система одноразрядная, нет также необходимости усложнять её синхронизацией;
эффекты задержек отсчетов (джиттер) незначительны, поскольку задержка нескольких отсчетов при передискретизации оказывает на аудиосигнал минимальное влияние, так как даже при самой высокой частоте сигнала составляет малую часть периода в многоразрядных системах задержка на один отсчет будет равняться уже половине периода высокочастотных компонентов сигнала.
блоки обработки и микросхемы имеют меньше соединений и могут использовать последовательный интерфейс.
DSD способен обеспечить динамический диапазон 120 дБ от 20 Гц до 20 кГц. Значительное повышение уровня шума происходит за границей слышимого диапазона свыше 20 кГц.
Форматы
Для возможности записи, редактирования, мастеринга и авторинга в формате DSD, минуя преобразования в ИКМ, в 2000 году был разработан файловый формат DSDIFF (англ. Direct Stream Digital Interchange File Format)
Для снижения занимаемого дискового пространства и для уменьшения полосы передачи необходимых для DSD применяется сжатие звука без потерь DST (англ. Direct Stream Transfer ). В 2005 году DST стандартизован как MPEG-4 Аудио стандарт (ISO/IEC 14496-3:2001/Amd 6:2005 — Кодирование без потерь звука с передискретизацией). В 2007 году была опубликована эталонная реализация MPEG-4 DST как ISO/IEC 14496-5:2001/Amd.10:2007.
Некоторые профессиональные звукозаписывающие системы могут производить запись непосредственно в DSD. Для высококачественной записи выпускаются модели со 128-кратной передискретизацией, так что частота дискретизации получается равной 5,6 МГц, как например Korg MR-1000.
Из-за невозможности обработки сигнала формата DSD без преобразования в другой формат в 2004 году компанией Digital Audio Denmark был разработан ИКМ-формат для записи и обработки звука DXD с разрядностью квантования 24 или 32 бита и частотой дискретизации 352.8 кГц.
Распространение
Используется в носителях SACD
С 2010 года в Интернете стали распространяться аудиофайлы DSD, имеющие расширение DSDIFF или DSF. С помощью специального ПО и ЦАПа они могут воспроизводиться на компьютере либо могут быть преобразованы в ИКМ-файлы для последующего прослушивания.
DSD-диск — оптический диск (DVD-R, DVD+R, DVD-RW или DVD+RW), содержащий файлы DSD с расширением DSF, который может проигрываться на компьютере или другом оборудовании, поддерживающим воспроизведение этих файлов. Содержит аудиофайлы высокого разрешения с частотой дискретизации 2822,4 кГц. Качество аудиозаписи на DSD-диске такое же, как на SACD, с тем отличием, что на первом не может быть записан многоканальный сигнал. Фирмой Sony разработана спецификация под названием DSD Disc Format, которой пользуются некоторые звукозаписывающие фирмы для выпуска DSD-дисков. Этот формат является открытым, и при наличии специального ПО такой диск может быть подготовлен в бытовых условиях и содержать файлы DSD, полученные, например, через Интернет.
Дополнительно:
Cкрытый текст -
Super Audio CD (SACD) — неперезаписываемый оптический аудиодиск, позволяющий хранить аудиоданные со значительно более высоким качеством, по сравнению с обычным CDDA-диском. Разработан компаниями Sony и Philips в 1999 году.
Особенности SACD-дисков
Запись на SACD-диске может содержать от 1 до 6 звуковых каналов.
Для воспроизведения SACD требуется специальный проигрыватель, совместимый с этим форматом. Однако на SACD-диске может содержаться дополнительный CD-слой (только стерео) для совместимости с обычными проигрывателями, такие диски называются гибридными (англ. Hybrid SACD) и их можно слушать на любых обычных проигрывателях компакт-дисков. Примерно половина выпущенных SACD-дисков являются гибридными.
Продолжительность звучания Super Audio CD может достигать 109 минут при условии, что он содержит две SACD-зоны с разными параметрами записи (например, 2.0 и 5.1). При использовании только одной SACD-зоны продолжительность звучания превышает 2 часа.
Ёмкость диска SACD увеличилась в 6 раз за счёт уменьшения длины волны излучения лазера и увеличения апертуры объектива. Благодаря этому диаметр считывающего пятна света уменьшился до 1 мкм. Это, в свою очередь, позволило уменьшить размеры питов, интервалов между ними и шаг дорожки.
Для дисков SACD в качестве материала отражающих слоёв используется золото (в отличие от CD-DA, где используется алюминий; хотя встречаются и «золотые» CD, чаще всего для подарочных и коллекционных изданий — из-за своего «богатого» внешнего вида).CD-Audio использует для дискретизации аналогового звука частоту 44,1 кГц. В SACD частота в 64 раза бо́льшая — 2,8224 МГц. CD использует 16 бит для каждого семпла, так что поток информации здесь составит 16×44100 Гц на канал или 705 600 бит/с на канал. DSD использует 1 бит на отсчет, так что поток информации составит 2 822 400 бит/с на канал. Это в 4 раза больше, чем у CD.
Формат DVD-Audio (разрядность — 24 бит, частота дискретизации — 192 кГц), передает сигнал с точностью 24 бит, что обеспечивает кодирование амплитуды сигнала с высокой точностью вплоть до частоты Найквиста, равной 96 кГц, при этом этот формат записи использует то же PCM-кодирование, что и CD-Audio.
Особенности кодирования
При записи SACD-дисков используется однобитный цифровой формат записи Direct Stream Digital (DSD), обеспечивающий более высокое качество звучания, по сравнению с обычным CD, благодаря более высокой частоте семплирования (до 2,8224 МГц).
Действительно, хотя повышение разрядности и частоты дискретизации PCM-систем реально улучшали качество звука, эти улучшения становились все менее значительными. Очевидна и причина этого — фильтрация. В PCM-системе на входе необходимы фильтры с очень крутой характеристикой, чтобы подавить частоты, равные половине частоты выборки или превышающие ее. При частоте выборки 44,1 кГц фильтры типа «кирпичная стена» должны пропускать частоту 20 кГц и при этом отсекать частоту 22,05 кГц — задача не самая легкая. Кроме того, при записи и воспроизведении неизменно добавляются шумы квантования.
Каждое увеличение частоты выборки облегчает работу для фильтра, но простым увеличением частоты не решить проблемы появления шумов квантования при многоступенчатых процессах аналого-цифровых и цифро-аналоговых преобразований.
Однобитный формат записи — это прямая запись однобитного выходного сигнала с АЦП типа дельта-сигма, причем этот сигнал имеет замечательные характеристики: динамический диапазон более 120 дБ, частотная характеристика от 0 до 100 кГц. При таком сочетании частотной характеристики и динамического диапазона формат DSD не имеет соперников среди других записывающих систем, цифровых или аналоговых.
Запись напрямую такого однобитного сигнала является альтернативой существующим форматам мастер-записи. Подобная запись устраняет необходимость процессов децимации и интерполяции для аналогового ввода/вывода. При этом упрощается структура (блок-схема) записывающей системы, поскольку исчезают параллельные информационные связи многоразрядных цифровых слов и необходимость их синхронизации.
Как и в обычных PCM-системах, аналоговый сигнал сначала конвертируется в цифровой с помощью дельта-сигма модуляции при частоте дискретизации в 64 раза большей, чем номинальная частота дискретизации. Но DSD записывает одноразрядные импульсы напрямую, тогда как обычные системы затем преобразуют одноразрядный сигнал в многоразрядный PCM-код. В результате DSD дает цифровое одноразрядное представление аудиосигнала. Положительное изменение амплитуды будет представлено всеми «1». Отрицательное — всеми «0». Нулевая точка будет представлена сменой двоичного числа. Поскольку значение амплитуды аналогового сигнала в каждый момент представлено в виде плотности импульсов, этот метод иногда называют Pulse Density Modulation (PDM).
Полученный таким образом поток импульсов имеет примечательные свойства. Как и PCM, DSD по своей природе устойчив к искажениям, шуму и детонации записывающей аппаратуры и передающих каналов. Но, в отличие от PCM, DSD, как принцип преобразования, гораздо ближе к аналоговой передаче сигнала. Цифро-аналоговое преобразование может быть легко получено с помощью аналогового низкочастотного фильтра.
Поток дельта-сигма импульсов является достаточно «шумным». Сверхвысокое отношение сигнал/шум, которого требует DSD в звуковом диапазоне, достигается с помощью шумоподавляющих фильтров пятого порядка, что эффективно сдвигает шумы вверх по частоте за пределы звукового диапазона.
Шумоустойчивость
Действительно, хотя повышение разрядности и частоты дискретизации PCM-систем реально улучшали качество звука, эти улучшения становились все менее значительными. Очевидна и причина этого — фильтрация. В PCM-системе на входе необходимы фильтры с очень крутой характеристикой, чтобы подавить частоты, равные половине частоты выборки или превышающие ее. При частоте выборки 44,1 кГц фильтры типа «кирпичная стена» должны пропускать частоту 20 кГц и при этом отсекать частоту 22,05 кГц — задача не самая легкая. Кроме того, при записи и воспроизведении неизменно добавляются шумы квантования. К тому же семплирование на частоте Найквиста приводит к значительному сдвигу между фазовой и частотной характеристиками фильтров в верхней четверти частотного диапазона. В однобитной системе, напротив, фазовая характеристика в верхней части звукового спектра не подвержена воздействию фильтра типа «кирпичная стена». Этот аспект особенно важен, когда система цифровой обработки является частью петли обратной связи, потому что в этом случае сдвиг фазы меньше, а стабильность системы и достоверность звучания выше.
Другой особенностью этого формата является его поведение в условиях возможной перегрузки. Одноразрядные кодеры высокого порядка должны иметь возможность управления перегрузкой, чтобы не пострадала стабильность. Это обеспечивается с помощью выбора соответствующей передаточной характеристики. Одноразрядный формат не дает, в отличие от многоразрядного, эффектов aliasing и clipping при перегрузках.
Устойчивость к ошибкам
Поскольку любой бит одноразрядного формата несет одно и то же количество информации, эффект каждой ошибки не зависит от того, какой бит является ошибочным. В этом одноразрядный формат выгодно отличается от многоразрядного кодирования, в котором ошибка в старшем значащем бите (MSB) сказывается в 2^L (L — длина слова) больше, чем ошибка в младшем значащем бите (LSB). Для 20-битной системы записи это означает, что ошибка в MSB скажется примерно в 1 млн раз больше, чем в LSB.
Системы опережающей коррекции ошибок (такие, как используются в формате CD) исходят из предположения, что все биты имеют одинаковый информационный вес, поэтому они одинаково защищают каждый бит. Для аудиосигнала это не подходит, поэтому страдает эффективность таких систем — младшие значащие биты получают избыточную защиту, а старшие значащие биты не получают достаточной защиты. Более того, эффект от ошибок не является пропорциональным, так как зависит от того, в каком бите произошла ошибка. Это приводит к быстрой деградации сигнала при превышении определенного уровня плотности ошибок.
Фактически, максимальный эффект от каждой отдельной ошибки — это функция частоты избыточной дискретизации. эффект от ошибки обратно пропорционален коэффициенту избыточной дискретизации. Например, если коэффициент 64, ошибка, вносимая одним битом, будет примерно 1/64 максимального уровня, то есть ее уровень на 36 дБ меньше максимального уровня сигнала на выходе.