Цифровий звук: DSD vs PCM

Цифровий звук. Як же багато міфів крутиться навколо цієї фрази. Скільки суперечок виникало між любителями зручності і якості цифри і прихильниками «живого повітряного» вінілового звуку помноженого на «тепле лампове звучання. Крім того, є чимало суперечок і між любителями «цифри»: достатньо 16х44.1 чи потрібно 24х192? Що краще: мультибіт або дельта-сигма? CDDA або SACD? PCM або DSD? У цій статті я спробую простою мовою викласти ази цифрового звуку, а так само більш детально зупинюся на порівнянні двох типів кодування аналогового сигналу в цифровий: DSD, PCM.

Для початку відповімо на запитання, що є цифровий звук? Чим він відрізняється від аналогового? Якщо говорити коротко, математичною мовою, аналоговий звуковий сигнал — безперервна функція, цифровий звуковий сигнал — дискретна функція. Що це означає?

Аналоговий сигнал

Якщо намалювати в уяві графік синусоїди (саме так найчастіше зображують звукову хвилю): то, як би ми його не збільшували, намагаючись розглянути всі деталі, — завжди будемо бачити плавну гладку лінію: це аналоговий звуковий сигнал (рис. 1).


Рис. 1. Аналоговий сигнал

Аналоговий звук (запис) має безліч параметрів, за допомогою яких можна оцінити його якість. Розглянемо три найважливіших: частотний діапазон, динамічний діапазон, спотворення.

Частотний діапазон — набір частот, що містяться в звуці. Прийнято вважати, що частотний діапазон людського слуху 20… 20.000 Гц (іноді вказується 16 — 22.000 Гц). Сам по собі частотний діапазон музики жодного інтересу в плані оцінки якості не представляє (наприклад, частотний діапазон все того ж злітаючого літака буде дуже широкий, а вокальної партії тенора — набагато вужчий). Якісним параметром, скажімо, навушників є потенційний частотний діапазон, а він оцінюється за допомогою амплитудно-частотної характеристики (АЧХ). Ідеальна АЧХ — пряма лінія на всьому діапазоні частот слуху – означає, що джерело звуку не підсилює і не послаблює якісь окремі частоти, а значить видобувають звук збігається з оригіналом.


Рис. 2. АЧХ MP3 файлу 256 kbps

Динамічний діапазон (ДД) — різниця між самим тихим і самим гучним звуком. Вимірюється гучність в децибелах (дБ). Прийнято вважати, що максимальна гучність, не завдає травм людині — це 130 дБ — звук злітаючого літака, а мінімальна слышимая гучність — 5… 10 дБ — на рівні шелесту листя в маловетреную погоду. Природно, що шелест листя на тлі злітаючого літака розібрати буде неможливо, та і слухати музику з рівнем 130 дБ вкрай неприємно. Тому прийнято вважати, що комфортний ДД для прослуховування музики — 80… 100 дБ.

Искажения – ні що інше, як відхилення сигналу від оригіналу.

Принципи подання звуку в цифровому вигляді

Що ж відбувається при оцифровування аналогового звуку? Не будемо заглиблюватися в технічні аспекти, розберемо все, як кажуть, на папері: для цього намалюємо нашу уявну «ідеальну» синусоїду і будемо вимірювати величину сигналу через рівні проміжки часу (цей процес називається дискретизацією або квантованием): ми отримаємо якийсь послідовний набір значень — це і буде наш цифровий сигнал, отриманий методом імпульсно-кодової модуляції (ІКМ) (рис. 3).


Рис. 3. Перетворення аналогового сигналу в PCM

Два основних параметри якості сигналу PCM — це частота і розрядність. Частота — це кількість вимірювань за одну секунду, чим їх більше — тим з більшою точністю передається сигнал. Частота вимірюється в герцах: 44100 Hz, 192000 Hz та ін. Розрядність — кількість можливих значень величини сигналу (точність передачі величини). Чим більше варіантів — тим більше точність сигналу. Розрядність вимірюється в бітах: 16 bit (65.536 можливих значень, ДД 96 дБ), 24 bit (16.777.216 значень, ДД 144 дБ) та ін

Але це не єдиний варіант подання звукової хвилі в цифровому вигляді. Є спосіб позбутися від такого параметра, як розрядність, залишити тільки два рівня амплітуди: -100% і +100% (0 або 1). Щоб домогтися цього, не втративши в якості, — потрібно багаторазово збільшити частоту зчитування величини сигналу (рис. 4).


Рис. 4. Перетворення аналогового сигналу в DSD

Такий вид подання цифрового звуку називається імпульсно-щільнісний модуляцією, найчастіше для нього використовується абревіатура DSD. Фактично, єдиний якісний параметр такого сигналу — частота. Але так як частоти використовуються дуже високі (від 2.822.400 Hz), такі цифри складно запам'ятати, прийнято ділити частоту DSD сигналу на 44.100 Кгц. Отримане число і є показником якості: DSD64 (ДД 120 дБ), DSD128, DSD256 і т. д.

Відновлення аналогового сигналу з «цифри»

Але оцифровування аналогового сигналу – це півсправи. Для прослуховування цифрової музики потрібно виконати зворотне перетворення. Для початку розглянемо, яким чином перетворити в цифровий звук DSD потік. Як ми вже знаємо, цей потік представляє з себе високочастотний (2,8 МГц і більше) дворівневий сигнал, середня величина цього сигналу змінюється зі звуковою частотою. Тобто, якщо підходити до вирішення завдання максимально просто, — потрібно відфільтрувати всі високочастотні складові DSD потоку, залишивши тільки корисний сигнал (частоти до 20...22 кГц). Робиться це за допомогою аналогового фільтра низької частоти (ФНЧ). Найпростіший ФНЧ – це RC ланцюжок. Сигнал отриманий, після проходження цього ланцюжка, показаний на рис. 5.


Рис. 5. Відновлення аналогового сигналу з DSD

Як бачимо, отриманий графік лише віддалено нагадує вихідну синусоїду. Але не забуваємо, що ми «застосували» найпростіший фільтр, покращуючи схему фільтра можна досягти практично повної відсутності високочастотного шуму і отримати аналоговий звук з хорошими якісними показниками.

Для відновлення аналогового сигналу цифрового PCM недостатньо лише аналогового ФНЧ, потрібно попередньо розшифрувати цифрові дані, для цього використовуються цифро-аналогові перетворювачі (Цапи). Бувають вони різних типів, але описувати їх всі в завдання даної статті не входить. Зупинимося на 2-х найпоширеніших типах в звукової техніки. По-перше, це так званий ЦАП сходового типу (його ще називають мультибитным). Як ви, напевно, здогадалися, такий ЦАП перетворює PCM потік цифрових даних у потік величин звукового сигналу, які на графіку виглядають як сходи (рис. 6). Як і у випадку DSD, обов'язково використання аналогового фільтра для згладжування «сходинок».


Рис. 6. Відновлення аналогового сигналу PCM

Найчастіше, в таких перетворювачах використовується проміжна передискретизация цифрового сигналу PCM в більш високі значення частоти (наприклад, 192 кГц): це зменшує «сходинки», що дозволяє спростити схему аналогового фільтра.

Другий тип ЦАП – дельта-сигма – використовує передискретизацию в ще більші значення частоти з одночасним зменшенням розрядності до одного біта. Нічого не нагадує? Це ж знайомий нам DSD сигнал! Як далі обробити такий сигнал і перетворити його в аналоговий, ми вже розглядали вище.

Застосування PCM і DSD, переваги/недоліки

Де ж ми можемо зустріти кожен із способів кодування? PCM дуже поширений формат: CDDA диски, DVD Audio, файли MP3, FLAC, ALAC, AAC, звук у фільмах, і далі, і далі, простіше сказати, коли не-PCM. Super Audio CD диски, DSD диски, файли DSF, DFF — це DSD формат. Що ж все-таки краще? При відтворенні якогось формату ми отримаємо більш якісний звук?

У статтях, присвячених DSD формату, описано безліч переваг перед PCM, але всі описувані переваги вірні чи це міфи, придумані для обивателів, не розбираються в технічній складовій, щоб відвоювати ринок, щільно зайнятий PCM форматом? Давайте коротенько пройдемося по списку.

  1. Перша перевага, що люблять наводити прихильники DSD, досить розпливчасте — помехоустойчивость і зниження впливу помилок. Дивно чути про різну завадостійкість в цифровому світі: обидва формату схильні перешкод рівно настільки, наскільки схильна перешкод книжка в цифровому форматі. Тривалість зберігання будь-якого цифрового формату або якість передачі його між пристроями залежать тільки від носія та способу передачі, але не від самого формату. Отже, завадостійкість однакова. А що з приводу зниження впливу помилок? Припустимо, ми зберігаємо 2 альбоми на оптичних дисках (один PCM, інший DSD), що буде, якщо диск подряпати? При читанні пошкодженого носія будуть виникати помилки, але наскільки вони критичні? В PCM кодуванні використовуються багаторозрядні числа, помилка в старшому розряді дуже критична (як приклад, різниця між десятковими числами 11 і 91): на слух це буде відчуватися, як клацання. У DSD кодуванні один біт інформації має невелику вагу в загальному потоці, нечасті помилки будуть викликати лише підвищення фонового шуму, що на слух буде менш помітно.
  2. Друга перевага описується трохи конкретніше: більший динамічний діапазон порівняно з PCM. Що ж, і тут є певне лукавство, ДД більше лише у порівнянні з класичним CDDA формат: 120… 140 дБ проти 96 дБ. Якщо ж порівнювати, наприклад, з DVD Audio — ДД приблизно однаковий.
  3. Третя перевага: DSD більш простий технічно. Ось тут посперечатися не з чим: більш просте декодування сигналу, відсутність необхідності синхронізації і буферизації потоку при передачі сигналу з одного пристрою на інший — повна перемога DSD. До речі кажучи, на тлі цього переваги дивно бачити захмарні ціни на апаратуру, що підтримує відтворення DSD.
  4. Ну і ще одна перевага, яку люблять наводити фанати DSD: музика у цьому форматі найбільш близька до оригінального аналогового звуку. Аргументується це тим, що сучасні аналогово-цифрові перетворювачі (АЦП) — працюють на принципі дельта-сигма модуляції, тобто ці АЦП видають цифровий DSD потік. І ось знову лукавство: запис буде повністю оригінальною тільки в разі прямого запису живого виступу або при оцифруванні готової аналогової запису з якісного носія. Операції відомості, накладення ефектів, мастерингу, навіть простий підстроювання гучності — усього того, без чого не може обійтися створення студійного альбому, — неможливі для цифрою DSD запису через відсутність нормальних алгоритмів її обробки. Це означає, що всі ці операції проводяться з PCM формат, і тільки після цього готова PCM запис конвертується в DSD. Втім, потрібно відзначити, що перетворення PCM > DSD і назад — досить точне: лише трохи зростає шум за межами реального динамічного діапазону (рис. 7). А значить, не має особливого значення, у якому форматі слухати запис: PCM Hi-Res або DSD — обидва формати з якісним характеристикам дуже схожі. Так само, фактично, немає сенсу купувати окрему звукову карту для відтворення DSD, послухавши ради приятеля, фаната даного формату.


    Рис. 7. Динамічний діапазон / шум при перетворенні між DSD і PCM

Висновки

Отже, що вибрати DSD або PCM? Однозначної відповіді немає і бути не може: PCM 24 біт 92 кГц і DSD128, наприклад, дуже схожі за якісними характеристиками, причому ці характеристики краще, ніж у апаратури, на якій ці формати будуть програватися, а значить подальше збільшення якості цифрових форматів для відтворення на даному етапі недоцільно. При оцінці якості звуку різних форматів високої чіткості на перший план виходять суб'єктивні відчуття, адже не якістю єдиним живиться людський мозок: дизайн апаратури, її вартість, і, головне, самопочуття і настрій слухача дають набагато більший ефект на відчуття від прослуховування музики. А значить вибирайте те, що подобається особисто вам, і не нав'язуйте іншим свою думку. Всім приємного прослуховування!

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.