Доставляємо голос в мобільній мережі: крок 2 — Аналогово-Цифрове Перетворення

В першій частині циклу ми розглянули перетворення людського голосу в електричний сигнал. Тепер, здавалося б, саме час передати цей сигнал до місцезнаходження співрозмовника і почати розмову! Саме так спочатку і надходили. Однак чим більш затребуваною ставала послуга ніж на великі відстані необхідно було передавати сигнал, тим зрозуміліше ставало, що аналоговий сигнал для цього не годиться.
Для того щоб забезпечити передачу інформації на будь-яку відстань без втрати якості, нам потрібно провести друге перетворення Аналогового сигналу в Цифровий.



Ця картинка дає саме наочне уявлення про те, що відбувається при Аналого Цифрового Перетворення (АЦП) а далі ми розглянемо навіщо це потрібно, як відбувався розвиток технології, і які вимоги накладаються на таке перетворення в мобільних мережах.


Ті, хто пропустив або призабув, про що йшлося в першій частині, можуть згадати Як ми отримали із звукових коливань електричний сигнал, а ми продовжимо опис перетворень, переміщаючись по картинці, на якій позначена нова область, цікавить нас в даний момент:



Спочатку давайте зрозуміємо, навіщо взагалі потрібно перетворювати аналоговий сигнал, якісь послідовності нулів та одиничок, які без спеціальних знань і математичних перетворень і почути неможливо.

Після мікрофона у нас є аналоговий електричний сигнал, який можна з допомогою динаміка легко «озвучити», що, власне, і вироблялося в перших дослідах з телефонами: зворотне перетворення «електричний сигнал – звукова хвиля» виконували в тому ж приміщенні або на мінімальній відстані.
Тільки для чого потрібен такий телефон? В сусіднє приміщення можна донести звукову інформацію без усяких перетворень – просто підвищивши голос. Тому постає завдання – почути співрозмовника на максимальній відстані від ініціатора розмови.
І ось тут в силу вступають невблаганні закони природи: чим більше відстань, тим сильніше електричний сигнал в проводах згасає, і через якусь кількість метрів/кілометрів відновити з нього звук буде неможливо.
Ті, хто застав міські дротяні телефони, що працюють з декадно-кроковими АТС (аналоговими телефонними станціями), прекрасно пам'ятають, яку якість голосу часом надавалося з допомогою цих апаратів. А хтось може згадати і такі усіма забуті екзотичні включення «через блокіратор» / «паралельний телефон», коли два телефони в одному будинку включалися на одну телефонну лінію, при цьому, коли один абонент займав лінію, другий був вимушений чекати закінчення його розмови. Повірте – це було нелегко!

Тобто для збільшення кількості одночасних викликів між двома точками, з використанням аналогових ліній нам потрібно прокладати все більше і більше проводів. До чого це може призвести, можна оцінити за міським пейзажам початку минулого століття:



Тому відразу після винаходу телефону, кращі інженери взялися за вирішення завдання: як передати голос на великі відстані з максимальним збереженням якості і мінімальними витратами на устаткування.

Що ж нам потрібно для того, щоб безперервний аналоговий електричний сигнал перетворився в дискретний, закодований послідовностями нулів і одиниць, і при цьому передавав інформацію максимально наближену до оригіналу?

Трохи теорії.

Щоб перетворити будь-який аналоговий сигнал в цифровий, необхідно через певні проміжки часу (крок дискретизації на картинці нижче) зафіксувати амплітуду сигналу з певною точністю (кроком квантування).



Після оцифровки вийде ступінчастий графік, показаний на малюнку. Для максимального наближення оцифрованого сигналу до аналогового необхідно крок дискретизації і крок квантування вибирати як можна менше, при нескінченних значеннях ми отримаємо ідеально оцифрований запис.

На практиці нескінченна точність оцифровки не потрібно, і потрібно вибрати, яка точність може вважати достатньою для передачі голосу з необхідною якістю?
Тут нам на допомогу прийдуть знання про чутливості людських органів слуху: прийнято вважати, що людина може розрізняти звуки з частотою від 20Гц до 22.000 Гц. Це граничні значення для дискретизації, які дозволять передати будь-який звук, сприйманий людиною. Якщо перевести Гц в більш звичні секунди – отримаємо 0,000045 секунди, тобто вимірювання необхідно проводити кожні 4,5 сто-тисячних секунди! Більше того – і цього виявляється недостатньо. Про причини і необхідних значеннях частоти дискретизації розповімо трохи нижче.

Тепер визначимося з кроком квантування: крок квантування дозволяє присвоїти в кожен момент часу певне значення амплітуди вимірюваного сигналу.
У першому наближенні можна просто перевіряти наявність або відсутність сигналу, для опису такої кількості варіантів нам буде достатньо лише двох значень: 0 і 1. В інформатиці це відповідає кількості інформації: 1 біт і бітність запису буде дорівнює 1. Якщо оцифрувати будь-який звук з такою битностью, на виході ми отримаємо переривчасту запис, що складається з пауз і звуку одного тону, навряд чи це можна назвати записом голосу.
Тому доведеться збільшити кількість вимірюваних варіантів амплітуди, наприклад, до 4 (тобто до 2 біт – 2 в ступені 2): 0 — 0,25 мА – 0,5 мА – 0,75 мА.
З такими значеннями вже можна буде розрізнити деякі зміни звуку після оцифровки, а не тільки його наявність або відсутність. Ілюстрація чудово показує, що дає нам збільшення бітності (квантування) при оцифрування звуку, наведена на рисунку:



Тепер, побачивши у властивостях музичного файлу цифри 44 кГц/16 біт, ви можете відразу зрозуміти, що Аналогово-Цифрове Перетворення проводилося з дискретизацією 1/44кГц = 0,000023 секунди і з глибиною квантування 2 в 16 ступеня – 65.536 варіантів значень.

Перші схемотехнічні рішення для виконання АЦП-ЦАП перетворень були завжди великими і повільними:



Зараз ці завдання виконуються в основному процесорі мобільного телефону, який одночасно справляється з величезною кількістю інших завдань:



Якщо провести оцифровку без додаткової оптимізації отриманої цифрової моделі, обсяг отриманих даних буде дуже великий, досить згадати, скільки місця на вашому диску може зайняти звуковий файл у стислому вигляді. Стандартний CD, для прикладу, це 780 мегабайт інформації та всього 74 хвилини звуку!
Після обробки такого файлу з застосуванням алгоритмів оптимізації та стиснення з втратами даних (наприклад, mp3) обсяг файлу можна знизити в 10 і більше разів.

Для наших цілей обсяг отримуваних даних має принципове значення, оскільки їх ще необхідно передати до вашого співрозмовника, і ресурс транспортного каналу дуже обмежений.
Знову завдання для інженерів – максимальна оптимізація обсягу переданих даних зі збереженням необхідної якості.

У розмовної мови, яка звучить під час телефонного діалогу, спектр частот істотно нижче доступного для сприйняття, тому для передачі телефонної розмови можна обмежитися більш вузьким спектром: наприклад 50..7000Гц. Про це ми досить докладно писали в матеріалі про голосових кодеків в мобільних мережах.

Тепер у нас є вихідні дані для початку перетворення – електричний аналоговий сигнал, у спектрі 50-7000Гц, і нам необхідно провести перетворення А-ЦП, таким чином, щоб спотворення сигналу при перетворенні (ті самі сходинки на графіку вище) не вплинуло на якість запису. Для цього потрібно вибрати значення кроку дискретизації і кроку квантування, достатні для повного опису наявного аналогового сигналу.
Тут нам на допомогу прийде одна з основних теорем в області цифрової обробки сигналів — Теорема Котельникова.
В ній наш співвітчизник математично обґрунтував, з якою частотою необхідно проводити вимірювання значень функції для її точного числового представлення. Для нас найважливіше наслідок цієї теореми полягає в наступному – вимірювання потрібно проводити в два рази частіше самої високої частоти, яку нам необхідно перевести в цифровий вигляд.
Тому крок дискретизації для оцифровки розмови, буде достатньо взяти на рівні 14 кГц, а для якісної оцифровки музики — 2 х 22кГц, тут ми і отримуємо стандартні 44кГц, з якими зараз, як правило, створюються музичні файли.

Існує велика кількість найрізноманітніших голосових кодеків, які можуть застосовуватися в дротяних і бездротових мережах, причому кодеки для дротових мереж, в загальному випадку, кодують голос з кращою якістю, а кодеки для бездротових мереж (мереж мобільних операторів) — з трохи гіршою якістю.
Зате ці кодеки генерують додаткові дані, для відновлення одержуваного сигналу в разі неуспішної доставки з-за складних радиоусловий. Ця особливість називається перешкодозахищеністю, і розвиток кодеків для мобільних мереж відбувається в напрямку поліпшення якості передаваного сигналу з одночасним збільшенням його перешкодозахищеності.

У мобільних мережах використовуються цілі класи голосових кодеків, які включають в себе набір динамічно обираних швидкостей кодування, в залежності від поточного стану абонента і якості радіопокриття в цій точці:

Кодек Стандарт Рік створення Діапазон стискаються частот Створюваний бітрейт
Full Rate — FR GSM 06.10 1990 200-3400 Hz FR 13 kbit/s
Half Rate — HR GSM 06.20 1990 200-3400 Hz HR 5.6 kbit/s
Enhanced Full Rate — EFR GSM 06.60 1995 200-3400 Hz FR 12.2 kbit/s
Adaptive Multi Rate — AMR 3GPP TS 26.071 1999 200-3400 Hz FR 12,20
Adaptive Multi Rate — AMR 3GPP TS 26.071 1999 200-3400 Hz FR 10,20
Adaptive Multi Rate — AMR 3GPP TS 26.071 1999 200-3400 Hz FR/HR 7,95
Adaptive Multi Rate — AMR 3GPP TS 26.071 1999 200-3400 Hz FR/HR 7,40
Adaptive Multi Rate — AMR 3GPP TS 26.071 1999 200-3400 Hz FR/HR 6,70
Adaptive Multi Rate — AMR 3GPP TS 26.071 1999 200-3400 Hz FR/HR 5,90
Adaptive Multi Rate — AMR 3GPP TS 26.071 1999 200-3400 Hz FR/HR 5,15
Adaptive Multi Rate — AMR 3GPP TS 26.071 1999 200-3400 Hz FR/HR 4.75
Adaptive Multi Rate — WideBand, AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 23.85
Adaptive Multi Rate — WideBand, AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 23.05
Adaptive Multi Rate — WideBand, AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 19.85
Adaptive Multi Rate — WideBand, AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 18.25
Adaptive Multi Rate — WideBand, AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 15.85
Adaptive Multi Rate — WideBand, AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 14.25
Adaptive Multi Rate — WideBand, AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 12.65
Adaptive Multi Rate — WideBand, AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 8.85
Adaptive Multi Rate — WideBand, AMR-WB 3GPP TS 26.190 2001 50-7000 Hz FR 6.60
Adaptive Multi Rate-WideBand+, AMR-WB+ 3GPP TS 26.290 2004 50-7000 Hz 6 — 36 kbit/s (mono)
Adaptive Multi Rate-WideBand+, AMR-WB+ 3GPP TS 26.290 2004 50-7000 Hz 7 — 48 kbit/s (stereo)

У таблиці перераховані всі кодеки, які використовуються в сучасних мобільних мережах, з них кодеки з динамічним бітрейтом (у яких змінюється співвідношення корисних даних та надлишкових для відновлення даних) мають назву AMR – Adaptive Multi Rate. Кодеки FR/HR/EFR використовуються тільки в мережах GSM.

Щоб наочно уявити наскільки більше даних кодується високошвидкісні кодеки, погляньте на наступну картинку:



Перехід від кодеків класу AMR до AMR-WB майже подвоює кількість даних, а AMR-WB+ вимагає ще на 40-50% більше ширини транспортного каналу!
Саме тому в мобільних мережах широкосмугові кодеки в мобільних мережах ще не знайшли широкого застосування, але в майбутньому можливий перехід на Super Wide Band (AMR-WB+) і навіть на Full Band смугу, наприклад для онлайн трансляцій концертів.

Отже – після виконання другої стадії перетворення голосу, ми замість звукових коливань отримуємо потік цифрових даних, готових до передачі через транспортну мережу.
До моменту зворотного перетворення цифр в аналоговий сигнал ці дані зберігаються майже без змін (іноді в процесі доставки голосу може відбуватися перекодування із одного формату в інший), і подальші перетворення, що відбуваються з нашим голосом, будуть стосуватися фізичного середовища через яку передається виклик.

У наступному матеріалі ми розглянемо, що відбувається між телефоном і базовою станцією і яким чудесним чином сформований нами потік даних без проводів доставляється до обладнання оператора.



P. S. Всім кому цікава тема цифрового зв'язку та історія її розвитку, вкрай рекомендую книгу «І світ загадковий за завісою цифр» автори Б. В. Крук, Р. Н.Попов. З точки зору сучасних стандартів і технологій вона трохи застаріла, але теоретичну й історичну частину автори описують чудово, розбавляючи суху теорію живими прикладами та ілюстраціями.

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.