Інформація на порозі безсмертя, частина 2: ДНК-накопичувач

Уявіть, що ви можете зберігати кожен біт інформації в такому ж маленькому, як мікроскопічна крапелька крові. Дивно? А адже це саме те, до чого вже давно прагнуть вчені   зберігання даних в ДНК. Куди там сховищ 5D, про яких ми нещодавно писали! Що це за новий і незвичайний тип сховища? Як це працює? А найголовніше, який його потенціал?



ДНК (дезоксирибонуклеїнова кислота) — це біологічна полімерна молекула, яка несе генетичну інформацію про розвиток і функціонуванні організму. Майже все живе на Землі зберігає свою генетичну інформацію в вигляді ДНК. ДНК складається з мономерів (нуклеотидів), які складаються з цукру (дезоксирибозы), азотистої основи (аденін, гуанін, цитозин, тимін) і фосфорної кислоти. Порядок розташування нуклеотидів і азотистих основ визначає генетичний код: це те, що регулює всі біологічні процеси.


Склад і структура молекули ДНК

Вже відомо багато властивостей ДНК, а маніпуляції з ДНК широко використовуються у та медицині: генетично модифіковані організми, щеплення, лікування ВІЛ, генна терапія. ДНК   тільки біологічна суміш: своєю суттю, це хімічний полімер, що володіє фізичними властивостями, який не міг залишитися поза увагою хіміків, фізиків і інженерів. ДНК може стабілізувати наноструктури, зберігати терабайти інформації і бути важливим компонентом нової інформаційної ери.

ДНК — це практично єдиний спосіб зберігання, який може існувати тисячу або навіть мільйон років, і ДНК стародавніх скам'янілостей тому доказ. Молекула ДНК стійка навколишньому середовищі, вчені навіть знайшли 300000-річну мітохондріальну ДНК ведмедя і розшифрували її. Уявіть, що вся людська історія в вигляді тексту, зображень, відео та аудіо можуть бути штучно закодована в молекулі ДНК і збережена для наших нащадків на тисячі років.

Крім того, робота з інформацією заснована на використанні двійкового коду (1 або 0). ДНК має більший потенціал для зберігання даних, оскільки в кожен біт можна закодувати чотири літери (А, Р, Т, С), а синтезовані молекули ДНК з певною послідовністю нуклеотидів зможуть вмістити обсяг інформації до 1 Зб (млрд. терабайт) всього в кількох грамах ДНК.


Процес запису даних в ДНК

&Nbsp;деякими оцінками, ДНК зможе вміщати обсяг даних, що міститься в ста промислових центрах обробки даних, і зберігати його в просторі розміром з взуттєву коробку.

ДНК досягає цього двома способами. По-перше, одиниці кодування дуже малі, менше половини нанометра розміром, тоді як транзистор сучасного комп'ютерного накопичувача не менше 10 нанометрів розміром. &Nbsp; водночас така різниця в розміри збільшує ємність зберігання не в 10, а тисячу і в 100 000 разів. Ця різниця виникає від великої переваги ДНК: тривимірності.

Пара ложок дьогтю
Звичайно, є деякі обмеження в використання ДНК в якості пристрою зберігання. Наприклад, синтезувати довгі послідовності ДНК дуже довго, крім того, ціна цих маніпуляцій є відносно високою, а при хімічному синтезі ДНК велика ймовірність помилки. Але вчені шляху до подолання цих труднощів: по-перше, для зберігання інформації використовуються тисячі коротких молекул ДНК (до 200 нуклеотидів) замість одного або кількох дуже довгих полімерів. По-друге, вартість синтезу ДНК і секвенування знижується в геометричній прогресії в протягом року: вартість одного мегабайта кодування становить близько $500 (три рази менше, ніж два роки тому), а його отримання коштує близько $200.


Підвищення швидкості секвенування з плином часу

У 2013 році команда з Європейського Інституту Біоінформатики відзвітували про успішної запису 739 кілобайт даних в ДНК   тому числі кольорового зображення, 154 сонетів Шекспіра і уривок з промови Мартіна Лютера Кінга «У мене є мрія». Нещодавно вчені з Інституту Хімії та Біоінженерії Цюріха розробили новий покращений метод кодування даних і виправлення помилок у час секвенування ДНК, а також збільшили ефективність зберігання   тепер молекула ДНК, укладена в оболонку з силіконового скла, може зберігатися до 1 000 000 років при температурі -18°C.

ДНК = RAM?
Те, що робить зберігання даних ДНК унікальним, крім самого носія, це те, що код не працює як жорсткий диск, а більше нагадує оперативну пам'ять комп'ютера. Зберігання даних в ДНК схоже на оперативну пам'ять комп'ютера тим, що не має значення, де саме в ланцюжку ДНК зберігаються дані   витягти їх можна звідусіль.
Тут варто відзначити суперэффективную структуру зберігання ДНК в вигляді подвійної спіралі. Хроматин, білкова система ДНК, яка становить хромосоми, це суті дуже складний механізм, що дозволяє молекулі ДНК скручуватися досить щільно, при цьому, швидко розкручуватися тоді, коли організм гостро потребує певних ділянках ДНК.

Процес вилучення певної ділянки ДНК

Ця природна сили хроматину система, яка дозволяє будь гену бути витягнутим з будь-якої частини геному з приблизно однаковою ефективністю, привела дослідників до порівняно ДНК і версією комп'ютерної пам'яті з довільним доступом, або RAM. До жаль, тут схожість закінчується, і з'являється основний недолік   швидкість. ДНК може зберігатися майже вічно, але і чекати завантаження файлів доведеться роками.

ДНК значно важче і читати повільніше, ніж звичайні комп'ютерні транзистори, , тобто плані швидкості доступу ДНК схожа на оперативну пам'ять комп'ютера менше, ніж будь-флешка або жорсткий диск.

Це відбувається тому, що неймовірні здібності еволюційного рішення зберігання даних необов'язково включають в себе миттєве читання інформації. Для читання з молекули ДНК необхідно розплутати складну структуру хроматину, потім розплутати саму подвійну спіраль ДНК, зробити копію послідовності і запакувати все назад   ясно, що часу на це потрібно чимало.

Для читання даних необхідно додати додатковий крок. Читання інформації досягається з використанням старої техніки біотехнологічних лабораторій, званої полімеразної ланцюгової реакцією (ПЛР) для ампліфікації, або неодноразового повторення, послідовності, яку ми хочемо прочитати. Весь зразок потім секвенируется, і всі численні повторення однієї і тієї же послідовності відкидаються: те, що залишається, і представляє інформаційний інтерес. Ці ділянки ДНК позначаються невеликими цільовими послідовностями, які дозволяють розпочати процес реплікації.


Розщеплення ДНК для читання інформації

У клітинах гени включаються і відключаються за рахунок зміни доступності цих цільових послідовностей. Це можна зробити з допомогою намотування і розмотування хроматину, прямого доповнення або вилучення блокатора білка, або навіть взаємодії з іншими областями геному. Теоретично цей процес можна було б зробити більш досконалим, але це вимагало б високого рівня складності в білкової інженерії, який на справжній момент поки не досягнутий.
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.