П'ятничний формат: ДНК і вирішення проблеми зберігання даних



На думку співробітників компанії Backblaze, яка не так давно провела експеримент з обчислення тривалості роботи жорстких дисків, деякі HDD здатні зберігати інформацію без пошкоджень близько 10 років – не так вже й багато.

На жаль, сучасні запам'ятовуючі пристрої не можуть служити вічно. Саме тому дослідники намагаються знайти спосіб, що дозволяє зберігати дані як можна довше – в ідеалі кілька мільйонів років.


Вічний накопичувач

Дослідники з Швейцарської вищої технічної школи Цюріха вважають, що відповідь може лежати в ДНК. словам Пітера Шэндболта (Peter Shandbolt), який написав матеріал про перспективи зберігання даних для блогу CNN, структура ниток ДНК складна і в той же час компактна, так що «один грам ДНК теоретично здатний вмістити всі дані таких великих компаній, як Google і Facebook, причому навіть із запасом».

Говорячи технічною мовою, в одному грамі ДНК може зберігатися до 455 екзабайт інформації, де один екзабайт дорівнює мільярду гігабайтів.

Процес синтезу послідовності ДНК схожий на нанизування на нитку перлів. У цьому випадку інформація кодується у вигляді традиційних нулів і одиниць.

Ці значення присвоюються певним хімічним компонентам, мономерам, які за допомогою хімічних методів з'єднуються в один ланцюг, утворюючи полімери. Щоб прочитати записану інформацію, достатньо скористатися мас-спектрометром – пристроєм для зчитування ДНК-послідовності.



Знаменита подвійна спіраль ДНК

«Копалини» дані

Інформація про геном живого організму може досить довго зберігатися в скам'янілостях: так був розшифрований геном полярного ведмедя, який жив 110 000 років тому, і геном коня, вік якої становить 700 000 років.

За словами представників Швейцарської вищої технічної школи Цюріха (ETH Zurich), вони хочуть «поєднати можливості зберігання на ДНК великого обсягу даних зі стабільністю ДНК, виявлених у викопних рештках».

«Ми відшукали незвичайні способи роботи з ДНК, що дозволяють зробити її досить стабільною, – повідомляє Роберт Грасс, викладач кафедри хімії та прикладних біологічних наук ETH Zurich, в інтерв'ю CNN. – Ми хотіли пов'язати воєдино можливості ДНК, а саме високу ємність зберігання даних і її археологічні особливості».
Таким чином, процес зберігання інформації буде виглядати так: ДНК, ув'язнена у скляну оболонку (інертну і нейтральне середовище), зберігається при низькій температурі і в сухому стані (на ДНК негативно впливають вода і кисень).

У таких умовах інформація в її нитках може залишатися неушкодженою протягом декількох тисяч років.

«Ми змогли досягти того, що створена нами ДНК із збереженою на ній інформацією розпадається з такою ж швидкістю, що і ДНК, знайдена в скам'янілостях. Якщо так піде далі, незабаром у нас з'явиться можливість зберегти дані на строк до мільйона років».

Перші результати

Для перевірки того, як довго дані можуть зберігається в ДНК, вчені закодировали 83 кілобайта даних.

Матеріалом послужили Швейцарський Федеральний втомившись від 1291 року і палімпсест Архімеда. Вибір цих документів, на думку вчених, показує не тільки потенційну придатність методу, але і його історичну важливість. За оцінками представників ETH Zurich, ці дані залишаться незмінними від 10 000 до мільйона років (якщо ДНК зазнає заморожування).

Якщо говорити про кількість інформації, то Джордж Черч (George Church), професор генетики з інституту Вайса (Гарвард), поставив всі попередні рекорди за кількістю записаних даних в ДНК на коліна, йому з колегами вдалося домогтися щільності запису в 5,5 петабитов (близько 700 терабайт) на кубічний міліметр рідини – він создал 70 мільярдів копій своєї книги з генетики. Для сучасних електронних носіїв такі показники поки є недосяжними.



Однак, як і завжди, в роботі з ДНК-сховищами є свої складності, наприклад вартість шифрування даних. Проте дослідники впевнені, що у міру розвитку медичних технологій, вона буде знижуватися.

«Раніше вартість розшифровки генома людини становила кілька мільйонів доларів. Сьогодні її можна провести за кілька сотень доларів, – заявляє Грасс. – Нові технології для проведення медичного і геномного аналізу можна буде незабаром запровадити і в світ IT».
Але найбільшою перешкодою, яка поки що не дозволяє використовувати ДНК для зберігання інформації на практиці, является час.

Навіть з використанням сучасних технологій розшифровки, читання молекули ДНК займає багато годин – на кілька порядків більше, ніж читання звичайного файлу на комп'ютері. Тому цей тип сховищ не підходить для часто використовуваних даних.

Однак вони відмінно підійдуть на роль надійних довгострокових сховищ – наприклад, це відмінний варіант для створення «капсули часу».

P. S. Матеріали по темі нашого блогу:



Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.