Тенденції резервного копіювання — «золотий вік» дискет і сучасний погляд на мережевий бекап


Плівковий архів, майже сучасність

Історично перші методики резервного копіювання були досить простими: документи або прямо переписувалися (що дозволяло зберігати дані з них, якщо мова йшла про те технічному), або ж переносилися на плівку. Плівка з чорно-білими фотографіями може зберігатися до 130 років без суттєвих викривлень, і з неї можна надрукувати декілька копій документа.

Природно, з появою можливості оцифровувати документи змінилося майже все і відразу. І я б хотів розповісти про те яскравому періоді — з початку 90-х по теперішній час, коли технології змінювалися досить сильно. А почнемо ми, мабуть, з того, що практично всі цифрові носії вкрай недовговічні і ненадійні.

Проблема резервного копіювання даних почала гостро вставати, мабуть, тільки в останні століття. Звичайно, в Єгипті, Стародавній Греції, в окремих стародавніх державах на території сучасного Китаю були паперові або папирусные бібліотеки, але як такої індустрії бекапа не існувало.

Резервне копіювання знадобилося індустріально вже на самому початку двадцятого століття, коли з'явилися реально дуже великі накопичені дані. Першими масовими цифровими носіями інформації стали гнучкі диски: спочатку восьмидюймовые (мало хто з старожилів пам'ятає ці здоровенні конверти з односторонніми дискетами), потім — куди більш компактні пятидюймовые (5,25).



Нагадаю, дискета являла собою конверт з антифрикційними прокладками, всередині якого знаходився пластиковий диск з магнітним покриттям. Фактично розвиток технології магнітної плівки, але тільки з заміною, власне, плівки на диск. Зчитувалась дискета з допомогою головки дисковода, фактично ковзає по поверхні диска. Дискети по мірі використання могли різко піти у відмову із-за фізичного зносу. Чим більше ви читаєте або пишете, тим більше подряпин залишається на диску від погано откалиброванной головки дисковода, від того, що диск пішов хвилею після зберігання або транспортування і почав натикатися на голівку, просто від того, що він крутиться всередині конверта. Будь-яка порошинка, що потрапляє всередину конверта, ставала джерелом подряпин, не критичних для даних, але все-таки неприємних. Друга проблема була в зберіганні — дискети размагничивались. Деякі могли витримати і десятиліття, але набагато частіше відмовляли за 2-3 роки.

До появи жорстких дисків, дискет вантажилися, на них працювали як на основному системному диску, і нормальною практикою було розміщення в системному блоці двох дисководів: одного для дискети з ОС, другого — для робочих даних. Якщо софт був великий, то доводилося грати у «вставте диск 2». Наприклад, забігаючи вперед, наша система резервного відновлення містилася на 4 дискетах формату 3,5 дюйма, по 1,44 мб, треба було вставляти їх по черзі, по мірі завантаження.

Важливий культурний момент. Зверніть увагу, в тому ж «домашньому» DOS файл було чотири атрибути: прихований, тільки для читання, системний і архівний. Read-only зрозуміло для чого, прихований — щоб користувач випадково не натрапив, системний — це зв'язка RO і прихованого плюс особливі застереження від ОС при діях з файлом, а архівний — це прапор того, що файл був забэкаплен. При зміні файлу атрибут знімався, і файл знову підлягав копіювання на дискету в кінці тижня.



Звичайна ємність 5,25-дискети становила спочатку 180 кілобайт, потім «народні» 360 кілобайт, а потім — 1,2 мб. При цьому сам диск дозволяв за фактом записати більше: наприклад, на 360-килобайтной дискеті була можливість зберігати більше 500 кілобайт. Народний «лайфхак» виглядав так: берете 360-килобайтную дискету і форматуєте її під 1,2 мб. Потім ретельно перевіряєте тим же «Скандіском» або «Диск Дестроером Доктором». Виходить трохи більше місця для запису. Записуєте, несете одному з флоппонету, швидко копіюєте — і ось вдалося зробити, що хотілося, за один похід.

Потім з'явилася досить вдала для бекапа пара з невеликого жорсткого диска і дискет. 20 і 50-мегабайтні HDD, поширені в серії 386-х персональних комп'ютерів, здавалися тоді просто нескінченністю. Цілком забекапіть їх на дискети було досить складно, тому зберігалися тільки ключові дані.

Трохи раніше цього періоду широке поширення отримав бекап великих некритичних даних на відеоплівку, тобто на звичайні відеокасети. Використовувалося спеціальне пристрій, здатний писати на магнітну плівку і коригувати помилки. Оскільки відсоток помилок читання просто приголомшував, використовувався досить високий рівень надлишковості. Власне, саме на аналогових технологій зберігання відпрацьовувалися алгоритми відновлення даних. Найпоширеніший спосіб — писати дані певним розвитком коду Хеммінга N частин, де за будь-якого N-1 (при пошкодженні одного будь-якого з сегментів) можна відновити інше. Технологія, напевно чудово знайома вам по RAID-масивів.

З появою дискети формату 3,5 дюйма (це гнучкі диски з жорстким корпусом) з'явилася можливість хоч як-то не турбуватися за те, що при зберіганні (не читанні-записи, а саме зберіганні або транспортуванні) дані нікуди не подінуться. Фізичний корпус добре захищав диск від випадкових пошкоджень. Цікаво, що довге життя цього носія у Росії забезпечила податкова: вони дуже довго приймали звіти в цифровому вигляді і тільки на таких дискетах. Можливо, десь ще досі так роблять. Тому вони продавалися навіть у переходах і задорого.

В цей же приблизно період отримали широке поширення в домашньому сегменті програми зразок Double Space (він же DrvSpace пізніше) — те, що ми сьогодні назвали драйвером для роботи з жорстким диском з можливістю запису даних. Всі дані, які надходили на запис, спочатку стискалися, всі дані читання спочатку разархивировались. Все це робилося прозоро для користувача. Виходило, що з 50-мегабайтного HDD можна було отримати 70-мегабайтний. Користувачам подобалося. Природною проблемою було те, що при пошкодженні диска вбивали нерідко взагалі все, а не тільки одну ділянку. Напевно, в плані копії важливих даних, саме тут відбулася важлива зміна у свідомості звичайних користувачів.

Чому я торкнувся цього класу, тому що пізніше, в сучасності, практично всі програмно-апаратні комплекси для зберігання даних або резервування почнуть використовувати ті чи інші способи віртуалізації зберігання. А це даблспейс був один з найпростіших, давніх і при цьому масових варіантів. Пізніше з'являться і дедупликация, і відв'язування від заліза, і гиперконвергентность, але поки що це був просто новий метод роботи з диском.

Передбачалося, що технологія магнітного запису буде розвиватися і далі. З'явилися ZIP-дискети. Люди їх небагато лякалися: начебто дискета, а начебто можна записати хоч 100 мегабайт. На жаль (або на щастя), довго вони не протягнули —японці в цей час впевнено розв'язували задачу запису своєї улюбленої класичної музики в плеєр, і магнітні носії не підходили. З'явилися перші компакт-диски.

Щасливі володарі перших приводів дуже швидко виявили в них баг: читати вони могли, а от писати — ні. З появою друкарських CD-драйвів різко змінилося взагалі всі уявлення про бекапі. Коли музичні хіти пробився рок-альбом «CD-R» групи «750 мегабайт», бекап робився досить просто. 15 хвилин на тиждень, щоб забрати реально великі дані — це було круто. У багатьох були цілі бібліотеки таких дисків.

На жаль, вони теж виявилися недовговічними. R-болванки (для одноразової запису) трималися довше, а RW-диски (багаторазові), особливо широко використовуваних, не дуже хорошої якості, «стиралися» за 2-3 роки лежання в сухому прохолодному місці. Тому для бекапа вони не годилися, і в дата-центрах продовжувала використовуватися стара добра магнітна плівка.

Поширення отримали дзеркальні RAID'и.

Десь у цей момент HDD настільки подешевшали, що сховища стало можна робити на них. Зрозуміло, що технології, підходи, методологія та основні алгоритми були відпрацьовані давно, але саме в момент пошуку нових засобів зберігання (ставили на оптичні носії, flash-пам'ять, фантазували про бионосителях) треба було робити надійні і довговічні речі на ненадійному матеріалі. Вся історія людства так і влаштована, до речі кажучи.

Звідси масове використання ідей коду Хеммінга, сховища з багаторазовим дублюванням дискових підсистем, розподіл даних між ними. Підтягнулися старі добрі архіватори з можливістю захисту даних, переиспользовались патенти на передачу даних в галасливих каналах — і ось ми маємо те, що маємо сьогодні. У більшість сучасних хранилок hi-end в дата-центрах можна з розмахом увіткнути лом, і дані, швидше за все, збережуться в повному обсязі.

Поява і масове поширення flash-пам'яті нарешті змінило свідомість — більше ніхто не розглядав носії як щось постійне. Мова йшла про постійному «рушанні» даних, оновлення і перезапису.

Ми рухалися до цього періоду за дуже зрозумілою парадигмі. Перше, що ми почали продавати, — продукт, який мав доброзичливий GUI (рідкість для системних утиліт на початку 2000-х) і дозволяв звичайному користувачеві (не адміну) робити бекап швидко, просто вміти відновлюватися з нього і прищеплювати звичку копіювати важливі дані. Потрібні технології снепшотов, було багато роботи з диском на фізичному рівні, багато особливостей ОС. Бекап робився на зовнішні носії або сусідні жорсткі диски, і в цілому все було передбачувано. Ось тут є трохи більше деталей від одного з наших перших співробітників.

Принципова зміна почалося з корпоративного сегмента — потрібно було робити бекап в мережу. Чому з корпоративного? Тому що у них ідея геораспределенного дата-центру була нормою. Вже пізніше, після відпрацювання технологій там, ми надали такі можливості користувачу. Домашній користувач спочатку не розумів взагалі, навіщо все це потрібно, і ми готувалися з працею розвивати ідею копіювання хмара.

Тим не менш, досить швидко ідея поширилася, і ми почали стикатися з різким зростанням навантаження на потужності зберігання у віддалених дата-центрах. Доводилося кілька разів змінювати архітектуру, переглядати підходи і відпрацьовувати цілу історію з оптимальним (і при цьому економічним) залізом для зберігання. Відлуння цієї історії є в пості про наші дата-центри та їх підтримку.

Очевидно, така ідея, яка прямо випливає із сучасних тенденцій віртуалізації і розподілу даних — це відв'язування даних від терміналів домашніх користувачів. Вже зараз вони прекрасно знайомі з тим, як бекап з телефону можна вжити на нову «трубку» (і все буде точно таким же), бачать свої файли з відрядження при доступі до бэкапу через веб-агента, користуються тим же «Яндекс.Диском» або «Дропбоксом», і в цілому готові віддавати дані в мережу відносно вільно. Канали теж вже доросли, якщо не вважати яка стрибає через супутник Камчатку, у нас в Росії з інтернетом майже майже скрізь порядок. І завдяки поширенню 3G і LTE нормальний канал є майже скрізь на планеті.

Зрозуміло, що і в парадигмах розвитку зберігання даних, і в історії бекапів можна копатися ще довго. Якщо вам цікаво, скажіть, і я продовжу трохи пізніше. Поки ж найважливіша тенденція: з нудною, але важливою гігієнічної процедури бекап перетворився в щось автоматичне (прийшов додому з планшетом — все збереглося) і само собою зрозуміле. І все йде до того, що скоро бекапа як такого не залишиться, не буде потрібна окрема резервна копія як інстанси, швидше за все, звичайне зберігання даних буде на низькому рівні підтримувати достатню кількість надмірності, щоб не розділяти в свідомості користувача дані і якусь їх копію.

Ми поки що невеличкими кроками йдемо до цього. У новому релізі, наприклад, є локальний бекап для мобілок, плюс тільки що зробили можливість вибирати дата-центр для зберігання відкритої або зашифрованою копії, щоб, наприклад, складати дані в обрану країну.

Якщо цікавоТо заглядайте в Beta Acronis True Image 2017
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.