Рішення VMware для реплікації і аварійного відновлення: vSphere Replication і Site Recovery Manager (SRM)

Site Recovery Manager (SRM)
VMware Site Recovery Manager (SRM) це рішення для забезпечення безперервності бізнесу і аварійного відновлення, призначене для планування, тестування і відновлення ВМ (віртуальних машин) з захищається (основного) сайту (резервний) сайт відновлення.

SRM пропонує 3 підходи до захисту (реплікації) ВМ:

Групи сховищ (datastore groups). Захист ВМ у групах сховищ допомогою сторонніх механізмів реплікації (3-я сторона). Використовується реплікація на рівні масиву Array-based replication).
Окремі ВМ. Захист окремих ВМ на рівні хостів. SRM використовується в комбінації з технологією VMware vSphere Replication.
Політики зберігання (storage policies). Захист ВМ на основі спеціальних політик зберігання. Використовується реплікація на рівні масиву Array-based replication).

SRM забезпечує 2 варіанти відновлення сайту (датацентру):

• Планова міграція. Передбачає доступність і повну функціональність основного і резервного сайтів. Виключає втрату даних, це запланована операція, проходить у робочому порядку, без аварійних ситуацій.
• Аварійне відновлення (recovery). Розраховано на раптове падіння основного сайту, здійснюється переключення на резервний сайт, незапланована операція.

SRM здійснює оркестровку процесів відновлення дата-центру і механізмів реплікації, що забезпечує мінімізацію втрат даних і часу відновлення:

• SRM забезпечує гасіння ВМ на основному сайті і синхронізацію даних між сайтами в разі працездатності основного сайту.
• SRM запускає на резервному сайті реплікуватись ВМ у порядку, що визначається планом відновлення.

SRM дає можливість тестування планів відновлення. Для проведення тестів використовуються тимчасові копії реплицированных даних, що дозволяє виключити вплив на основні процеси обох сайтів.

SRM забезпечує 2 варіанти розгортання в контексті взаємовідносин між сайтами:
• Базовий (односпрямований) варіант – передбачає можливість міграції сервісів основного дата-центру (захищений сайт) на резервну майданчик (сайт відновлення).
• Двонаправлений варіант – забезпечує захист ВМ в обох напрямках. Кожен сайт в утвореній парі є основним, виконуючи при цьому функцію резервного для свого сусіда.

Вимоги до конфігурації сайтів для роботи SRM:

• Ідентичність і сумісність версій SRM, vCenter Server, vSphere Replication на обох сайтах.
• У разі реплікації на рівні масиву Array-based replication), обрана технологія реплікації повинна підтримуватися на обох сайтах, масиви утворювати пару.
• Інфраструктура резервного сайту (хости, мережі, сховища) повинна відповідати ВМ і підтримувати навантаження основного сайту. Резервний сайт може бути навантажений (понад норми) непродуктивними або некритичними ВМ, які можуть бути зупинені у разі відновлення основного сайту.
• Сайти повинні бути з'єднані через надійну IP-мережа, що забезпечує необхідну пропускну здатність.
• Резервний сайт повинен мати підключення до публічним і приватним мережам, доступним основного сайту.

Для роботи технології потрібна установка SRM-серверів (Site Recovery Manager Server) на основному і резервному сайтах. Для невеликих датацентрів допустима установка SRM-сервера на одну систему з сервером vCenter, зокрема установка їх на одній ВМ. Для великих інфраструктур з міркувань навантаженості та доступності доцільна установка SRM-сервера на окремій системі (на окремій ВМ).

Багато-сайтовые конфігурації SRM
Стандартна конфігурація, яка розглядалася вище, включала 2 сайту: основний і резервний. Обидва сайту мають по серверу vCenter, які зв'язуються за допомогою SRM-серверів, що встановлюються на обох сайтах. Таким чином, ВМ належать vCenter основного сайту, можуть бути відновлені на vCenter резервного сайту.

На випадок якщо дата-центр має більше 2х майданчиків SRM підтримує різні багато-сайтовые конфігурації:

• Загальний сайт відновлення — shared recovery site (many-to-one, N:1) – безліч захищених сайтів можуть повторити і відновлювати свої ВМ на один загальний резервний сайт;
• Загальний основний сайт — shared protected site (one-to-many, 1:N) – основний сайт має кілька резервних майданчиків;
• Багато до багатьох — many-to-many (N:N).

Сутності SRM (SRM-сервери) на основному і резервному сайті повинні утворювати декілька, їм присвоюються однакові ідентифікатори (extension ID). Тому, на загальному сайті має бути підняте кількість сутностей SRM дорівнює кількості його сайтів партнерів. Наприклад, якщо загальний сайт відновлення обслуговує 5 захищених сайтів, то на ньому має бути розгорнуто 5 SRM-серверів, утворюють пари з захищеними сайтами. SRM-сервери загального сайту повинні бути встановлені на різних ВМ (хост-машинах) і мати унікальні ідентифікатори. При цьому безліч SRM сутностей загального сайту взаємодіють з одним сервером vCenter, керуючим даним сайтом.

Не можна встановлювати кілька SRM-серверів на одну хост-машину (ВМ). Кожен SRM-сервер повинен мати власну БД. Один сайт відновлення може мати не більше 10 захищаються сайтів.


SRM з реплікацією на рівні масиву Array-based replication)
Даний підхід передбачає реплікацію даних між сайтами на рівні масивів (СГД), за допомогою закладених в них механізмів реплікації. Інтеграція SRM з масивами здійснюється за допомогою storage replication adapters (SRAs), це програмні компоненти, які повинні розроблятися виробниками масивів. Для підтримки Array-based replication на SRM-server кожного сайту повинні бути встановлені SRA для кожного підключеного до нього масиву.


SRM з використанням vSphere Replication
SRM може використовувати vSphere Replication (вбудована і безкоштовна технологія пакету VMware vSphere) для реплікації даних на рівні ВМ між сайтами. Робота vSphere Replication не залежить від типу і моделі сховища, не вимагає інтеграції з масивом розробки SRA) і підтримує сховище сумісний з vSphere.

vSphere Replication дозволяє створювати ланцюжок снапшотов для реплицируемой ВМ на резервному сайті – безліч реплік захищаються машин на різні моменти часу. Таким чином, з'являється можливість вибору оптимального стану ВМ для відновлення серед безлічі снапшотов репліки.


Змішаний режим реплікації
SRM підтримує змішаний режим роботи в якому спільно використовуються обидва механізму реплікації: Array-based реплікація та vSphere Replication. Цей режим вимагає розгортання і налаштування цих технологій на обох сайтах. Налаштування різних механізмів реплікації для одних і тих же ВМ не підтримується. Однак, SRM дозволяє включати в один план завдання по відновленню з різними механізмами реплікації, але для різних ВМ.


vSphere Replication
vSphere Replication це розширення для vCenter, яке забезпечує реплікацію і відновлення ВМ на рівні гіпервізора, а також забезпечує моніторинг та управління даними процесами. Дана технологія є альтернативою реплікації на рівні масиву. Рішення підтримує наступні варіанти реплікації ВМ сайту:

• між сайтом джерела та цільовим сайтом (site-to-site);
• між кластерами межах одного сайту;
• між безліччю сайтів джерел і загальним цільовим сайтом (many-to-one).

vSphere Replication не залежить від типу масиву і підтримує сховище сумісний з vSphere. Рішення входить у всі редакції vSphere (за винятком самої простий і непотрібної) і не вимагає покупки ліцензій.

Реплікація здійснюється шляхом передачі змінених блоків між сайтами або кластерами джерела та цілі. Це передбачає первинне повну синхронізацію ВМ джерела і її репліки. Налаштування реплікації дозволяє встановити RPO, а також активувати можливість збереження безлічі проміжних тимчасових станів репліки (MPIT — multiple points in time) – аналог снапшотов ВМ.

Існує можливість моніторингу та управління станом реплікації, отримання інформації про вхідні та вихідні репликациях, стані сайтів, результати реплікації і помилки.

Процес відновлення ВМ з репліки не автоматизований і вимагає ручного втручання. Зокрема, він вимагає вручну вибрати синхронізацію стану ВМ з сайтом джерела або відновити останній стан з репліки. Відновлена ВМ не має мережевих підключень щоб не викликати потенційних конфліктів, що вимагає ручного підключення ВМ до потрібних віртуальних мереж дата-центру. MPIT забезпечує відновлення реплікованої ВМ із заданою ланцюжком снапшотов, що дає можливість вибрати потрібний стан відновленої ВМ.

vSphere Replication appliance – основна сутність рішення, яка реєструється і підключається як розширення до сервера vCenter. vCenter допускає установку і підключення лише одного vSphere Replication appliance (VR appliance). VR appliance включає вбудований vSphere Replication server, який керує усіма процесами реплікації. Для балансування навантаження підтримується розгортання додаткових vSphere Replication server, які підключаються до основного VR appliance даного сайту (vCenter-а) і, по суті, самі є віртуальними эплаенсами.

Приклад конфігурації реплікації site-to-site:

image
Приклад конфігурації реплікації між кластерами межах одного сайту, при цьому використовуються 2 VR сервера для балансування навантаження (це не обов'язково, можна було обійтися одним VR appliance):

image
Приклад конфігурації реплікації many-to-one:

image
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.