Доцільність і переваги застосування серверних накопичувачів, побудова RAID-масивів, варто економити і коли?

На ринку є велика кількість накопичувачів різних швидкостей, різних виробників. Далеко не всі чітко розуміють, який диск краще придбати і для якої завдання і навіщо деколи краще заплатити більше, а коли можна заощадити. У цій статті я постараюся з'ясувати основні моменти і зробити проблему вибору більш простий. Стаття буде корисна не тільки тим, хто хоче купити/орендувати виділений сервер, але і тим, хто хоче отримати надійне сховище інформації вдома. Після прочитання матеріалу стане зрозумілим, чому не завжди доцільно орендувати desktop-рішення в low-cost дата-центрах і краще зупинити вибір на більш надійному, серверному залозі.

Почнемо з того, що всі наявні на ринку накопичувачі, можна чітко розділити на класи:

— диски для звичайних desktop-ів (застосовуються в домашніх ПК, ноутбуках і desktop-серверах low-cost дата-центрів);
— серверні диски зі швидкістю 7200 оборотів в хвилину (RPM);
— Enterprise-диски із швидкість 10 000 і 15 000 RPM;
— твердотільні накопичувачі.

Особливості вибору твердотільних накопичувачів ми, мабуть, розглянемо в окремій статті, а зараз зупинимося переважно на жорстких дисках і розглянемо який диск де і коли доцільно застосовувати.

Почнемо з звичайних дисків для PC. Це відмінні диски з досить великою місткістю і хорошою продуктивністю, але їх головний недолік в тому, що вони не розраховані на роботу в RAID-масиві в силу своїх конструктивних особливостей. У цих дисках вібрації, викликані обертанням шпинделя, практично ніяк не компенсуються. Звичайно ці вібрації мінімальні і в разі застосування 1-2 дисків в домашніх умовах вони не є проблемою. Однак, якщо розглядати серверний випадок, коли дисків багато, вплив вібрацій може бути досить суттєвим, так як виникають взаємні вібрації, резонанс посилює ефект. Так, коли в корпусі встановлено одразу 12 дисків, та ще й працюють досить потужні серверні вентилятори з 5000-9000 оборотів в хвилину — рівень вібрації наростає досить значно, а з ними і % помилок, втрат, що і робить негативний вплив на продуктивність. Продуктивність дисків десктопного типу падає в цих випадках в рази, так як вони відчувають значні труднощі з позиціонуванням головок, втрачають доріжку. Це добре можна бачити з популярного графіка залежності продуктивності від вібраційного навантаження:



Інша справа диски SATA RE (RAID Edition) або ж серверні диски зі швидкістю 7200 RPM. Вони менш схильні до вібрацій і в меншій мірі залежать від них. Як бачимо з графіка — імовірність виникнення помилки в результаті вібрацій на 50% нижче для них.

Але не тільки вібрації є проблемою, інша основна проблема всіх дисків — рівень невозобновимых помилок. Що це означає на практиці?

Для SATA PC дисків рівень невозобновимых помилок 1 помилка на 1014 біт або 1 помилка на 12,5 ТБ даних. Диск на 1ТБ має 1000/12500х1014 біт. 5 дисків мають ємність 5х(1000/12500х1014) біт, а ймовірність виникнення помилки при роботі цих дисків в масиві RAID5 буде становити (5х(1000/12500х1014))/1014x100% = 40%.

Як бачимо, використовувати 5 PC-дисків в RAID5 просто не можна, так як ймовірність виникнення невідновною помилки при ребилде дуже висока і ребилд завершиться швидше невдало. Таким чином ми отримаємо масив, який свідомо вийде з ладу в разі ребілда і дані будуть втрачені. Раніше я не знав про цю особливість і в 2008-му році, коли збирав свій перший сервер ще на PC-шних накопичувачах, побудував саме RAID5-масив, з метою економії дискового простору і грошей, і менше, ніж через місяць, дані були втрачені. Зараз мені дивно, що масив прожив так довго :)

Звичайно, можна застосовувати більш надійні рівні RAID, такі, як RAID10 або в крайньому випадку RAID6, але при великій кількості дисків ми також будемо отримувати досить високий ступінь імовірності виникнення невідновною помилки під час ребілда.

Інша справа серверні диски зі швидкістю 7200 оборотів в хвилину (RPM) SATA RE диски Near Line (NL) SAS. Ймовірність невідновною помилки для них на порядок менше вже за рахунок їх технічних особливостей, 1 помилка виникає на 1015 біт даних. Тим не менш, при використанні не тільки великої кількості накопичувачів, але і накопичувачів великого обсягу — цього може бути вже недостатнім і в таких випадках все ж доведеться застосовувати SAS-накопичувачі Enterprise класу, ступінь надійності яких 1 невідновна помилка на 1016 біт даних.

Варто також відзначити, що насправді для дисків SATA RE, Near Line (NL) SAS і дисків SAS Enterprise-класу, по суті дисків, які вміють ефективно взаємодіяти з RAID-контролером, ймовірність виникнення невідновною помилки ще значно менше, як раз за рахунок цієї здатності. Так, при роботі з навантаженим масивом (бази даних, з якими працюють відразу багато користувачів, активна запис і зчитування даних) починають грати роль вже восстановимые помилки, з якими звичайні диски працюють неефективно. Вони намагаються перечитати проблему багаторазово — в тих же Western Digital значення встановлено на 64 проходу головки з різними параметрами висоти, кута, тільки після чого головка переходить до обробки інших завдань. За рахунок цього сильно зростає час очікування, яке RAID не терпить і неодмінно визнає диск втраченим і спробує відновлювати диск, в результаті чого навантаження на масив придбає критичний характер, так як одночасно з робочим навантаженням буде йти ще і ребилд. Результат передбачуваний — крах усього масиву.

Диски, які вміють працювати з RAID, можуть повідомити RAID-контролера, що є проблема з читанням блоку даних, запросити цей блок з інших дисків і в цей час інші запити, а отримавши блок — перезаписати його в іншому місці проблемного диска. За рахунок цього ніякого падіння продуктивності RAID-масиву не відбувається і ймовірність втрати даних значно знижується. Однак слід зазначити, що не всі софтові рейд-контролери, встановлені на чіпсетах, вміють «розуміти» такі диски, тому деколи недостатньо мати RE диски для надійного масиву, а все ж потрібно застосування апаратного контролера або іншої платформи, яка коректно працює з RAID.

Тим не менше, якщо є бажання зібрати більш надійне сховище, ніж сховище на PC-накопичувачах, можна купити більш дешеві диски, ніж диски RE, наприклад Constellation CS, які призначені для роботи виключно з софтовими рейдами і позбавлені нестачі десктопних (спроб багаторазового перечитування даних на шкоду іншим завданням), при цьому повноцінно, само собою, з контролерами вони не взаємодіють, тому що збої RAID повністю не виключені.

Незалежно від того, який накопичувач Ви застосовуєте, Ви також повинні пам'ятати про те, що у дисків є кеш — 32, 64 МБ і більше. Що це означає для RAID-масиву? З точки зору продуктивності кеш є плюсом, як для читання, так і для запису. Однак з точки зору надійності запису — це мінус. Використовуючи кеш, рейд-контролер буде думати, що вже записав дані на масив, але насправді вони можуть бути тільки в кеші, а на диск бути записані пізніше. В залежності від розміру масиву зростає і розмір загального кеша, і в разі 12 накопичувачів кеш складає вже майже гігабайт. Що станеться з даними при відключенні живлення? Правильно. Вони будуть втрачені. І якщо мова йде про файлопомойке, тут, напевно, не на стільки критично, але якщо мова йде про бази даних — буде весело. Тому рекомендується для даних особливою критичності, такі, як бази даних, все ж відключати кеш на запис. Це знизить продуктивність диска на 8-15% в режимі баз даних, проте значною мірою збільшить надійність. З цієї причини, якщо Ви купуєте сховище даних великої ємності, великі виробники відключають там кеш за замовчуванням і включити його неможливо. Застосовуючи ж диски в серверах, особливо в low-сost дата-центрі, де харчування до сервера не зарезервований, потрібно пам'ятати про ризик і враховувати його.

Також відзначимо ще одну ключову особливість дисків SAS Enterprise-класу, на них дані зберігаються ще більш надійно, так як мінімальний розмір кластера складає 520 байт, а не 512, додається ще 8 байт для перевірки парності. Застосовується велика кількість алгоритмів відновлення даних без участі контролера. Саме з цієї причини обсяг цих дисків не буває дуже великий.

До речі на рахунок обсягу, крайня рекомендація: якщо у Вас є завдання зберігати дані надійно, не намагайтеся використовувати диски більшого обсягу, ніж це необхідно, так як у випадку ребілда відновлення буде займати більше часу. Як правило контролери не аналізують те, скільки реально включена на диску і відновлюють весь диск в цілому, тому різниця в часі відновлення між 1 ТБ і 6 ТБ накопичувачем буде більш, ніж у 6 разів.

Підведемо підсумки. Виходячи з вищевикладеного зрозуміло, що для невеликого RAID-масиву, застосування самих дорогих дисків класу Enterprise не принципово і не дає ніяких переваг в надійності. Тим не менш, застосування серверних дисків вельми бажано, так як в цьому варіанті на порядок більша ймовірність того, що ребилд завершиться успішно. Не слід застосовувати диски більшого обсягу, ніж це необхідно, за винятком випадків, коли потрібно забезпечити більш високу продуктивність по IOPS (в деяких дисках більшого об'єму все ж може бути виграш по швидкості за рахунок більшої кількості головок і пластин). У випадках, коли необхідний великий обсяг і багато дисків і при цьому достатній рівень надійності — можна дивитися в бік SAS NL, які, по суті, є модифікованим варіантом накопичувачів SATA RE за рахунок інтерфейсу SAS, проте мають все ті ж 7200 RPM. Для підвищення рівня надійності доцільно застосовувати RAID більш високого рівня. Коли ж обсяг масиву не принциповий і потрібна максимальна надійність, потрібно однозначно застосовувати SAS 15000 RPM Enterprise.

Тепер, вибираючи в оренду сервер в Нідерландах, у нас на майданчику Switch, за допомогою конфігуратора, розташованого у нижній частині сторінки http://www.ua-hosting.company/servers, або, модифікуючи одне з спец. пропозицій:





Приходить розуміння того, які диски і який з серверів краще використовувати і для яких завдань, коли краще використовувати диски в RAID, а коли окремо, розподіляючи файли софтом в залежності від популярності (скрипт балансера залежно від навантаження). Чому 4 диски більшого обсягу, в плані надійності, що може бути краще, ніж 12 меншого, але гірше в плані часу відновлення у разі ребілда. Ну і саме важливе — чому наша пропозиція реально круте для серверного сегмента, і ми реально наблизили ціну до desktop-майданчикам, при цьому зберігши на порядок більш високу надійність без перебільшень! Так що якщо Вам або Вашим знайомим потрібен хороший сервер — welcome, розпродаж деяких конфігурацій зі списку нижче обмежена, дуже скоро ціни на ці конфігурації будуть вище, ми хоч і щедрі, але не безмежне :):






Так, якщо у когось є реальний досвід застосування тих або інших накопичувачів для певних завдань — не соромтеся поділитися в коментарях. Цікаво все, аж до статистики відмов. На цю тему, як і з приводу проблематики вибору SSD-накопичувача, ми постараємося опублікувати матеріал пізніше.
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.