Майбутнє за флеш-пам'яттю: IBM FlashSystem

Час — ключовий фактор в бізнесі, особливо в критично важливих бізнес-додатках. Ті, хто бачив фільм «Аполлон-13», або старші люди, які пам'ятають цей нещасливий космічний політ, знають, що буває, коли критично важливі системи виходять з ладу. За сюжетом фільму три американських космонавта відправляються на Місяць, але в дорозі космічний апарат вибухає і отримує серйозні пошкодження, а вони лише дивом залишаються в живих. Космонавтам вдалося повернутися додому лише завдяки героїчним зусиллям і дещиці везіння. На щастя, наслідки збою критично важливих бізнес-додатків рідко бувають настільки ж серйозними (порівняно, скажімо, з додатками, від яких залежить робота служб і установ, наприклад, у відділеннях інтенсивної терапії, авіадиспетчерських службах тощо). Але з іншого боку — збої таких додатків безпосередньо позначаються на життєздатності компанії: якщо системи працюють бездоганно, компанія економічно здорова і розвивається, якщо ні — вона насилу утримується на плаву.


До розряду критично важливих для бізнесу відносяться програми для самих різних завдань, наприклад: бізнес-аналіз (BI — business intelligence), оперативна транзакційна обробка (OLTP — online transaction processing), оперативна аналітична обробка (OLAP — online analytical processing), інфраструктура віртуальних робочих столів, високопродуктивні обчислювальні системи і додатки для доставки змісту (хмарні системи зберігання, надання відео за запитом і т. д.). Всі ці важливі завдання об'єднує одне: високі вимоги до швидкості роботи, адже від неї залежить те, наскільки швидко керівництво, співробітники, клієнти та інші ключові ділові партнери отримають доступ до потрібної інформації.

Неможливість швидко отримати доступ до важливих даних і обробити їх призводить до суттєвих діловим і фінансовим ризикам. Зокрема, такі затримки викликають:

— Нездатність своєчасно і правильно оцінити ситуацію, не маючи доступу до критично важливих даних у потрібний час і в потрібному місці, люди не бачать повної картини того, що відбувається і, як наслідок, приймають неправильні рішення, допускаючи абсолютно необов'язкові помилки.

— Різке зниження здатності прогнозувати результати бізнесу — якість фінансових прогнозів на рівні окремого проекту, окремої напрямки діяльності і всієї компанії залежить від можливості своєчасно отримувати точні дані. Не маючи доступу до таких даних, компанія не може їх проаналізувати, що негативно відбивається на її діяльності.

— Зростання невдоволення клієнтів — у багатьох галузях (фінансові послуги, охорона здоров'я, туризм і т. п.) якість сервісу безпосередньо залежить від наявності миттєвого доступу до актуальної інформації, особливо у зв'язку з тим, що сучасний клієнт очікує обслуговування в цілодобовому режимі 7 днів на тиждень і 365 днів у році. В цих умовах нездатність оперативно надати клієнтам потрібну інформацію не тільки означає втрачений прибуток, але і часто веде до втрати клієнта, а те і частки ринку.

— Занадто великі обсяги, різноманітність і швидкість надходження інформації — вибухове зростання обсягів даних веде до неминучого падіння продуктивності основних додатків на багатьох підприємствах. Збільшення затримок стає джерелом невдоволення користувачів, і підприємства втрачають можливості, що виникають.

Керівникам відділів ІТ, які шукають вирішення цих проблем, яке б мало оптимальне поєднання функціоналу, часу впровадження, масштабованості і вартості систем, не позаздриш. У кінцевому рахунку, вірне рішення може виявитися далеко не очевидним.

Постановка задачі (підказка: швидкість процесора — неправильну відповідь)

Як правило, на уповільнення роботи системи відділ ІТ реагує в першу чергу додаванням або модернізацією процесорів і пам'яті. Проте дуже часто приріст продуктивності від цієї модернізації мінімальний, тоді як вартість висока. Другий метод, часто супутній першому, принаймні, стосовно до баз даних, — це оптимізація SQL. Підприємства витрачають на неї мільйони доларів і навіть отримують якісь результати. Але випускають з уваги той факт, що і сама ідеальна база даних буде безсила перед низькою швидкістю роботи системи зберігання даних, а саме остання часто є джерелом проблеми.

Дійсно, першопричина проблем з продуктивністю додатків часто криється в системі зберігання даних, а не у швидкості процесора або нестачі пам'яті. Коли процесор простоює в очікуванні інформації від системи зберігання, дорогоцінний час і ресурси витрачаються даремно. А враховуючи те, що в останні 20 років обчислювальна потужність процесорів росте в геометричній прогресії, цей простий стає все більше і більше. Простіше кажучи, обчислювальні ресурси сучасних процесорів набагато перевершують швидкість, з якою жорсткі диски можуть доставляти їм дані. Особливо гостро цей розрив у продуктивності відчувається в серверах баз даних, де кількість операцій вводу-виводу зазвичай набагато більше, ніж в інших системах. У підсумку швидкі процесори і величезна пропускна здатність часто задіяні далеко не на повну потужність, тому що на доступ до даних на жорстких дисках йде за кілька мілісекунд, що для сучасних процесорів — ціла вічність. А коли сервери довго чекають даних від систем зберігання, користувачі довго чекають відповіді від серверів. Ось де реальне джерело проблеми з низькою швидкістю операцій вводу-виводу.

Ця проблема обумовлена суто фізичними причинами. Переміщення даних на твердотільних накопичувачах і через мережу відбувається зі швидкістю, порівнянною зі швидкістю струму в електричної ланцюга, тобто, по суті, швидкості світла, тоді як жорсткі диски — це механічні пристрої, що зчитують інформацію за рахунок обертання пластини. Таким чином, при всій своїй надійності і працездатності жорсткі диски в плані швидкості доступу є однозначно найслабшою ланкою в ланцюзі передачі інформації.

Недоліки традиційних шляхів обходу проблеми зі швидкістю HDD

Проблеми з продуктивністю через неефективність жорстких дисків намагаються розв'язувати кількома способами, зокрема, створення масивів JBOD (just a bunch of disks — просто набір дисків) або RAID (redundant array of independent disks — надмірний масив незалежних дисків). Із збільшенням кількості дисків з'являється можливість розподіляти операції вводу-виводу, здійснювані базою даних, з кількох дисків. На жаль, це дає занадто скромний приріст продуктивності HDD.

Ще прийнято переміщати часто використовувані файли на окремий диск. Швидкість операцій введення-виведення в одного диска при цьому дійсно зростає до свого максимуму, тільки от навіть на максимумі ця швидкість залишається невисокою. В кращому випадку один жорсткий диск видає ~200, без застосування додаткового функціоналу, операцій введення-виведення в секунду (IOPS — input/output operations per second), що в рази нижче швидкості, яка могла б скоротити розрив у продуктивності між процесором і HDD.

Третім традиційним способом підвищити продуктивність HDD є заміна JBOD на RAID. Продуктивність в результаті дійсно зростає, особливо якщо підключити диски до контролера з великим кешем, який буде розподіляти дані з різних дисків. Але при цьому, щоб досягти високої швидкості операцій вводу-виводу, очікуваного користувачами, потрібно таку кількість дисків, що їх вартість, займаний простір, енергоспоживання, тепловиділення і вага виявляться просто неприйнятними.

Відповідь: системи зберігання лише на базі флеш-пам'яті

Розрив у продуктивності між обчислювальною потужністю серверів і системами зберігання даних на жорстких дисках, особливо гостро відчувається в критично важливих бізнес-додатках, вимагає принципово інших, більш швидких систем зберігання.

Системи зберігання на базі флеш-пам'яті — це пристрої з твердотільними накопичувачами, покликані вирішити проблему з недостатньою швидкістю операцій вводу-виводу; їх швидкість доступу до даних і операцій введення-виведення в рази краще, ніж у жорстких дисків. Ці системи зберігання можуть доповнювати чи повністю замінювати традиційні масиви з жорстких дисків для багатьох критично важливих бізнес-додатків, включаючи ERP-системи, транзакційні бази даних і аналітичні додатки (бізнес-аналітика тощо). Більше того, у зв'язку з поступовим зниженням цін на ці нові пристрої сьогодні цілком можливо побудувати цілу систему зберігання на базі однієї флеш-пам'яті.

У широкому сенсі слова під SSD (solid state drive — твердотільний накопичувач) розуміється будь-який пристрій вводу-виводу даних, позбавлене механічних компонентів. Однак останнім часом термін SSD використовується в основному для позначення твердотільних накопичувачів, які мають традиційний форм-фактор жорсткого диска і йдуть йому на зміну. SSD-накопичувачі такого форм-фактора не слід плутати з системами зберігання на базі флеш-пам'яті. Інтерфейси і контролери таких SSD-накопичувачів ґрунтуються на традиційних для жорстких дисків технологіях, які створювалися виходячи з притаманних HDD затримок доступу і обмежень пропускної здатності. Системи зберігання на базі флеш-пам'яті спочатку розробляють виходячи із особливостей цієї технології і в розрахунку на швидкий контролер FPGA, ставлячи за мету мінімізувати затримку і отримати максимальну пропускну здатність.

У сучасних систем зберігання на базі флеш-пам'яті час очікування операцій вводу-виводу скорочено за рахунок того, що швидкість доступу в 250 разів швидше, ніж у жорстких дисків (0,2 мс проти 5). А збільшення швидкості доступу у свою чергу дозволяє флеш-пам'яті видавати в 2000 разів більше операцій введення-виведення в секунду, ніж у HDD (400 000 з гаком IOPS проти 200). Таке поліпшення може різко скоротити затримки доступу до інформації, обумовлені повільністю системи зберігання.

Впровадження технологій флеш накопичувачів або заміна існуючих дисків дозволяє, серверів будь-якої архітектури, збільшити можливості ЦПУ за кількістю виконуваних завдань за одиницю часу. Так на прикладі IBM Power Systems приріст продуктивності сервера при роботі з БД Oracle сягав до 40% на відкритих тестуваннях, що дозволяє значно збільшити ефективну утилізацію існуючої інфраструктури. Тобто сервер без зміни конфігурації зможе виконувати на 40% більше запитів за той же період часу.

Сімейство IBM FlashSystem

IBM вважає флеш-пам'ять стратегічно важливою технологією зберігання даних і ставить своєю метою бути в авангарді розробки систем зберігання лише на базі флеш-пам'яті. (Одним з наслідків цієї політики стала покупка в жовтні 2012 року компанії Texas Memory Systems (TMS) — висококласного виробника потужних і надійних систем зберігання на базі флеш-пам'яті.)

Цілеспрямоване використання IBM FlashSystem допомагає підприємствам підвищити свою гнучкість і ефективніше задіяти аналітику — персонал у будь-який момент може оперативно отримати інформацію, яка завжди актуальна, оскільки надходить в режимі реального часу, а не з великими затримками. Крім того, ця система сприяє оптимізації центрів обробки даних і консолідації ресурсів, в результаті чого зростає ефективність бізнес-процесів і роботи критично важливих додатків. Підвищується і стійкість систем, причому без втрат продуктивності і доступною ємності.

Системи зберігання лише на базі флеш-пам'яті мають ємність більше, ніж у всіх попередніх технологій зберігання даних. Це пояснюється тим, що вони не вимагають додаткових батарей для копіювання DDR-кеша в разі відключення електроенергії, так само як і обходяться без великої кількості дорогих модулів DDR-пам'яті. Обсяг потрібної їм DDR-пам'яті мінімальний — вона служить в якості буфера для запису флеш-пам'яті і сховища метаданих під час роботи. Електроживлення, необхідне, щоб в моменти відключення електроенергії скопіювати невеликий кеш і метадані на флеш-пам'ять, забезпечується маленькими батареями. Система зберігання даних тільки на базі флеш-пам'яті з 57-ю терабайтами адресної пам'яті і високим рівнем доступності має розмір всього 2U.

У продуктах IBM FlashSystem застосовується технологія FlashCore яка дозволяє використовуючи тип носія багаторівневого класу MLC отримати показники строків зберігання і продуктивності не гірше, ніж SLC.

Системи зберігання FlashSystem здатні на 1 000 000 операцій читання в секунду з затримкою менше 100 мікросекунд і при цьому настільки компактні, що в одному відсіку 2U можна розмістити пристрою ємністю до 57 ТБ. Іншою важливою перевагою є високий рівень доступності та надійності, обов'язковий для підприємств: відсутність компонентів, відмова яких призводить до відмови всієї системи, наявність декількох рівнів корекції даних, резервних мікросхем і компонентів з підтримкою «гарячої заміни».

Продукти IBM FlashSystem мають найменшу затримку і найвищий показник IOPS серед конкурентів і при цьому привабливі з точки зору сукупної вартості володіння. Потрібно врахувати, що порівнюються не окремі параметри а сукупність часу відгуку і кількості операцій введення-виведення. Вони можуть використовуватися в якості систем зберігання т. н. рівня 0 (Tier 0, тобто перевершує за можливостями традиційний рівень Tier 1 — системи зберігання даних, необхідних для першочергових завдань підприємства) в комбінації з SVC (IBM System Storage SAN Volume Controller). Також IBM FlashSystem будуть особливо корисні, коли працездатність критично важливих бізнес-додатків прямо залежить від охолодження, низького енергоспоживання і компактного розміру. На сьогодні представлені дві основні моделі IBM FlashSystem 900 і IBM FlashSystem V9000. Перша займає 2 юніта і забезпечує високу продуктивність в той час як друга система займає 6U і додатково до високих показників володіє набором High End функціоналу. Що дозволяє оптимізувати використання об'єму, більш ефективно розподіляти навантаження, створювати кластера зберігання як у межах датацентру так і географічно рознесені. У найближчі дні планується до запуску новітня розробка яка збільшить портфель пропонованих систем і додасть функціонал в лінійку IBM FlashSystem.

Економічні вигоди IBM FlashSystem

Системи зберігання лише на базі флеш-пам'яті мають не тільки технічні переваги, але і ряд економічних вигод у порівнянні з традиційними системами на базі HDD. Наприклад, вартість ліцензування ПЗ для систем зберігання IBM FlashSystem на 50 % нижче, ніж у систем на базі HDD.

До того ж набагато менший розмір і більш висока щільність зберігання даних дозволяють значно скоротити займану площу. Як зазначалося вище, система зберігання даних тільки на базі флеш-пам'яті з 57-ю терабайтами адресної пам'яті і високим рівнем доступності має розмір всього 2U. Таким чином, в одній стійці можна розмістити систему ємністю понад 1 петабайт.

Системи зберігання даних тільки на базі флеш-пам'яті також набагато більш енергоефективні, ніж зіставні системи на базі HDD — витрати на електроенергію нижче на 75 %.

— Вартість ліцензування для IBM FlashSystem на 50 % нижче, ніж у систем на основі HDD.
— IBM FlashSystem займає значно менше місця і економить до 75 % електроенергії порівняно з HDD.
— Вартість експлуатаційної підтримки систем на базі флеш-пам'яті на 35 % нижче порівняно HDD
— Сукупна вартість системи зберігання даних тільки на базі флеш-пам'яті на 31 % менше, ніж у HDD

Перехід на флеш-пам'ять

Запорукою максимальної віддачі та економічної ефективності флеш-пам'яті є стратегічне її використання. Система зберігання лише на базі флеш-пам'яті корисна багатьом додаткам, але далеко не всім; в першу чергу вона потрібна основним додатками підприємства. Ключ до високої продуктивності додатків, задоволенню користувачів оптимальної сукупної вартості володіння лежить в умінні ідентифікувати ті додатки, які виграють від переходу на системи зберігання лише на базі флеш-пам'яті, і ті, яким вистачить традиційних систем на базі HDD або ж гібридних систем на основі комбінації цих технологій.

Низька продуктивність додатків зазвичай пов'язана з великим обсягом одночасних і часто высокосложных запитів до бази даних. Якщо слабкою ланкою при цьому є підсистема вводу-виводу, то необхідно виявити компоненти бази даних, які працюють під найбільшою завантаженням і таким чином викликають затримку в операціях введення-виведення.

У деяких випадках на системи зберігання на базі флеш-пам'яті переносять цілі бази даних. Зазвичай це БД зі стандартно високим обсягом одночасних запитів або регулярним випадковим доступом до всіх таблиць БД, коли вичленувати підмножина найбільш часто використовуваних файлів не представляється можливим.

Добре підходять для перенесення на системи зберігання на базі флеш-пам'яті також БД малого та середнього розміру, тому що такі рішення вкрай привабливі за ціною, особливо в порівнянні з RAID-системами. Аналогічне справедливо для великих баз даних з великою кількістю запитів на читання.

Інші доводи в користь флеш-пам'яті — це такі недоліки великих дискових масивів з HDD, як велика площа і високе енергоспоживання.

Додаткові ресурси

Для отримання додаткових відомостей про системи зберігання лише на базі флеш-пам'яті і сімействі IBM FlashSystem пропонуємо ознайомитися з наступними джерелами:

Відео: «Практичний погляд на флеш-пам'ять»

Відео: «Майбутнє за флеш-пам'яттю від IBM»

Відео: «Де потрібна флеш-пам'ять»

Відео: «Флеш-пам'ять проти дисків»

Відео: «Системи зберігання на базі флеш-пам'яті — справжній прорив»

Технічний документ: «Підвищення продуктивності БД Oracle в зв'язці з IBM FlashSystem»

«Флеш-пам'ять або SSD: для яких цілей потрібна IBM FlashSystem»

«Переваги IBM FlashSystem в середовищі VDI»

«Кращі методики використання SVC і FlashSystem 820»

«Керівництво за рішенням: IBM FlashSystem в БД на базі OLAP»

«Приклад впровадження: система зберігання даних на базі флеш-пам'яті застосовується компанією Rathbone Brothers Plc для управління інвестиціями на мільярди доларів»

«Приклад впровадження: Sprint підвищує продуктивність в 45 раз і різко покращує якість обслуговування клієнтів, впровадивши надшвидку систему зберігання на базі флеш-пам'яті IBM»
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.