HP Superdome X

Згідно з нашими спостереженнями, в останні роки в доповнення до традиційних бізнес-критичним завдань, які працюють в середовищах Unix, все більша кількість додатків під управлінням Linux і Windows входять в розряд критично важливих для бізнесу наших замовників. Сторонні аналітики пов'язують ці зміни з рядом факторів, таких як зміна стилю IT, поява нових технологій – Cloud, Big Data, Mobility. Крім цього не останню роль грає ціна і велика кількість додатків, написаних під системи x86.



При цьому спостерігається неухильне зростання сегмента x86:


Відвантаження серверів x86 і non-x86 систем за даними IDC, 2014

Як результат, можна спостерігати зародження нового сегмента ринку IT та все зростаючу потребу в системах mission critical x86, що поєднують в собі надійність і високу доступність зі світу Unix і стандартну архітектуру x86 (за даними аналітиків – 67% замовників вимагають для своїх бізнес-критичних завдань рівень доступності 99.99% і вище).


67% організацій вимагають рівень доступності своїх бізнес додатків не нижче 99.99%, ITIC 2013

У 2011 році НР анонсувала проект Odyssey, який відображає стратегію розвитку обчислювальних платформ для критично важливих корпоративних додатків. Цей проект передбачає розширення вже наявного і добре зарекомендував себе набору рішень цієї категорії, а також створення нової бізнес-критичною платформи на базі архітектури х86.

Що з Itanium? Системи нікуди не йдуть, вони затребувані нашими замовниками, тому їх розвиток триває (детальніше про Superdome на Itanium).

В рамках проекту Odyssey НР переносить на архітектуру x86 частину своїх технологій, інтелектуальну власність і весь досвід, напрацьований протягом десятиліть в області традиційних бізнес-критичних оточень HP-UX, OpenVMS і NonStop на базі Integrity, посилюючи тим самим оточення Linux і Windows для вирішення критично важливих завдань наших користувачів. Це дозволяє підвищити продуктивність, масштабованість, стійкість до збоїв та загальний рівень доступності в порівнянні з сучасним ринком систем х86.

Результатом реалізації проекту Odyssey з'явилася нова серверна платформа HP Superdome X, ця система призначена для ресурсномістких критично важливих навантажень, але при цьому спроектована з використанням індустріально стандартної архітектури х86. Одне з основних застосувань HP Superdome X – аналітичні та транзакційні навантаження. При цьому замовник отримує високу масштабованість (до 16 процесорів в одній системі з 48 слотами пам'яті DIMM на кожному серверному блейде, досі — це єдина система на ринку x86, забезпечує подібну масштабованість).


Крім великої масштабованості кожен блейд-сервер має високу відмовостійкість: HP Superdome X успадкував від Integrity Superdome набір спеціальних мікросхем HP sx3000, резервні канали передачі даних з автоматичним підтвердженням завершення транзакції, надійну систему виявлення помилок і несправностей.

Комутація між вузлами HP Superdome X виконана з архітектури Crossbar, її відрізняє:

• Повторна передача пакетів даних від початку до кінця, в тому числі і за резервним шляхах, для гарантованого завершення транзакції;

• Електрична ізоляція апаратних розділів для максимальної гнучкості, ремонтопридатності (незалежне вкл/викл живлення) і фізичної безпеки даних


Архітектура зв'язку блейд-серверів в кошику HP Superdome X

Пропускна здатність Crossbar становить понад 1.2 TB/s, що дозволяє використовувати HP Superdome X навіть для самих продуктивних завдань. Сукупна пропускна здатність, заміряна внутрішніми тестами, становить понад 1TB/s.

Важливо зауважити, що HP і Intel розробляли платформу спільно, результатом цього стало перенесення функціоналу RAS (resilience, availability, serviceability) з платформи Itanium на платформу Xeon E7.

Крім цього йшла активна робота з спільнотою Linux, що дозволило додати підтримку RAS функціоналу в саму ОС Linux.

Впровадження RAS функціоналу в процесори Intel E7, пам'ять сервера, його підтримка з боку Linux OS в поєднанні з мікрокодом Firmware First дозволило говорити про рівень доступності HP Superdome X x86 99.999%+, порівнянному з рівнем доступності RISC систем і перевершує традиційні системи x86 (звіт компанії ITIC, порівнює рівні доступності RISC x86 систем, в звіті наведені цифри вартості позапланового простою):


Звіт компанії ITIC про доступність систем x86 в порівнянні з традиційними RISC системами

Принциповою відмінністю архітектури Mission Critical x86 (MC x86) від традиційної архітектури х86 є спосіб обробки помилок і несправностей. У звичайній системі х86, після виявлення некорректируемой помилки на апаратному рівні, системне ПЗ (firmware) зупиняє роботу операційної системи з метою уникнути подальшого поширення помилки і, в кінцевому рахунку, пошкодження даних.
На відміну від цього в системі HP Superdome X в обробці помилок головну роль відіграє спеціальний мікрокод системи Firmware First. Архітектура процесорів E7v2 (Enhanced Machine Check Architecture) дозволяє микрокоду системи HP Superdome X «вивчати» логи помилок і виконувати дії по усуненню наслідків цих помилок ще до переходу їх на рівень ОС і додатки.

Firmware First обробляє як коректовані, так і некорректируемые помилки в компонентах системи (Процесори, пам'ять, ввід/вивід), також мікрокодом виконується збір всіх даних про інциденти сталися з метою їх подальшого аналізу адміністратором. Таким чином, система зупиняє роботу тільки окремих порушених помилкою процесів і намагається обійти несправність та відновити роботу вже на програмному рівні системного ПЗ, ОС або навіть додатка.

У разі неможливості продовження роботи, система ініціює автоматичну керовану перезавантаження з подальшою реконфигурацией компонентів і збереженням повної інформації про помилку і стан модулів для звіту адміністратора. Такий механізм обробки несправностей стає можливим тільки при тісній інтеграції всіх рівнів системи – апаратного забезпечення, firmware і операційної системи.

Функціонал RAS, впроваджений у HP Superdome X:

Deconfiguration of failed or failing components (дозволяє продовжити виконувати роботу програми і системи в разі проблеми з модулями пам'яті або CPU);

Blade deconfiguration (дозволяє продовжити роботу програми або системи у разі виходу з ладу цілого блейд-сервера в multi blade конфігурації);

Corrupt data containment (режим, в якому даними, містить помилку присвоюється біт «Error Containment», після цього firmware і ОС застосовують сценарії відновлення, включаючи UCNA, SRAO, SRAR. HP Superdome X підтримує всі ці сценарії);

Live error containment (Відпрацювання Firmware HP Superdome X помилок введення/виведення «на льоту»);

Viral error containment (режим, схожий з принципом роботи з Corrupt data containment, що відслідковує фатальні помилки адресації, що перешкоджає їхньому поширенню пристрої введення/виводу);

Processor interconnect fault resiliency (всі зв'язки між CPU, включаючи QPI, інтерконнект пам'яті і PCIe мають надлишкові шляху з перевіркою CRC і механізмом самовідновлення);

Advanced MCA recovery (Відпрацювання Firmware HP Superdome X помилок пам'яті);

Clock Redundancy (Дублювання генераторів тактової частоти);

Partition and error isolation (пасивний мидплейн, що забезпечує електричну излояцию блейд-серверів).

А може ваш виробник бізнес-критичного устаткування запропонувати такий функціонал?

У другій частині циклу статей про HP Superdome X ми розглянемо детальніше механізми Advanced Error Recovery, Live Error Containment, Partition and Error Isolation.

FAQ
Q1: Є відкриті тести продуктивності системи HP Superdome X?
A1: Є, HP Superdome X показав високу продуктивність в стандартному тесті SPECjbb2013, першим серед систем x86 подолавши позначку в 1 млн jOPS.

Червень 2014 | Листопад 2014 | Грудень 2014

Тест SPEC CPU2006

Q: Я чув, що з зростанням кількості процесорів в системі продуктивність зростає не лінійно, це так?
A: Так, при використанні стандартної архітектури Intel це так, але в системі HP Superdome X при додаванні процесорів спостерігається майже лінійне зростання продуктивності завдяки використанню високопродуктивної архітектури Crossbar (фактор 1.92 x при зростанні системи з 4 до 8 сокетів і фактор 1.86 x при зростанні системи з 8 до 16 сокетів, підтвердження можна побачити з результатів тесту.

Q: Є відкриті впровадження системи HP Superdome X у російських замовників?
A: Є, наприклад, компанія МТС.

Q: Є цифри продуктивності HP Superdome X для баз даних?
A: Є, наприклад, SQL 2014.

Q: А чи є документи, що показують випробування HP Superdome X на Oracle?
A: Так, є на Oracle 12c, є реальні замовники, протестувавши свої дані на HP Superdome X під Oracle, референси не публічні, але цифри доступні при обговоренні.

Q: А чи підтримується установка гіпервізора на HP Superdome X?
A: Так, наприклад, VMware, це можна перевірити в матриці сумісності (http://www.vmware.com/resources/compatibility/search.php)

Почитати
» Running Linux on BL920c Gen8
» Running Windows on HP Superdome X
» Running SQL 2014 on HP Superdome X – reference guide

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.