Помилки і проблеми серверів великої трійки: частина друга. HP



Ми продовжуємо цикл публікацій про проблеми, з якими стикаємося при підготовці refurbished-серверів. Раніше ми писали про сервери DELL, на цей раз мова піде про продукцію HP. Всі ці проблеми вирішувалися нашими інженерами, і це лише мала частина сюрпризів, які можуть піднести сервери цього вендора. Однак, якщо ви самостійно займаєтесь обслуговуванням серверів, то, можливо, наш досвід може стати вам у пригоді.

Оперативна пам'ять
При апгрейді серверів HP (та й не тільки) часто виникають труднощі з підбором оперативної пам'яті. Як показує практика, навіть досвідчені сисадміни та інженери не завжди обізнані в цьому питанні. Якщо за натхненням встановлювати модулі пам'яті, то, найімовірніше, сервер просто не запуститься. При неправильної конфігурації RAM можливий і більш м'який варіант: машина працює, але не з максимальною продуктивністю.

Для багатопроцесорних серверів HP, як правило, необхідно використовувати тільки реєстрову пам'ять c функцією корекції помилок (ECC RDIMM), а для однопроцесорних — небуферизированную з ECC (UDIMM). Хоча офіційні мануали свідчать, що UDIMM можна ставити і в багатопроцесорні сервери, робити цього не варто з кількох причин:

  1. Обмеження за обсягом пам'яті. Як правило це 24-32 Гб на CPU.
  2. Планки UDIMM, як правило, повинні бути «рідні» HP, інакше можуть відбуватися мимовільні перезавантаження сервера. Це явище зафіксовано як мінімум на трьох моделях: DL380p Gen8, DL360e Gen8, ML310e Gen8v2. У той же час, можна без проблем ставити RDIMM-пам'ять будь-якого вендора.

    Перевага UDIMM пам'яті в тому, що вона працює дещо швидше RDIMM, в якій присутній буферна операційна затримка. Однак, при правильній конфігурації пам'яті в багатоканальних системах RDIMM може перевершувати небуферизированную пам'ять в продуктивності. Не можна одночасно встановлювати RDIMM і UDIMM-модулі.

    Відрізнити UDIMM-пам'ять від RDIMM можна по наклейці. Наприклад, якщо написано 12800R, це реєстрова пам'ять, якщо 12800E, небуферизированная з ECC.

    При установці RDIMM слід віддавати перевагу одно — і двухранговой пам'яті (1rx4, 2rx4). На відміну від тих же IBM (Lenovo), сервери HP чутливі до конфігурації пам'яті. При установці модулів рекомендується рівномірно розподіляти пам'ять як між процесорами сервера, так і між каналами. В противному випадку сервер може просто не включитися, або його продуктивність виявиться зниженою. Вольтаж планок в серверах HP не принципове, але все одно намагайтеся встановлювати однакові по вольтажу планки.

    Інформація про оптимальному розміщенні RAM в DIMM-слотах завжди є під кришкою сервера і в офіційному мануалі.
Зверніть увагу, що сервери HP до Gen9 не підтримують пам'ять DDR4. спочатку уточніть, яка пам'ять сумісна з вашою моделлю. Для підбору правильної конфігурації можна скористатися фірмовим онлайн-конфігуратор.

Коли мова заходить про апгрейд або ремонті серверів, то виникає вічне питання про виробника комплектуючих. Хтось використовує виключно оригінальні компоненти, не рахуючись з витратами, а хтось підбирає сумісні комплектуючі від сторонніх виробників. Ми вважаємо, що тут треба враховувати:

  • Ступінь сумісності сторонніх комплектуючих.
  • Різницю у вартості в порівнянні з оригінальними.
  • Інформацію про надійність сторонніх комплектуючих.
  • Рівень і допустимість ризиків при використанні сторонніх комплектуючих.
В серверах HP можна без побоювань використовувати пам'ять різних виробників. Головне, щоб модулі мали однакові технічні параметри. Наприклад, якщо в сервері вже встановлено кілька модулів 4Gb 1Rx4 PC3L-10600R, нарощувати обсяг потрібно з допомогою пам'яті з такими ж параметрами. А виробник може бути будь-яким.

Накопичувачі
При виборі нових накопичувачів для сервера помилитися важче, ніж при зміні конфігурації пам'яті. Але все ж тут є свої підводні камені і, почасти, міфи.

Побутує думка, що для серверів HP потрібно купувати накопичувачі виключно того ж виробника. Це обґрунтовують тим, що всі накопичувачі з логотипом HP мають фірмову прошивку. У цьому випадку «рідні» диски істотно дорожче. І, чесно кажучи, це сумнівне задоволення переплачувати в 2-2.5 рази. Однак сама корпорація Hewlett-Packard не виробляє накопичувачі, вона замовляє їх у інших вендорів. І як показує досвід, у багатьох моделях серверів HP цілком можна використовувати продукцію HGST, Toshiba, Seagate, Western Digital.

При виборі накопичувачів уточніть, які підтримує накопичувачі Raid-контролер вашого сервера. Деякі контролери не підтримують SAS-накопичувачі, також можуть не підтримуватися накопичувачі об'ємом більше 2-3 Тб.

Якщо сервер не бачить сторонній накопичувач при його підключенні, то найчастіше це пов'язано з несправністю самого накопичувача або Raid-контролера. Ще одна важлива деталь: ні в якому разі не ставте в enterprise-сервери диски для десктопних систем. Судячи з нашого досвіду, можна виділити декілька найбільш популярних моделей «нерідних» дисків, які без проблем будуть працювати на серверах від G7 до Gen9:

  • Seagate Savvio (SAS)
  • Seagate Constellation (SATA/SAS)
  • Seagate Enterprise Capacity (SATA/SAS)
    • Seagate Enterprise Performance (SATA)
    • WD VelociRaptor (SATA)

Процесори
При заміні процесорів на більш потужні необхідно з'ясувати у специфікації сервера, які моделі процесорів він підтримує. Не забувайте враховувати при цьому підтримується TDP радіатора і самого CPU. У більшості випадків це допомагає уникнути можливих проблем.

Проте при нарощуванні кількості процесорів ні в якому разі не можна нехтувати установкою кулерів на кожен з них, покладаючись на кондиціювання серверного приміщення. Кожен вентилятор охолоджує певні зони на материнській платі. Без штатного охолодження багаторазово підвищується ризик тимчасового перегріву процесорів, оперативної пам'яті, аж до виходу сервера з ладу внаслідок розплавлення або вигорання електронних компонентів.

Після установки сервер двох процесорів на порядок потужніша одного стокового він може не включитися. Наприклад, в нашому випадку це було з сервером HP ML350p Gen8. Причина в тому, що у деяких моделей на материнській платі є запобіжник, який блокує подачу живлення, якщо необхідна напруга перевищує певний базовий поріг. Якщо ця блокування спрацьовує, то єдиним варіантом залишається тільки заміна материнської плати. Якщо сервер не на гарантії, то це може влетіти в копієчку, так як HP славиться немаленькими цінами за свої залізяки.

Однак є методика обходу захисту. Припустимо, замість одного або двох процесорів початкового рівня E5-2609 (v1/v2/v3) потрібно встановити два продуктивних E5-2690 (v1/v2/v3). Щоб уникнути проблем при апгрейді найкраще вчинити так:

  1. Оновити все до останніх версій (iLO, BIOS, AHS і т. д.)
  2. Дочекатися повної ініціалізації сервера з обома встановленими E5-2609.
  3. Встановити два процесора «проміжного» рівня, наприклад, E5-2640. Дочекатися закінчення POST-перевірки.
  4. І тільки після цього встановити бажані E5-2690.
Не забувайте при цьому, що всі firmware повинні бути останніх версій.

Intelligent Provisioning і оновлення сервера
В серверах HP ProLiant Gen8 і Gen9 використовується потужний інструмент Intelligent Provisioning, що дозволяє настроїти сервер, оновити прошивки деяких компонентів і контролювати «залізну» частину машини. Іноді при спробі оновлення видається помилка про неможливість підключення до бази даних HP. Причина полягає в застарілій версії самої Intelligent Provisioning. Оновити її можна наступним чином:

  1. Для Gen8 скачайте образ Intelligent Provisioning recovery media версії 1.62 b, а для Gen9 — найсвіжішу версію.
  2. Змонтуйте образ з допомогою iLO або записати на CD/DVD. Не записуйте образ на флешку, при запуску з неї Intelligent Provisioning не оновиться.
  3. При завантаженні сервера виберіть опцію One Time Boot to CD-ROM.
  4. Коли сервер завантажитися з диска (або образу), то у випадку з Gen9 виберіть у меню пункт Interactive HP Intelligent Provisioning recovery media. На сервері Gen8 оновлення почнеться автоматично.
  5. На наступному екрані натисніть кнопку Перевстановити Intelligent Provisioning, дочекайтеся завершення і перезавантажитеся штатно (тільки для Gen9).
Багато власників серверів поколінь Gen8 і 9 намагаються з допомогою Intelligent Provisioning оновити BIOS. Але цей інструмент дозволяє оновлювати лише прошивки iLO, мережевої карти (Ethernet) і в деяких випадках — Raid-контролера.

Є два варіанти повного оновлення сервера.

  1. Вручну завантажити та встановити всі необхідні драйвери і прошивки для вашої моделі сервера. Цей варіант зручний, якщо сервер один і на ньому вже є ОС.
  2. Якщо кілька серверів і на них розгорнута Windows, то доцільніше скористатися сервіс-паком Service Pack for ProLiant (SPP).
    • Потрібно завантажити образ сервіс-пака.
    • Встановити програму HP USB Key Utility for Windows.
    • За допомогою цієї програми развертываем образ сервіс-пака на флешці об'ємом не менше 8 Гб.
    • Завантажуємо сервер з флешки. Рекомендуємо вибрати Interactive Firmware Update, можна контролювати процес оновлення.
    • Після завантаження клієнта вибираємо Update Firmware. Коли обладнання буде перевірено, система запропонує список оновлень, які будуть встановлені після натискання на кнопку Deploy.
    • Після завершення оновлення необхідно перезавантажитися. Сервер кілька разів вмикається і вимикається, встановлюючи прошивки, після чого відбудеться штатна завантаження.
Не визначаються мережеві адаптери
Якщо оновити драйвери Emulex для мережевих адаптерів з версії 3.х.х відразу до версії 10.х.х, то при перезавантаженні мережеві адаптери можуть перестати визначатися. Для запобігання цієї проблеми рекомендується спочатку встановити Emulex 4.х.х, а потім найсвіжішу версію. Уникнути цієї помилки можна інакше: спочатку оновитися з образу OneConnect, а потім з Service Pack for ProLiant. А якщо адаптери вже перестали визначатися, то просто оновіть систему з образу OneConnect.

«Особливість» серверів HP DL360p Gen8
Спочатку модель даної серії була розрахована на процесори E5-26xx першої ревізії, але у 2013 році Intel випустила другу ітерацію — V2. Вендори, в тому числі HP, стали оновлювати лінійки. Dell і IBM не стали інженерно змінювати базу, лише материнські плати стали носити інший парт номер. А в HP пішли іншим шляхом. У результаті на ринку є дві моделі HP DL360p, нічим не відрізняються, за винятком кріплення радіаторів. У першій версії кріплення важеля, у другій — гвинтове.

По суті, дрібниця. Однак, може привезти до додаткових витрат. Тому, якщо ви вирішите встановити другий процесор, обов'язково дізнайтеся ревізію свого сервера (за серийнику, або заглянувши під кришку).
Парт номер старого важільного радіатора — 654770-B21.
Парт номер нового гвинтового радіатора — 712731-B21.

Недостатня кількість блоків живлення
Деякі власники серверів НР з х4-бэкплейнами резервного живлення (RPS), наприклад, ML350 Gen9, дивуються, чому для запуску машини потрібно підключити не менше трьох блоків живлення, чия сумарна потужність перевищує максимальну поточне споживання сервера.

Справа в тому, що в ML350 Gen9 може бути встановлено до 9 карт PCI-E і до 6 HDD-бекплейнів (або, наприклад, внутрішній стример + 5 HDD-бекплейнів). А все це може споживати дуже багато ват. Бэкплейны RPS дозволяють забезпечити надмірне харчування сервера на випадок різкого підвищення навантаження, а значить і споживання енергії. Підключення блоків живлення до бэкплейну здійснюється за схемою N-1, де N — загальна кількість роз'ємів. Якщо вам необхідно надмірне харчування сервера, то блоки живлення повинні бути підключені до всіх роз'ємів бэкплейна. Якщо надмірне харчування не потрібно, то для запуску сервера з х4-бэкплейном необхідно три блоку живлення, а х2-бэкплейном — один блок.

Помилка управління через IPMI
IPMI може використовуватися для віддаленого керування серверами. Можливі ситуації, коли не вдається встановити з'єднання зі службою IPMI сервера:

ipmitool -I lanplus -H $ip -U $user -P $pass

Error: Unable to establish IPMI v2 / RMCP+ session


Причин може бути дві:

  1. Служба відключена заради підвищення безпеки: у IPMI v.2 є потенційна RAKP-уразливість (Remote Password Hash Vulnerability). Потрібно знову включити службу.
  2. Використовується обліковий запис не має прав адміністратора. У цьому випадку аккаунту потрібно надати відповідні права.

Хаотична перезавантаження сервера
Ця проблема зустрічається рідко, і виражається в хаотичній самостійної перезавантаження сервера. В логах ОС помилок немає, логах iLO теж зазвичай нічого критичного. У подібних ситуаціях зазвичай не допомагає оновлення, заміна кабелів живлення ДБЖ. Проблема вирішується зміною налаштувань для керування живленням в Біосі сервера. Коротенько, відключаються всі механізми зниження тактової частоти процесора:

  • Power Management Options —> HP Power Profile —> Maximum Performance
  • Power Management Options —> HP Power Regulator —> HP Static High Performance Mode
  • Power Management Options —> Advanced Power Management Options —> Collaborative Power Control —> Disabled
  • Power Management Options —> Advanced Power Management Options —> Minimum Processor Idle Power Core State —> No C-States
  • Power Management Options —> Advanced Power Management Options —> Minimum Processor Idle Power Package State —> No Package State
Збій після вимикання сервера
Ми стикалися з кількома випадками, коли при включенні сервера горять світлодіоди, але відеосигнал відсутня. Машина не пінгуєтся, iLO не відповідає, хоча за світлодіодами відзначається активність iLO і Ethernet. Клавіатура і миша не працюють. Найчастіше таке траплялося після штатного відключення сервера, без яких-небудь маніпуляцій, без збоїв живлення. Подібний збій відзначався на серверах поколінь від Gen5 до Gen8.

Точного вирішення цієї проблеми, як і її причини, виявити поки не вдалося. В одному випадку допоміг переклад всіх перемикачів «System Maintenance Switch» в положення ON, а через деякий час назад в OFF. Одного разу сервер ожив після того, як поміняли місцями модулі пам'яті. На жаль, в декількох випадках так і не вдалося відновити сервери.

Сильний шум системи охолодження
Ця проблема найчастіше проявлялася в серверах ML350e Gen8. Відразу після включення сервера вентилятори виходять на високі обороти. Швидкість обертання не знижується при будь-якому навантаженні. В результаті створюється постійний і високий рівень шуму.

У ряді випадків проблема вирішувалася видаленням PCI-E карт розширення: мережевих і USB-хабів. Але ця проблема зустрічалася і в серверах без встановлених плат розширення. Кілька разів допоміг демонтаж і повторна установка вентиляторів і їх кошиків, з перепідключенням проводів живлення. Одного разу вентилятори повернулися до нормальних оборотами після оновлення прошивок і скидання iLO. Також був випадок, коли в Біосі змінилася настроювання керування охолодженням, і виявилося достатньо поміняти значення з Increased на Optimal Cooling.

Скидання конфігурації в серверах Gen8
Наостанок хочемо розповісти не про помилку, а про фиче серверів HP покоління Gen8 і Gen9: на материнських платах відсутні звичні джампери скидання конфігурації. Якщо вам потрібно скористатися скиданням, то це можна зробити наступним чином:

  1. Вимкніть сервер і висмикніть шнур живлення.
  2. Знайдіть на материнській платі групу маленьких перемикачів «System Maintenance Switch» (див. зображення на внутрішній стороні кришки сервера).
  3. За допомогою тонкого інструменту — ручки, шила, голки тощо — переведіть imageперемикач №6 в положення ON.
  4. Підключіть до сервера шнур живлення.
  5. Якщо на екрані з'явилося зображення і почався процес скидання, дочекайтеся завершення процедури NVRAM clear і перезапуску сервера. Якщо після підключення шнура живлення на екрані довго нічого не відображається, вимкніть сервер.
  6. Вимкніть сервер, витягніть шнур живлення.
  7. Поверніть перемикач № 6 в положення OFF.
Установка другого рейд-контролера в сервери Gen8 і Gen9
При установці другого рейд-контролера (наприклад, один рейд під системи, другий під дані) сервер може зависати на стадії завантаження ОС або не проходити POST. Найчастіше це відбувається із-за неправильного boot-черги.

Для вирішення проблеми потрібно зробити наступну конфігурацію:

  • Рейд1 (наприклад, вбудований P420i).
  • Рейд2 (софтовый або embedded-рейд, наприклад B120i, P222i).
  • Рейд3 (апаратний P420).
Переваги серверів HP
Несправедливо було б розповідати тільки про проблеми серверів HP, адже недарма продукція цього виробника користується високою популярністю. Сервери серії Proliant вважаються одними з кращих у своєму класі, і вже точно запам'ятаються своєю надійністю, ніж відвалом iLO і трохи завищеною ціною. Саме HP часто задає планку в функціональності і відмовостійкості серверів, пропонуючи нестандартні, але ефективні інженерні рішення.

Ось лише кілька переваг серверів HP:

  • Зручність використання завдяки фірмовим фічами: iLO, Intelligent provisioning, Active Health System.
  • Вдала лінійка бюджетних і високопродуктивних моделей.
  • Обмежена номенклатура «заліза» (хоча для когось це недолік) для кожної моделі дозволяє уникнути нераціональних витрат при майбутньому апгрейді.
  • Відмінна технічна підтримка.
  • Одна з кращих реалізацій оновлення вбудованого ПЗ.
  • Gen8 і Gen9 — найкраща реалізація діагностичних позначень на санчатах під HDD.
Якщо ви стикалися з якимись помилками в серверах HP, але в кінцевому підсумку перемогли, то діліться у коментарях. Спасибі.
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.