Помилки і проблеми серверів великої трійки: частина перша. Dell

Займаючись відновленими (refurbished) серверами, ми накопичили пристойний досвід спілкування з проблемами різних брендів, яким хочемо поділитися на прикладі машин великої трійки: Dell, HP і IBM. Щоб нікому не було образливо, ми підемо в алфавітному порядку.

image

У цьому пості ми зібрали відгуки наших інженерів, які мають великий досвід у діагностиці, відновлення і обслуговування серверів — кожна описана помилка вирішувалася їх потом і кров'ю. Ця інформація стане вам у нагоді у випадку, якщо ви обслуговуєтесь по гарантії, але, тим не менш, може бути корисна.

Оновлення ПЗ
Проблема при оновленні актуальна для обладнання DELL віком 3-5 років. Нагадаємо, що всі маніпуляції з сервером Dell виробляються за допомогою Lifecycle, яка вбудована в програмне забезпечення сервера, а також iDRAC.

Інтегрований контролер віддаленого доступу Dell 7 (iDRAC7) — програмне забезпечення для серверів Dell, яке віддалено підключається до сервера, навіть якщо у сервера немає живлення, але підключений інтернет та блок живлення. При підключенні до сервера, ЗА виводить на екран дані про стан системи, а також дозволяє перевірити та оновити всі компонентами: починаючи від біоса і закінчуючи драйверами на материнську плату, блоки живлення тощо, а також прошивку.
Тут, при стандартному сценарії, є два варіанти. Перший, оновлення в ручному режимі, з флеш-карти — у разі, якщо немає підключеного до сервера інтернету. Тоді заходимо в Lifecycle і оновлюємося з флеш-накопичувача. Якщо щось не пішло, підключаємо сервер до інтернету та оновлюємося, або заходимо через iDRAC і відновлюємо початкові налаштування, встановлюємо необхідні оновлення.

Однак, якщо сервер досить старий, проблеми чекають майже відразу: при спробі встановити програмне забезпечення через Інтернет з системи відновлення та діагностики Lifecycle. Причина такої проблеми в тому, що виробник спочатку, ще на зорі цієї системи, не використовував протокол захисту на FTP — сервері оновлення прошивок компонентів своїх серверів. Зараз, коли такі сертифікати захисту введені, старе обладнання трьох-п'ятирічної давності випуску іноді насилу може оновитися через Інтернет.

Вирішується проблема досить просто і багато з вас вже напевно здогадалися, як це можна зробити: оновити ПЗ, а саме Lifecycle, але спочатку оновити систему IDRAC. Оновлення доступні безкоштовно на офіційному сайті технічної підтримки Dell. Перевірка гарантії і завантаження оновлень на ваш сервер Dell).

Після цієї маніпуляції, ви зможете зручно завантажити всі драйвери і інші оновлення через Інтернет, незалежно від року випуску вашого сервера — якщо, звичайно, на сайті виробника є для нього набір оновлень.

Помилка оновлення iDRAC
Нагадаємо, що iDRAC представлений у варіантах «стандартний», «експрес» і «enterprise». Стандарт йде в комплекті при купівлі сервера. Якщо замовляємо комплектацію «експрес», то на материнську плату сервера нам ставлять відповідну ліцензійну мікросхему. Таким чином, ми отримуємо новий порт, який дозволяє нам отримувати більш інформативні дані через Web.

При стандартній ліцензії, коли ми на робочому комп'ютері підключаємося через браузер до системи iDRAC, ми можемо побачити огляд інформації про систему на стандартній вкладці, сервіс-тег сервера, модель і не більше того.



Через експрес, тобто якщо у нас 7 версія iDRAC, ми вже можемо оновлювати BIOS, Lifecycle, і т. д. безпосередньо через систему віддаленого доступу iDRAC. У ранніх версіях системи, на жаль, ця можливість не передбачена: там можна оновлюватися тільки через флеш-накопичувач.

Enterprise – самий повний комплект доступних функцій з управління сервером через порт iDRAC, який дозволяє повноцінно відстежувати і оновлення, і повний список компонентів, і поточний стан сервера. Це зручний і функціональний комплект, але ми зуміли знайти в ньому один невеликий, але істотний недолік.

Після оновлення версії iDRAC Enterprise 1.30.30 або 1.45.45, система перестає ініціалізується і не стартує з-за неправильних налаштувань. Як результат, якщо ми входимо в iDRAC в налаштуваннях BIOS, ми не можемо його не вимкнути, ні що б то ні було зробити для того, щоб відновити його або перезавантажити.

Для більшості користувачів, єдиний вихід у такій ситуації, це звернення в техпідтримку. Якщо ваш сервер на гарантії, то фахівці приїдуть і замінять материнську плату. Ми, в свою чергу, стикалися з цією проблемою і, як не дивно, допомогло цілком стандартне рішення, наведене на офіційному форумі Dell: сервер довелося знеструмити на 5 хвилин, вийняти блоки живлення і відключити всі дроти. Правда, якщо це не допомогло, то вам все-таки доведеться замінити материнську плату.

Помилка Е1410
Помилка Е1410 видається після апгрейду: ви додали ще один процесор, але з ним сервер чомусь не стартує. Вірніше, він включається, індикатори поперемінно загоряються, він голосно шумить, але при цьому на екрані нічого немає і пише помилку на дисплеї діагностичної панелі.



Проблема в даному випадку полягає в тому, що на сокеті CPU 1, загнуті ніжки сокета, які прилягають до процесора – або одна, або відразу декілька. На зображенні ви бачите справні ніжки сокета (ліворуч) і місце, де вони загнуті (праворуч). Ніжки можна виправити вручну, на цьому проблема буде вичерпана.

Як ви вже здогадалися, при даній помилку другий процесор не стартує тому, що частина функціональності першого процесора виявилася відключена. Яка саме? Варіантів може бути безліч, одні з них: або це ніжки відповідають за старт другого процесора, або блок оперативної пам'яті не стартує від другого процесора. Це залежить від того, яка ніжка загнута.

Некоректна установка оперативної пам'яті
Проблема часто зустрічається при апгрейді. В даному випадку мова йде цілком і повністю про людському факторі. Однак ця помилка дуже поширена в силу того, що на кожну модель присутня своя специфікація по установці. По-перше, залежно від моделі, майже в кожному сервері різну кількість портів. Відповідно, певну кількість оперативки потрібно додавати в свої порти. Іноді завдання ускладнюється багато разів: наприклад, у моделі DELL R610 оперативна пам'ять трьохканальна, тому необхідно додавати по три планки на один канал. Легко можна помилитися, вибираючи з 12 слотів і 4 каналів.

Пам'ять типу DDR3 інтерфейс складається з трьох каналів до двох модулів Rdimm або UDIMMs на канал
для одиночного або подвійного рангу і до двох модулів Rdimm на канал для квадра рангу. Інтерфейс використовує 2 ГБ, 4 ГБ, 8 ГБ або 16 ГБ модулів Rdimm. Також підтримується 1 ГБ або 2 ГБ UDIMMs.

Тому часто виходить при невірному розрахунку пам'яті одна з планок або кілька встановлені в невірні слоти, або зовсім не вистачає для оптимальної конфігурації.

Другий момент, що часто призводить до розбіжностей з оперативної пам'яті полягає в тому, що пам'ять для серверів підрозділяється по харчуванню на 1,35 V і 1,5 V. Оперативка 1,35 вольт стартує тільки починаючи з 56-ї версії процесора. На більш ранніх версіях серверів можна використовувати тільки планки, розраховані на 1,5 вольт. Якщо сервері будуть стояти різні планки, то він не запуститься і видасть відповідну помилку.

Виглядає це таким же чином, як у випадку з загнутими сокетами і помилкою запуску другого процесора. Якщо помилки на екрані дисплея не відображається, сервер пише «Server is booting...» і на екрані нічого не відображається, спробуйте перевірити конфігурацію пам'яті. Замініть пам'ять у відповідності зі спеками та встановіть правильні слоти, щоб отримати оптимальну конфігурацію.

Переваги серверів Dell
Справедливості заради хотілося б закінчити статтю, поговоривши про плюси серверів Dell. А вони, на нашу думку, повністю нівелюють ті проблеми, які ми описали вище. Адже, в першу чергу, ці проблеми зустрічаються при реконфігурації серверів.

  • Сервер «як-він-є» від Dell, мабуть, найбільш безпроблемний і зручний для всіх дій з серверами. Це перше, що ми можемо сказати на основі нашого досвіду.
  • Так само у Dell є підтримка найпотужніших процесорів на даний момент: як покоління Е3 так і Е5, до 12-ядерних процесорів (R720, R720XD).
  • Холодний старт сервер Dell набагато швидше інших вендорів великої трійки.
  • сервери Dell великий вибір кошиків для підключення HDD дисків – 2,5 дюйма і 3,5 дюйма, які можна підключити до 12 HDD (у випадку з R720XD). З перехідниками можна підключати SSD диски. На 3,5 дюйма існують кошика на 4, 6, 8, 12 дисків, а на 2,5 дюйма — до 8.
  • Майже у всіх моделях Dell присутня можливість підключення резервних блоків живлення.
  • Техпідтримка на заявки реагує дуже швидко.
  • Тому, незважаючи на те, що сервери Dell трішки дорожче аналогів від інших постачальників, інвестиції вкладені в ці сервера виправдовуються.
Сподіваємося, що наша стаття допоможе вам при апгрейді, діагностики та придбанні б/в-сервера. Залишилися питання? Пишіть в коментарях.



Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.