Огляд систем управління та моніторингу HP Software



Управління і моніторинг ІТ-інфраструктури – одна з головних завдань ІТ-департаменту будь-якої компанії. Рішення HP Software дозволять спростити завдання системних адміністраторів та організувати ефективний контроль мережі організації

Сучасна ІТ-інфраструктура являє собою складну гетерогенну мережу, що включає в себе телекомунікаційні, серверні і програмні рішення різних виробників, що працюють на базі різних стандартів. Її складність і масштабність визначають високий рівень автоматизованих засобів моніторингу та управління, які повинні використовуватися для забезпечення надійної роботи мережі. Програмні продукти HP Software допоможуть вирішити завдання моніторингу на всіх рівнях, від інфраструктури (мережевого обладнання, серверів і систем зберігання) до контролю якості роботи бізнес-сервісів і бізнес-процесів.

Системи моніторингу: якими вони бувають?


В сучасних платформах для моніторингу ІТ існує 3 напрямки для розвитку та виведення моніторингу на новий рівень. Першу називають «Міст» («Зонтична система», «Менеджер менеджерів). Її концепція полягає в утилізації інвестицій у вже наявні системи, які виконують завдання моніторингу окремих частин інфраструктури, і перетворення самих систем в інформаційні агенти. Такий підхід є логічним розвитком звичайного моніторингу ІТ-інфраструктури. В якості передумов впровадження системи типу «Міст» може служити прийняття ІТ-відділом рішення консолідувати розрізнені системи моніторингу для переходу до моніторингу ІТ послуг/систем як чогось цілого, розрізнені системи не здатні показати всю картину, випадок не діагностування серйозного збою додатків, а також велика кількість попереджень і аварійних сигналів, відсутність єдиного охоплення, пріоритезації та виявлення причинно-наслідкового зв'язку.

Результатом впровадження стане автоматизований збір всіх доступних подій та метрик ІТ-інфраструктури, зіставлення їх стану і впливу на «здоров'я» сервісу. У разі збою оператор отримає доступ до панелі, що відображає кореневу причину збою з рекомендаціями щодо її усунення. В разі типового збою є можливість призначити скрипт, що автоматизує необхідні дії оператора.

Наступна тенденція називається «Аналітика аномалій». Тут, як і в першому випадку, метрики і події збираються з ряду систем інфраструктурного моніторингу, а крім того, налаштований збір логів ІТ та безпеки. Таким чином, щохвилини накопичується величезна кількість інформації, і компанія хоче отримати переваги від її утилізації. Для впровадження «Аналітики аномалій» існує цілий ряд причин: складність своєчасного збору, зберігання та аналізу всіх даних, потреба реактивно усувати невідомі проблеми, неможливість швидкого визначення важливою для усунення збоїв інформації, складність виконання операцій вручну пошуку окремих журналів, а також необхідність визначення відхилень і повторюваних збоїв.

Впровадження системи дозволить реалізувати автоматизований збір подій, метрик і логів, зберігання цієї інформації необхідний період часу, а також аналіз будь-якої інформації, включаючи журнали, відомості про ефективність систем. Крім цього, стане можливим прогнозування та вирішення будь-яких типів завдань і запобігання відомих збоїв.

І нарешті – «Управління продуктивністю додатків», або виявлення та усунення збоїв в транзакціях кінцевих користувачів. Таке рішення може бути корисним додатком, що працює в тісному контакті з попередніми двома. При цьому така система сама по собі теж може давати швидкий результат від впровадження. В даному випадку у компанії є додатки, важливі для бізнесу. При цьому важливими є доступність та якість послуги, одним із ключових елементів якої є додаток (інтернет-банкінг, CRM, біллінг тощо). При падінні доступності та якості надання цього сервісу, як правило, заходить мова про проактивности і швидкому відновленні. Така система зазвичай впроваджується, коли необхідно підвищити доступність сервісів, додатків і продуктивність, а також скоротити середній час відновлення працездатності. Крім того, такий підхід гарний для усунення зайвих витрат і зниження ризиків, пов'язаних з угодою про рівень обслуговування (SLA), і для запобігання відходу замовників (захист бізнесу).

Результати впровадження у залежності від головної задачі можуть відрізнятися. У загальному випадку це дозволяє реалізувати виконання типових дій користувача «роботом» з різних регіонів\сегментів мережі, розбір «зеркалированного» трафіку, перевірку доступності та якості роботи сервісів з виявленням вузьких місць, інформування оператора про необхідність відновити працездатність із зазначенням місця деградації. При необхідності стає можлива глибока діагностика роботи програми для пошуку причин систематичного погіршення роботи сервісів.

Зазначені вище підходи можуть бути реалізовані з допомогою продуктів HP Software, про яких і піде мова далі.

«Міст» від HP

HP Operations Bridge представляє новітнє покоління «парасолькових систем моніторингу». Рішення поєднує дані моніторингу від власних агентів, різних модулів моніторингу HP Software і засобів моніторингу інших розробників. Потік подій від всіх джерел інформації накладається на ресурсно-сервісну модель, до нього застосовуються кореляційні механізми для визначення того, які події є причинами, симптомами та наслідками.



Окремо слід зупинитися на ресурсно-сервісної моделі, а точенне моделях, так як таких моделей може не обмежена кількість для аналізу інформації в різних ракурсах. Від її повноти та актуальності залежить можливість вирішення виконувати кореляцію потоку подій. Для підтримки актуальності моделей використовуються засоби розвідки на базі агентів і безагентных технологій, що дозволяють отримувати детальну інформацію про компоненти сервісу, взаємозв'язки між ними і взаємному впливі один на одного. Також є можливість імпорту даних про топологію сервісу із зовнішніх джерел – систем моніторингу.

Ще один важливий аспект – зручність управління. У складних і мінливих середовищах важливо забезпечити підстроювання системи моніторингу при зміні структури систем і додавання нових сервісів. У Operations Bridge входить компонент Monitoring Automation, який дозволяє в автоматичному режимі налаштовувати системи, що вводяться в периметр моніторингу, для чого використовуються дані про сервісно-ресурсних моделях. Одночасно підтримується конфігурування і зміна вже виконаних раніше налаштувань моніторингу.

Якщо раніше адміністратори могли виконувати однакові налаштування однотипних компонентів інфраструктури (наприклад, метрик на Windows, Linux або UNIX-серверах), що вимагало чимало часу і зусиль, то тепер можна динамічно і централізовано настроювати порогові значення для метрики в розрізі послуги сервісу.

Аналітика додатків

Використання традиційного підходу до моніторингу передбачає, що спочатку відомо, які параметри контролювати і які події відстежувати. Зростаюча складність і динаміка розвитку ІТ-інфраструктур змушує шукати інші підходи, так як стає все складніше контролювати всі аспекти роботи системи.

HP Operations Analytics дозволяє зібрати і зберегти всі дані про роботу додатка: лог-файли, телеметрію, бізнес-метрики і метрики продуктивності, системні події і т. д., і використовувати аналітичні механізми для виявлення тенденцій та прогнозування. Рішення призводить зібрані дані до єдиного формату і потім, здійснюючи контекстний вибір, на підставі даних лог-файлів відображає на тимчасовій шкалі, що, в який момент і на якій системі відбувалося. Продукт надає кілька форм візуалізації даних (наприклад, інтерактивна «теплова карта» і топологія взаємозв'язків лог-файлів) і використовує функцію помічника для того, щоб у контексті події або по введеному в рядку пошуку запит знайти всю сукупність даних, зібраних за конкретний період. Це допомагає оператору зрозуміти, що призвело до збою (або, при використанні даних HP SHA разом з даними HP OA, зробити відповідний прогноз), а також виявити винуватця, так і кореневу причину того, що сталося збою. HP Operations Analytics дає можливість відтворити картину роботи сервісу та оточення в момент виникнення збою і ізолювати його в контексті часу.



Ще один аналітичний інструмент – HP Service Health Analyzer. HP SHA виявляє аномальну поведінку контрольованих елементів інфраструктури з метою попередження можливої відмови в наданні сервісів або порушення заданих параметрів їх надання. У продукті застосовуються спеціальні алгоритми статистичного аналізу даних на основі топологічної сервісно-ресурсної моделі HP BSM. З їх допомогою забезпечується можливість побудови профілю нормальних значень параметрів продуктивності, що стягуються як з програмно-апаратних платформ, так і з інших модулів BSM (наприклад, HP RUM, HP BPM), що характеризують стан сервісів. У подібні профілі вводяться типові значення параметрів з урахуванням днів тижня і часу доби. SHA виконує історичний та статистичний аналіз накопичених даних (для розуміння суті виявлених даних), а також здійснює зіставлення з наявними динамічним профілем (baselining).

Контроль продуктивності додатків

Коли мова заходить контроль продуктивності додатків, слід виділити наступні компоненти рішення HP:
  • HP Real User Monitoring (HP RUM) – контроль проходження транзакцій реальних користувачів;
  • HP Business Process Monitoring (HP BPM) – контроль доступності додатки методом емуляції дій користувачів;
  • HP Diagnostics – контроль проходження запитів усередині додатку.
HP RUM і HP BPM дозволяють оцінити доступність програми з точки зору кінцевого користувача.



HP RUM розбирає мережевий трафік, виявляючи в ньому транзакції реальних користувачів. При цьому можна контролювати обмін даними між компонентами програми: клієнтською частиною, сервера додатків та бази даних. Це дає можливість відстежити активність користувачів, час обробки різних транзакцій, а також визначити взаємозв'язки між діями користувачів і бізнес-метриками. Використовуючи HP RUM, оператори служби моніторингу зможуть миттєво отримувати оперативні повідомлення про проблеми в доступності сервісів та інформацію про помилки, з якими зіткнулися користувачі.

HP BPM являє собою засіб активного моніторингу, яке виконує синтетичні користувальницькі транзакції, для контрольованих систем відрізнити від реальних. Дані моніторингу HP BPM зручно використовувати для розрахунку реального SLA, так як «робот» виконує ідентичні перевірки в однакові проміжки часу, забезпечуючи постійний контроль якості обробки типових (або найбільш критичних) запитів. Налаштувавши проби для виконання синтетичних транзакцій з декількох точок (наприклад, з різних офісів компанії), можна також оцінити доступність сервісу для різних користувачів з урахуванням їх розташування і каналів зв'язку. Для емуляції активності HP BPM використовує інструмент Virtual User Generator (VuGen), який також застосовується в популярному продукті навантажувального тестування HP LoadRunner. VuGen підтримує величезний спектр різних протоколів і технологій, завдяки чому можна контролювати доступність практично будь-яких сервісів, а також використовувати єдиний набір скриптів для тестування та моніторингу.
Якщо ж причина збоїв або уповільнення роботи сервісу знаходиться всередині таких технологій, як Java, .NET і т. д., допоможе HP Diagnostics.

Рішення забезпечує глибокий контроль Java, .NET, Python на платформах Windows, Linux і Unix. Продукт підтримує різноманітні сервера додатків (Tomcat, Jboss, WebLogic, Oracle та ін), MiddleWare і бази даних. Спеціалізовані агенти HP Diagnostics встановлюються на серверах додатків і збирають дані, специфічні для конкретної технології. Наприклад, для Java-додатки можна побачити, які запити виконуються, які методи використовуються і скільки часу витрачається на їх відпрацювання. Автоматично отрісовиваємих структура програми, стає зрозуміло, як задіяні його компоненти. HP Diagnostics дозволяє відстежити проходження бізнес-трансакцій всередині комплексних програм, визначити вузькі місця і забезпечити експертів необхідною інформацією для прийняття рішень.


Дистрибуція рішень НР Україні, Грузії, Таджикистані, країнах СНД.
Навчальні курси з технологій НР в Києві (УЦ МУК)
МУК-Сервіс — всі види ІТ ремонту: гарантійний, не гарантійний ремонт, продаж запасних частин, контрактне обслуговування

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.