Google використовує машинне навчання, щоб підвищити ефективність центрів обробки даних

    Інтернет-гігант застосовує машинне навчання і штучний інтелект для підвищення ефективності своїх дата центрів. Як повідомив Джо Кава, віце-президент напряму ЦОД в Google, компанія почала застосовувати нейронні мережі для аналізу величезної кількості даних, що збираються на серверах, і видачі рекомендацій з удосконалення їх роботи.
 
Фактично, Google збудував комп'ютер, який знає про його дата-центрах навіть більше, ніж самі інженери. Людський ресурс не списується з рахунків, але Кава вважає, що використання нейронної мережі дасть Google можливість досягти нових горизонтів в ефективності роботи серверних ферм завдяки виходу за рамки того, що можуть побачити і проаналізувати інженери.
 
 
 
Під управлінням Google вже знаходиться кілька найбільш енергоефективних дата-центрів на планеті. Використання штучного інтелекту дасть Google можливість зазирнути в майбутнє і змоделювати тисячі схем роботи своїх Цодов.
 
На ранніх етапах використання нейронні мережі дозволяли Google передбачити коефіцієнт PUE з точністю 99,6%. Рекомендації ці при всій удаваній незначності привели до істотної економії коштів, тому що були застосовані до тисяч серверів.
 
Чому ж Google звернувся до машинного навчання та нейронних мереж? Головна причина криється в тому, що дата центри постійно розширюються, що стає викликом для Google, що використовує сенсори для збору мільйонів значень даних про інфраструктуру та споживанні енергії.
 
«У такій динамічній середовищі, як ЦОД, людині часом складно побачити всі взаємозв'язки змінних системи», — говорить Кава. — «Ми довго працюємо над оптимізацією роботи ЦОД. Всі безумовно кращі способи вже були впроваджені, але ми не повинні зупинятися! »
 
 image
 
 

Знайомтеся, хлопчик-геній

Нейронна мережа Google створена Джимом Гао, інженером Google, якого колеги прозвали "хлопчик-геній" через здатність аналізувати великі обсяги даних. Гао займався аналізом систем охолодження, застосовуючи принципи гідродинаміки і дані моніторингу для створення 3D моделі повітряних потоків усередині серверного залу.
 
Гао вважав, що можна створити модель, що відстежує ще більший набір змінних, включаючи завантаженість ІТ-обладнання, погодні умови, роботу охолоджувальних башт, водяних насосів і теплообмінників, які підтримують нормальну температуру серверів Google.
 
«Комп'ютери хороші тим, що можуть бачити всю заховану в даних історію. Джим взяв інформацію, яку ми збираємо щодня і прогнав її через свою модель, щоб прийти до розуміння складних ланцюжків взаємодії, до розуміння сенсу, який могли не помітити працівники, будучи простими смертними »- пише Кава у своєму блозі. «Завдяки серії проб і помилок, модель Джима тепер дає точність 99,6% в підрахунку PUE. Це значить, він тепер може застосовувати моделі в пошуках нових способів збільшити ефективність наших дій ». Зображення нижче показує кореляцію між передвіщеним (чорна крива) і фактичним (жовта крива) змінами PUE.
 
 
 
 

Як це працює

Гао почав працювати над машинним навчанням як над «20-процентним проектом». За традицією Google дозволяє своїм працівникам витрачати частину свого робочого часу на розробку інновацій, крім своїх основних обов'язків. Гао ні фахівцем у штучному інтелекті. Щоб вивчити ключові моменти в машинному навчанні, Гао пройшов курс в Стенфорді у професора Ендрю Ина.
 
Нейромережа імітує роботу мозку людини, дозволяючи комп'ютеру розуміти і «вчити» завдання без необхідності їх програмування в явному вигляді. Пошуковик Google часто наводиться як приклад такого типу навчання, що також є одним з ключових напрямків досліджень в компанії. "Ця модель — не більше ніж набір обчислень диференціальних рівнянь — пояснив Кава. — «Але ви повинні розуміти математику. Модель починається з вивчення взаємодії змінних ».
 
Для початку Гао потрібно було виявити ключові фактори, що впливають на енергоефективність в ЦОДах Google. Він звузив кількість цих показників до 19 і спроектував нейронну мережу, машинну систему навчання, здатну розпізнавати шаблони у великих масивах даних.
 
«Величезна кількість комбінацій обладнання та налаштувань ускладнює знаходження оптимальної ефективності», — пише Гао в своїй доповіді. — «В працюючому ЦОДі завдання можуть бути реалізовані безліччю комбінацій обладнання (механічного та електричного) і ПО (стратегії управління та установки). Перевірити кожну комбінацію для підвищення ефективності практично неможливо — є тимчасові обмеження, часті коливання навантаження в роботі ІТ-обладнання, погодні умови, а також необхідність підтримувати стабільну роботу ЦОД. »
 
 
 
 

Працює на єдиному сервері

Що стосується обладнання, то за заявою Кави, система не вимагає неймовірних обчислювальних потужностей і працює на одному сервері, а змогла б працювати навіть на одному висококласному настільному комп'ютері.
 
Система була запущена на декількох дата-центрах Google. Інструмент машинного навчання зміг запропонувати кілька змін, що призвели до поступового поліпшення PUE, включаючи удосконалення розподілу навантаження при збільшенні потужності інфраструктури, а також невеликі зміни температури водяної системи охолодження.
 
«Останні тести в ЦОДах Google показали, що машинне навчання — ефективний метод використання існуючих показників датчиків для моделювання розподілу енергії в ЦОД і веде до істотної економії коштів», — пише Гао.
 
 

Машини не беруть верх

Кава вважає, що цей інструмент допоможе Google моделювати й удосконалювати інші проекти в майбутньому. Але не варто хвилюватися, дата-центри Google ще не скоро обзаведуться самосвідомістю. Зараз компанія цікавиться автоматизацією, і навіть недавно придбала компанії-розробників робототехніки, але поки жоден з Цодов Google не працює виключно на автоматизованому управлінні ».
 
«Нам все ще потрібні люди, щоб робити правильні висновки про все це», — говорить Кава. — «І я все ще хочу, щоб наші інженери ознайомилися з цими рекомендаціями».
 
Найбільші бонуси використання нейромережі проявляться в грядушіе роки, при будівництві нової серверної площадки Google. «Я передбачаю використання цього принципу в проектуванні дата центрів», — говорить Кава. — «Цю передову технологію можна використовувати і при проектуванні, і при подальших удосконаленнях. Думаю, ми знайдемо й інші способи застосування ».
 
Google поділився своїм підходом до машинного навчання в статті Гао, сподіваючись, що ті, хто також управляє потужними дата-центрами, зможуть застосувати це на практиці. «Цей механізм — не щось особливе, що може застосовувати тільки Google або тільки Джим Гао», — говорить Кава. — «Мені б дуже хотілося побачити більш широке застосування цієї технології. Я думаю, вся галузь тільки виграє від цього. Це чудовий інструмент, що дозволяє стати настільки ефективним, наскільки це можливо ».
    
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.