Причини відходу в офлайн серверних ферм Amazon, Northrop Grumman, Salesforce

Аварії, навіть у найнадійніших дата-центрах, відбуваються регулярно. Як правило, власники серверних ферм з великою неохотою діляться даною інформацією. Згідно зі статистикою, середній розмір витрат за даунтаймов на серверних фермах тільки зростає, показник збільшився на 41% порівняно з 2010 роком, тепер сума витрат становить майже 8 тисяч доларів у хвилину ( звіт дослідницьких компаній Ponemon Institute і Emerson Network Power). Втрачаються гроші, імідж компаній зачеплений, репутація заплямована, адже надійність обчислювальної інфраструктури компанії — перший показник високотехнологічності цієї ж компанії. Але як показує практика, ніхто не застрахований від аварій.



ЦОД Northrop Grumman
В кінці травня майже 60 державних організацій штату Вірджинія (США) не могли достукатися до своїх ІТ-систем кілька годин. Викликано це було із-за відключення місцевої серверної ферми, яка належить компанії Northrop Grumman (ЦОД у місті Честер).



Несправний комутатор мережевий, викликав відключення електрики, — ось причина 5 годинного даунтайма. Проблему усунули, замінивши несправне обладнання резервним з тестової майданчику. Вихід з роботи комутатора призвів до відключення вихідного і вхідного трафіку в рамках інформаційно-технологічної інфраструктури органів виконавчої влади. Все це ще більше загострило і так нелегкі відносини між компанією Northrop Grumman і владою. Не так давно була висунута ініціатива про розірвання контракту на надання ІТ-послуг компанією Northrop Grumman. Даний контракт був підписаний 10 років тому на загальну суму $2,3 млрд.

Amazon
Минулого тижня на офіційному сайті Amazon Web Services (AWS) були опубліковані вибачення за трапився даунтайм, який призвів до недоступності багатьох сайтів. В офлайні виявилися сайти клієнтів AWS, це і новинні ресурси, сервіси потокового трансляції медіа-контенту та інші.



Причиною послужило аварійне відключення електроживлення з-за великого шторму, який обрушився на південно-східне узбережжя Австралії. В офлайн пішла хмарна серверна ферма в Сіднеї. Шторм став одним з найпотужніших в цьому році. Штормовий вітер, зливовий дощ і повінь пошарпали Новий Південний Уельс, стихія викликала перебої в роботі громадського транспорту, були затоплені вулиці. Майже 9 тисяч будинків в Сіднеї, Центральному узбережжі залишилися без електрики.



На усунення неполадок в дата-центрі знадобилося менше двох годин. Для Австралії характерні такі екстремальні погодні умови, не рідко це стає причиною відходу серверних ферм в офлайн.

Salesforce
Серверна ферма хмарного гіганта Salesforce у місті Вашингтон (округ Колумбія США) пішла в офлайн майже на добу. Це американська компанія була заснована ще в березні 1999 року, головний офіс розташований у Сан-Франциско, регіональні в 25 країнах по всьому світу. Спочатку компанія спеціалізувалася на CRM-системах.

Причиною вважається короткочасне відключення електрики із-за відмови автоматичного вимикача, яке призвело до прояв невідомого раніше бага мікропрограми.



Марк Беніофф, генеральний директор Salesforce, приніс свої вибачення клієнтами через Twitter. Вибачився за принесений шкоду, пообіцявши, що якщо раптом в майбутньому станеться подібне, проблема буде вирішена набагато швидше.
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.