image
Часто буває, коли щось не працює. І ніхто не хоче, щоб щось не працювало з його вини. В контексті великих інфраструктур і розподілених додатків помилка конфігурації може бути фатальною.
У статті я покажу як правильно тестувати оточення для програми, які інструменти використовувати, наведу приклади вдалого і доцільного тестування.
Стаття буде цікава командам, які практикують DevOps або SRE, відповідальним Dev, і іншим хорошим людям.

Читати далі →

Ми раді повідомити вам про те, що завершилася пленарна доповідь онлайн-трансляції запуску Visual Studio 2017, на якому провідні інженери і керівники Microsoft представили майбутнє інструментів розробки і довгоочікувана Visual Studio 2017 стала доступна для розробників по всьому світу!



Читати далі →

Вашому блозі ми почнемо з публікацій, створених за мотивами останніх виступів нашого технічного директора distol (Дмитра Столярова). Всі вони відбулися в 2016 році на різних професійних заходах і були присвячені темі DevOps і Docker. Одне відео із зустрічі Docker Moscow в офісі Badoo, ми вже публікували на сайті. Нові будуть супроводжуватися статтями, які передають суть доповідей. Отже...

31 травня на конференції RootConf 2016, що проходила в рамках фестивалю «Російські інтернет-технології» (РІТ++ 2016), секція «Безперервне розгортання і деплой» відкрилася доповіддю «Кращі практики Continuous Delivery з Docker». У ньому було узагальнено і систематизовано найкращі практики побудови процесу Continuous Delivery (CD) з використанням Docker та інших Open Source-продуктів. З цими рішеннями ми працюємо в production, що дозволяє спиратися на практичний досвід.

Дмитро Столяров (Флант) на RootConf 2016

Якщо у вас є можливість витратити годину на відео з доповіддю, рекомендуємо подивитися його повністю. В іншому разі — не нижче представлена основна вичавка в текстовому вигляді.

Читати далі →

Привіт, Хабр!

Встала переді мною нещодавно завдання: настроїти максимально надійний кластер серверів PostgreSQL версії 9.6.

За задумом, хотілося отримати кластер, який переживає випадання будь-якого сервера, або навіть декількох серверів, і вміє автоматично вводити в дію сервера після аварій.

Плануючи кластер я простудіював багато статей, як з основної документації до PostgreSQL, так і різних howto, у тому числі з Хабра, і пробував настроїти стандартний кластер з RepMgr, эксперементировал з pgpool.
В цілому воно запрацювало, але у мене періодично спливали проблеми з перемиканнями, потрібно ручне втручання для відновлення після аварій, і т. д.
Загалом я вирішив пошукати ще варіанти.
У результаті де-то (вже не згадаю точно, де) знайшов посилання на прекрасний проект Zalando Patroni, і все заверте…


Читати далі →

<img src=«habrastorage.org/files/425/d63/35f/425d6335f82243599f55b80012cef805.png» alt=«image» alt text"/>
З чого починається будь-який проект з ІТ-інфраструктурі? Якщо ви подумали про щось на кшталт: адміни зібралися, обговорили і хтось запропонував рішення, — то з високою ймовірністю потрапили в точку. Саме так йдуть справи з експлуатацією в російських компаніях, і у нас до недавнього часу теж.
У статті розповім про те, як ми витратили 5 мільйонів і майже півроку на те, щоб переконатися: відмінних фахівців і ентузіазму недостатньо для впровадження чого-небудь масштабного.
Читати далі →

Стан мережевої безпеки в 2016 році, докладний звіт Qrator Labs і Wallarm



«Хабраэффект» навпаки — атаки на Хабрахабр за рік (зверху) і на Гиктаймс (знизу). У лютому 2017 на Гиктаймс була нейтралізована атака в 17,5 Гбіт/с.



Як компанія, чиєю основною діяльність є нейтралізації DDoS, в минулому році ми спостерігали кілька змін у галузі.

Інциденти, пов'язані з атак типу «відмова в обслуговуванні» знову на слуху, але тепер грамотно виконані атаки вже погрожують доступності цілих регіонів. На проблему знову потрібно звертати підвищену увагу, ніби ми повернулися на 5-7 років назад у минуле.

До минулого року могло здатися, що проблема DDoS вже досить добре вирішена.

Але потужність атак і їх складність в минулому році зросли радикально. У минулому навіть потужні атаки в 100-300 Гбіт/с не викликали особливої «головного болю». Складні типи атак на протоколи прикладного рівня траплялися рідко. А в 2016 році світ вперше побачив атаки в 1 Тбіт/с, і атаки на рівень L7 стали куди більш поширеними.

Читати далі →

Automount afuse

Я хотів розповісти про своє відкриття afuse — автомонтирование файлових систем на вимогу, автоматично.

Хіба не здорово просто зробити:
ls /mnt/remote/web.example.com/var/lib/www/

і відразу побачити файли web-сервера, ніяк не встановлюючи за ним з'єднання спеціально?

Я цим користуюся вже давно, а головне:
  • Це працює з будь-якого джерела: Не важливо, робите ви зазначений висновок в консолі, зберегли посилання в MC або переходите з favorites вашого улюбленого менеджера такого як nautilus або dolphin
  • Ви можете переходити на будь-який хост, куди у вас є доступ по ключам (налаштувати запит пароля теж можна, але це не цікаво)
  • Ви можете запросто вказати під яким користувачем входити на сервер, традиційно використовуючи @:
    cd /mnt/remote/apache@web.example.com/var/lib/www/
    




Читати далі →

SmartMonitoring — моніторинг бізнес-логіки в Однокласниках



Зараз у нас в Однокласниках є чотири географічно розподілених дата-центру, 11 тис. серверів, більше 1 тис. мережевих пристроїв, 180 сервісів. Під сервісами ми розуміємо фото, відео, музику, стрічку і т. д. Щодня сайт відвідують десятки мільйонів унікальних користувачів. І за всім цим господарством необхідно стежити, чим і займаються:

  • команда інженерів, яка встановлює обладнання, змінює диски, вирішує hardware-інциденти;
  • команда моніторингу, яка якраз шукає ці інциденти і віддає в роботу іншим командам;
  • мережеві адміністратори, вони працюють з мережею, налаштовують обладнання;
  • системні адміністратори, вони адмініструють і налаштовують портал;
  • розробники.
Ми самі встановлюємо і налаштовуємо наші сервери, але так як їх дуже багато, то неминуче, що кожен день щось ламається. І наша найголовніша задача в такому випадку — побачити поломку швидше користувачів. Тому за роботу всього порталу відповідає ціла команда моніторингу. Вони переглядають графіки, шукають у них аномалії, заводять інциденти, розподіляють «автоинциденты», які створюються за допомогою зв'язки Zabbix + JIRA. Ми не просто моніторимо бізнес-логіку, але і автоматично її аналізуємо. Детальніше про це я розповім далі.

Читати далі →