Підтримка высоконагруженного проекту



Євген Потапов ( eapotapov
Доповідь про те, що робити з проектом після того, як ми його запустили. Ви спланували архітектуру проекту, ви продумали, як у нього буде працювати інфраструктура, продумали, як будете балансувати навантаження, нарешті, його запустили. Що робити далі? Як підтримувати, як зробити так, щоб проект продовжував працювати, і як зробити так, щоб нічого, зрештою, не впало?

Читати далі →

Monitoring driven експлуатація



Микола Сивко ( NikolaySivko, OKMeter.IO
Розповідь про те, як влаштована експлуатація в компанії HeadHunter, і як використовується моніторинг для того, щоб стежити за якістю експлуатації.

Читати далі →

Виклики пошукового хмари. Лекція в Яндексі

Інтернет-компанії вибирають і тестують обладнання для дата-центрів не тільки за номінальним специфікаціям, що надійшли від виробника, але і з урахуванням реальних продакшен-завдань, які будуть виконуватися на цьому обладнанні. Потім, коли дата-центр уже спроектований, побудований і запущений, проводяться навчання — вузли відключають без відома сервісів і дивляться, наскільки вони підготовлені до подібної ситуації. Справа в тому, що за такої складної інфраструктури неможливо добитися повної відмовостійкості. У якомусь сенсі ідеальний дата-центр — це той, який можна вимкнути без шкоди для сервісів, наприклад для пошуку Яндекса.


Керівник групи експертизи runtime пошуку Олег Федоров був у числі доповідачів на великій пошуковій зустрічі Яндекса, яка пройшла на початку серпня. Він розповів про всі основні аспекти проектування дата-центрів під завдання, пов'язані з обробкою великих обсягів даних. Під катом — розшифровка та слайди Олега.


Читати далі →

Про роль DevOps в ІТ — думки експертів


Изображение сайту tricentis.com

Існуючі реалії буквально вимагають від розробки програмного забезпечення ще більше скорочувати час виконання проекту: від виникнення ідеї до випуску готового продукту. Із завидною періодичністю замовники просять реалізувати проект «вчора», щоб його не скопіював «сьогодні» хтось інший. І, звичайно ж, бюджет на те, щоб зробити неможливе, як завжди, обмежений.

Розробникам нічого не залишається, як знову і знову займатися оптимізацією техпроцесу, експериментувати, пробувати нові методології. В особливо запущених» випадках тимчасові резерви шукають буквально в кожному відділі, а не тільки змушують розробників друкувати швидше.

Виявляється, швидше можуть працювати і тестувальники, і менеджери, і аналітики, і відділ впровадження. Залишається всього нічого придумати, як цього домогтися.
Читати далі →

Інструкція по оновленню пз та первинній настройці Nokia 7210 SAS-M

Ця стаття призначена для тих, хто хоче розібратися у процедурі первинного введення в експлуатацію обладнання Nokia (раніше Alcatel-Lucent) 7210 SAS-M. Єдино вірний підхід при роботі з будь-яким устаткуванням – попереднє читання документації. Але реальність така, що людині можуть поставити завдання термінового запуску обладнання, при цьому не підготувавши його до майбутньої роботі. Терміни горять, документації немає, настройка здійснюється «за натхненням». На жаль, це не рідкісна життєва ситуація, але результати її, в більшості випадків, плачевні.

Читати далі →

До питання реалізації персистентних процесів в керуючих системах реального часу (частина 2)

Продовження статті.

Початок: частина 1

3. Апаратура і вбудовані програми

Даний рівень реалізації системи управління характеризується дуже великою свободою вибору для розробника. Оскільки вище ми домовилися не розглядати в цій статті спеціалізовані апаратні рішення, обмежимося серійної апаратурою загального призначення.

Читати далі →

До питання реалізації персистентних процесів в керуючих системах реального часу (частина 1)

останнім часом черговим модним терміном в інформаційних технологіях стала «персистування». Багато статей публікується про персистентних даних, dzavalishin розробляє цілу персистентную операційну систему, і ми поділимося для різноманітності матеріалами нещодавно зробленого доповіді про персистентних процесах.

Персистування, кажучи по-простому, означає незалежність від стану яка обіймає середовища. Таким чином, на наш погляд, цілком правомірно говорити про персистентності процесів, як їх здатності виконуватися незалежно від стану породила їх середовища, в тому числі – від відмов на нижчих рівнях, що, взагалі кажучи, є однією з найважливіших задач при розробці автоматичних систем керування реального часу.

У статті проводиться класифікація основних рівнів реалізації функцій відмовостійкої системи керування, розгляд характерних для даних рівнів відмов і дослідження конкретних технічних рішень, застосовуваних на кожному рівні для забезпечення персистентності.

Читати далі →