Зображення: Daniel Friedman, Flickr

В нашому блозі на Хабре ми багато пишемо про впровадження практик DevOps у процеси розробки та тестування створюються в компанії систем інформаційної безпеки. Завдання інженера-автоматизатора не завжди полягає тільки у встановленні та підтримки якогось сервісу, іноді необхідно вирішувати трудомісткі дослідницькі завдання.

Для вирішення однієї з таких задач — аналізу вразливостей в ході тестів конкурентного аналізу, ми розробили власний універсальний класифікатор. Про те, як працює цей інструмент, і яких результатів дозволяє домагатися, і піде мова в нашому сьогоднішньому матеріалі.
Читати далі →

Про спагетті, або як дослідити бізнес-процеси організації
Багато керівників підприємств не володіють повною картиною того, що відбувається у власних виробничих підрозділах. Вони знайомі з організаційною структурою, напрямками діяльності, загальними економічними показниками. Якщо за результатом вийшла прибуток, то настає впевненість успіху. Але чи є на ринку підприємства, які тривалий час утримуються в «сліпому» режимі керування?

Спагетті


Читати далі →

Конкурс з програмування на PHP: Класифікатор слів (спеціальні призи)

Ми приносимо найглибші вибачення за довгу затримку при підготовці цього поста. Сьогодні ми публікуємо аналіз самонавчаючих рішень, надісланих на конкурс з програмування, і вручаємо два спеціальні призи.

Англійська версія цього запису на GitHub.

Отже, 9 з надісланих рішень виявилися самообучающимися. Ідея самонавчання така: оскільки всі слова вибираються з кінцевого словника, а не-слова генеруються випадково, то всяка рядок, яка була представлена досліджуваної програмі повторно, з більшою ймовірністю опиниться словом, ніж не-словом. При досить тривалому тестуванні більшість слів зі словника встигнуть повторитися, тоді як для не-слів випадкові повторення зустрічаються набагато рідше.

Щоб спостерігати поведінку самонавчаючих рішень, ми протестували їх на 1 000 000 блоків. Тестувати на такій кількості блоків всі рішення було б нереально, але ці дев'ять виявилися досить швидкими.

На графіку нижче показана залежність відсотка правильних відповідей від кількості оброблених блоків. Зверніть увагу, що горизонтальна шкала — логарифмічна.

image

Читати далі →

Конкурс з програмування на PHP: Класифікатор слів (остаточні результати)

Сьогодні ми публікуємо остаточні результати конкурсу з програмування і нагороджуємо переможців.

По випадковості, всі троє призерів воліли брати участь під псевдонімами. Мені здається, з такими результатами їм нема чого соромитися. Якщо ви хочете представитися в коментарях, ласкаво просимо!

Отже, призові місця зайняли:
  1. Antelle — 83.67% правильних відповідей. Приз 3000 USD.
  2. SHB — 83.11% правильних відповідей. Приз 2000 USD.
  3. chianti — 83.00% правильних відповідей. Приз 1000 USD.
Нам потрібно ще трохи часу, щоб визначитися з тим, хто отримає спеціальні призи. Щонайменше один з них буде присуджено автору кращого з самонавчаючих рішень, про що буде написаний окремий пост.

Повну таблицю результатів дивіться в англійській версії на GitHub.
Джерело: Хабрахабр

Конкурс з програмування на PHP: Класифікатор слів (попередні результати)

Спасибі за очікування! Публікуємо попередні результати конкурсу з програмування.

Протестовано 312 рішень, з них 50 впало або зависло, ще 3 виявилися занадто повільними, щоб пройти всі тести. З решти 259 рішень 12 з різних причин були оголошені «поза конкурсом»: рішення не працювали без поправки типу файлу даних (автори забули галочку «gzip») або були надіслані співробітниками Hola.

Нинішні результати попередні. Ми сподіваємося, що не допустили помилок при підведенні підсумків, і тоді 20 червня 2016 ці результати стануть остаточними. Тоді ж замість ідентифікаторів рішень будуть опубліковані імена або псевдоніми їх авторів.

Рішення про переможця конкурсу показало результат у 83.67% правильних відповідей. Повні списки рішень з результатами тестування знаходяться в англійській версії поста на GitHub.

Там же ми публікуємо «сирі» машиночитані результати тестування кожного з рішень, де різноманітної інформації більше, ніж в зведених таблицях. На основі цих даних Ви можете провести власний аналіз результатів, чого ми будемо дуже раді.

Читати далі →

Конкурс з програмування на PHP: Класифікатор слів (про хід тестування)

Перш за все, ми приносимо всім учасникам конкурсу з програмування вибачення за затримку з результатами. Сьогодні ми публікуємо всі надіслані рішення і офіційні скрипти для генерації тестів і тестування, а також розповідаємо, як йдуть справи з перевіркою рішень.

Англійська версія цього поста розміщена на GitHub.

Протестувати 312 рішень

Велике спасибі всім учасникам! Ми отримали 603 рішення від 312 учасників. Оскільки ми приймаємо до тестування саме останнє з надісланих у термін рішень, то треба протестувати 312 рішень. Це був несподіваний результат. Сподіваюся, це трохи пояснює, чому це займає так багато часу.

Читати далі →

Конкурс по класифікації слів від Hola або «де взяти ще один відсоток?»

Побачив пост про конкурс, коли минуло вже два тижні після початку. Але завдання здалася дуже захоплюючою, і я не помилився в цьому, пірнувши в рішення з головою. Хочу поділитися рішенням на 80+% і своїми враженнями в цьому пості.

Все моє участь пройшло під питанням «де взяти ще один відсоток?», але у відповідь я частіше отримував соті частки відсотка або нічого. Отже, про все по порядку.

Читати далі →

Не ми такі — життя таке: Тематичний аналіз для самих нетерплячих

bayesian

— Чому?
Зараз Relap.io генерує 40 мільярдів рекомендацій в місяць на 2000 медиаплощадках Рунета. Майже будь-яка рекомендаційна система, рано чи пізно, приходить до необхідності брати в розрахунок вміст рекомендованого контенту, і досить швидко впирається в необхідність як його класифікувати: знайти якісь кластери або хоча б знизити розмірність для опису інтересів користувачів, залучення рекламодавців або ще для якихось темних чи не дуже цілей.

Завдання звучить досить очевидно і існує чимало добре зарекомендували себе алгоритмів та їх реалізацій: Латентний розміщення Діріхле (LDA), Імовірнісний латентно-семантичний аналіз (pLSA), явний семантичний аналіз (ESA), список можна продовжити. Однак, ми вирішили спробувати придумати що-небудь більш просте, але разом з тим, життєздатне.

Читати далі →

Конкурс з програмування на PHP: Класифікатор слів (додаток)

Спасибі всім, хто вже долучився або збирається брати участь у нашому конкурсі з програмування!

Ми вирішили опублікувати ряд важливих роз'яснень до правил, щоб допомогти учасникам уникнути типових помилок. Прикро було б дискваліфікувати цікаве рішення з чисто технічної помилки.

На численні прохання ми також публікуємо офіційний скрипт для тестування. З допомогою нього Ви можете самостійно перевірити, чи працює Ваша програма в умовах нашої тестової системи. Запустіть скрипт без аргументів, щоб дізнатися, як ним користуватися.

Для відправки робіт залишилася ще тиждень. Якщо цей пост допоміг Вам знайти помилку, ще є час виправити.

часті питання


Читати далі →

Поняття природної мови проти формальних класифікацій в OpenStreetMap

Ті, хто хоч трохи знайомий з проектом OpenStreetMap, ймовірно, чули про парі принципів, які закладені в його основу: «any tags you like» і той факт, що первинно в цьому проекті наповнення картографічної бази даних, а не те, як вміст цієї бази відображає стиль Standard на osm.org. Але чи так все добре і райдужно з семантичною структурою бази даних, враховуючи перший принцип? Читаючи російськомовну гілку форуму OSM, я вирішив розібратися в ситуації і описати її тут.


Читати далі →