Дані краще, ніж нафта, або шостий набір на програму big data

Хабр, привіт!

Складно повірити, але 16 березня ми запустимо вже 6 набір нашій програми «Фахівець з великим даними».

image

На поточний момент у нас вже близько 160 випускників, які з різним ступенем залученості застосовують знання та навички, отримані на програмі. Напевно, можна задатися, питанням, чи потрібно таку кількість кадрів. Відповіді на це резонне сумнів є два. По-перше, ми тримаємо руку на пульсі і періодично проводимо аналіз ринку. По-друге, ринок не є статичною сутністю і зростає, причому кількість відкритих вакансій не є достатнім показником для вимірювання цього попиту.

Читати далі →

Вебінар: Введення в Singularity



Команда FlyElephant запрошує всіх на вебінар "Введення в Singularity", який проведе
Gregory Kurtzer (HPC Systems Architect і Technical Lead в Lawrence Berkeley National Laboratory).
Вебінар буде проходити завтра, 15 лютого, о 19:00 (EET) / 9:00 am (PST). Мова — англійська.

Читати далі →

Проста технологія класифікації розпізнаних сторінок ділових документів на основі методу Template Matching

image
Завдання класифікації добре відома: потрібно віднести довільний об'єкт з деякої вибірки до одного чи кількох класів з заздалегідь визначеного безлічі класів.
Читати далі →

Cognitive Services & LUIS: Введення в розпізнавання природної мови

У цій статті ми поговоримо про розуміння мови (про лінгвістичних обчисленнях, таких як призначення міток, синтаксичний аналіз і так далі) і звернемо особливу увагу на два API: Linguistic Analysis API і інтелектуальну службу розпізнавання мови (LUIS). Якщо ви любите англійську мову так само, як російська і захоплюєтеся навчанням штучного інтелекту, ласкаво просимо під кат.



Читати далі →

Чернетка книги Ендрю Ина «Жага машинного навчання», глави 1-7

У грудні минулого року в листуванні американських колег за data science прокотилася хвиля обговорення довгоочікуваного чернетку нової книги гуру машинного навчання Ендрю Ина (Andrew Ng) «Жага машинного навчання: стратегії для інженерів в епоху глибинного навчання». Довгоочікуваного, тому що книга була анонсована ще влітку 2016 року, і ось, нарешті, з'явилося кілька розділів.

image
Уявляю увазі Хабра-спільноти переклад перших семи глав з доступних в даний момент чотирнадцяти. Зауважу, що це не фінальний варіант книги, а чернетку. У ньому є ряд неточностей. Ендрю Ин пропонує писати свої коментарі і зауваження сюди. Починає автор з речей, які здаються очевидними. Далі очікуються більш складні концепції.

Читати далі →

Техносфери Mail.Ru — три роки


Сьогодні виповнилося три роки з моменту запуску одного з наших освітніх проектів — Техносфери Mail.Ru, з'явився спільно з факультетом ВМК МГУ ім. Ломоносова. Програма Техносфери розрахована на підготовку фахівців у сфері великих даних. Спочатку вона була розрахована на один рік і складалася з шести дисциплін. Проте через рік ми переглянули програму і зробили її дворічної. Протягом чотирьох семестрів студенти вивчають 12 дисциплін, виконуючи великий обсяг практичних робіт. Заодно був розроблений підготовчий курс «Алгоритми та структури даних».

В Техносферу приймають студентів 2-4-х курсів. Незважаючи на те що схема вступних іспитів у всі наші освітні проекти однакова (студенти здають онлайн-тест і проходять очна співбесіда), в Техносфери ми більше орієнтуємося на базові знання з вищої математики. Крім читання лекцій ми створили лабораторію, де студенти працюють з реальними завданнями, з якими ми стикаємося в Mail.Ru Group. Наприклад, намагаються покращити аналітичні алгоритми, створити певні евристики. Тобто роблять все те ж саме, що вони робили б під час звичайної стажування в компанії. З осені 2015 року в лабораторії почали проводити наукові дослідження. Наприклад, вивчаються можливості застосування нейронних мереж для вирішення тих чи інших бізнес-завдань.

І в честь дня народження ми викладаємо список навчальних матеріалів, які рекомендовані до вивчення нашим студентам протягом всього дворічного курсу.

Читати далі →

Скоро відкриття ML Boot Camp III



15 лютого стартує Machine Learning Boot Camp III — третє змагання з машинного навчання та аналізу даних від Mail.Ru Group. Сьогодні розповідаємо про минулий контесті і відкриваємо таємниці нового! Отже, в ході майбутнього конкурсу потрібно буде вгадати, чи залишиться учасник в онлайн-грі або піде з неї. Вибірки для завдання побудовані на дванадцяти ігрових ознаках для 25000 користувачів. Природно, всі дані анонимизированы.

Читати далі →