Хабр, привіт! У сучасному машинному навчанні та науці про даних можна виділити кілька трендів. Перш за все, це глибоке навчання: розпізнавання зображень, аудіо та відео, обробка текстів на природних мовах. Ще одним трендом стає навчання з підкріпленням — reinforcement learning, що дозволяє алгоритмам успішно грати в комп'ютерні і настільні ігри, і дає можливість постійно поліпшувати побудовані моделі на основі відгуку зовнішнього середовища.

Є і ще один тренд, менш помітний, так як його результати для зовнішніх спостерігачів виглядають не так вражаюче, але не менш важливе — автоматизація машинного навчання. У зв'язку з його стрімким розвитком знову актуальним стає питання про те, чи не будуть data scientist'и зрештою автоматизовані і витіснені штучним інтелектом.

Читати далі →

Дані краще, ніж нафта, або шостий набір на програму big data

Хабр, привіт!

Складно повірити, але 16 березня ми запустимо вже 6 набір нашій програми «Фахівець з великим даними».

image

На поточний момент у нас вже близько 160 випускників, які з різним ступенем залученості застосовують знання та навички, отримані на програмі. Напевно, можна задатися, питанням, чи потрібно таку кількість кадрів. Відповіді на це резонне сумнів є два. По-перше, ми тримаємо руку на пульсі і періодично проводимо аналіз ринку. По-друге, ринок не є статичною сутністю і зростає, причому кількість відкритих вакансій не є достатнім показником для вимірювання цього попиту.

Читати далі →

Огляд ринку праці в області і big data data science

Хабр, привіт! За відповідним пошуковим запитам знайшлося близько 1000 вакансій, потім вони були вручну відфільтровані по заголовкам і описами, і для підготовки огляду ми використовували 288 активних вакансій в області і big data data science з HeadHunter.

Насправді активних вакансій більше, оскільки до уваги не приймалися інші ресурси (наприклад, SuperJob, Blastim, соціальні мережі, сайти компаній). Крім того, потрібно розуміти, що це всього лише знімок поточної ситуації, щодня вакансії заповнюються і з'являються нові.

Читати далі →

Як ми запускали програму Deep Learning

Хабр, привіт.

Як ви знаєте, для навчання глибоких нейронних мереж оптимально використовувати машини з GPU. Наші освітні програми завжди мають практичний ухил, тому для нас було обов'язково, щоб під час навчання у кожного учасника була своя віртуальна машина з GPU, на якій він міг вирішувати завдання під час занять, а також лабораторну роботу протягом тижня. Про те, як ми вибирали інфраструктурного партнера для реалізації наших планів і готували середовище для наших учасників, і піде мова в нашому пості.

Читати далі →

Передбачення тяжкості страхових вимог для компанії Allstate. Дипломний проект нашого випускника

Хабр, привіт! Наш випускник 4-го набору програми «Фахівець з великим даними» Кирило Данилюк поділився своїм дослідженням, яке він виконав в якості фінального проекту в одному з курсів. Вся документація і опис є на його гітхабі. Тут же ми наводимо переклад його звіту. Обережно — лонгрид.

Читати далі →

Як ми брали участь у HR-хакатоне. Наші випускники діляться своїм рішенням і враженнями від участі

Всім привіт!
23-24 листопада в Digital October проходив хакатон з аналізу даних в HR-сфері, в якому перемогла команда випускників нашої програми "Фахівець з великим даними". Кирило Данилюк, Ігор Парфьонов, Єгор Андрєєв і Олександр Иваночкин діляться своїм рішенням і враженнями від участі.
Читати далі →

12 кейсів з біг дати: підтверджені приклади з індустрії, коли біг дата приносить гроші

Хабр, привіт! Проаналізували кейси по big data, у яких технології великих даних допомогли компаніям більш ефективно працювати з клієнтами або оптимізувати внутрішні процеси.

До речі, незабаром у нас стартує перший набір програми Big Data for Executives, мета якої-підготувати керівника або власника бізнесу до використання даних у своїй діяльності. Почитати про неї докладніше можна тут.

Читати далі →

«Тримайте руку на пульсі і дивіться по сторонам» – інтерв'ю про ІЇ з співзасновником Intento Григорієм Сапуновим

днями ми вирішили поспілкуватися з нашим головним викладачем на Deep Learning, Григорієм Сапуновим, і обговорити з ним актуальні питання, пов'язані зі сферою штучного інтелекту (ШІ). Григорій кілька років тому був керівником розробки Яндекс.Новин. Зараз є CTO і співзасновником компанії Intento. Вже 15 років займається аналізом даних, штучним інтелектом і машинним навчанням, з 2011 року займається Deep Learning, брав участь у проектах RoadAR (нейромережеве розпізнавання об'єктів на дорозі), Icon8 (нейромережеві фільтри) та ін

image

Читати далі →

чи Багато треба, щоб зробити стартап з використанням великих даних і ШІ?

Припустимо, ви хочете створити додаток, що буде щось передбачати, рекомендувати, розпізнавати зображення або голос, розуміти текст на природній мові… Для цього вам знадобляться знання машинного навчання, в тому числі його складних і просунутих розділів, таких як глибоке навчання, великі навчальні вибірки і складні алгоритми, сервери для отримання і обробки даних від користувачів, засоби зберігання і обробки великих даних. Звучить занадто складно? Якщо у вас немає диплома Стенфордського університету, ви не готові наймати команду data scientist'ів і розгортати кластери Hadoop, але у вас є хороша бізнес-ідея, існує більш простий і менш витратне рішення – використовувати API машинного навчання і штучного інтелекту.

Читати далі →