Спеціально для тих, хто не встиг зареєструватися на Superjob Data Science Meetup, ми організуємо пряму трансляцію події на Youtube або Facebook.

Початок у 19:00 за московським часом.
image

Читати далі →

Хабр, привіт! У сучасному машинному навчанні та науці про даних можна виділити кілька трендів. Перш за все, це глибоке навчання: розпізнавання зображень, аудіо та відео, обробка текстів на природних мовах. Ще одним трендом стає навчання з підкріпленням — reinforcement learning, що дозволяє алгоритмам успішно грати в комп'ютерні і настільні ігри, і дає можливість постійно поліпшувати побудовані моделі на основі відгуку зовнішнього середовища.

Є і ще один тренд, менш помітний, так як його результати для зовнішніх спостерігачів виглядають не так вражаюче, але не менш важливе — автоматизація машинного навчання. У зв'язку з його стрімким розвитком знову актуальним стає питання про те, чи не будуть data scientist'и зрештою автоматизовані і витіснені штучним інтелектом.

Читати далі →

Superjob запрошує на Data Science Meetup. Зустрічаємося 2 березня в нашому офісі на Малій Дмитрівці.

image

Теми та спікери:

  • «Застосування алгоритмів пошуку нечітких дублікатів в пошуку вакансій»
Дмитро Кожокарь, старший розробник Superjob, розповість про досвід створення ефективного алгоритму пошуку нечітких дублікатів серед великої кількості напівструктурованих текстових записів. У доповіді розглядається використання функції з сімейства locality-sensitive hashing з додатковими оптимизациями для виявлення схожих вакансій і подальшого об'єднання їх у кластери.

Читати далі →

Освоєння спеціальності Data Science на Coursera: особистий досвід (ч. 2)



Ми публікуємо другу частину посту Володимира Подільського vpodolskiy, аналітика в департаменті по роботі з утворенням IBS, який закінчив навчання по спеціалізації Data Science на Coursera. Це набір з 9 курсеровских курсів від Університету Джонса Хопкінса + дипломна робота, успішне завершення яких дає право на сертифікат.

Читайте у першій частині: Про спеціальності Data Science в загальних рисах. Курси: Інструменти аналізу даних (програмування на R); Попередня обробка даних; Документування процесу обробки даних.

Частина 2

Читати далі →

Освоєння спеціальності Data Science на Coursera: особистий досвід



Нещодавно Володимир Подільський vpodolskiy, аналітик в департаменті по роботі з утворенням IBS закінчив навчання по спеціалізації Data Science на Coursera. Це набір з 9 курсеровских курсів від Університету Джонса Хопкінса + дипломна робота, успішне завершення яких дає право на сертифікат. Для нашого блогу на Хабре він написав докладний пост про своє навчання. Для зручності ми розбили його на 2 частини. Додамо, що Володимир став ще й редактором проекту по перекладу спеціалізації Data Science на російську мову, який навесні запустили IBS ABBYY Language Services.

Частина 1. Про спеціальності Data Science в загальних рисах. Курси: Інструменти аналізу даних (програмування на R); Попередня обробка даних; Документування процесу обробки даних.

Привіт, Хабр!
Не так давно закінчився мій 7-місячний марафон по освоєнню спеціалізації «Наука про даних» (Data Science) на Coursera. Організаційні боку освоєння спеціальності дуже точно описані тут. У своєму пості я поділюся враженнями від вмісту курсів. Сподіваюся, після прочитання цієї замітки кожен зможе зробити для себе висновки про те, чи варто витрачати час на отримання знань по аналітиці даних чи ні.

Читати далі →

Професія Data Scientist: як не помилитися з вибором



Людина любить грати з цифрами або цифри з людиною? У класичному середню освіту є забавний парадокс: школярів навчають зазубрювати правила та випадки їх застосування, але чим більше учень знає правил і винятків, тим частіше має можливість зробити помилку. В диктанті, витканому з текстів класичної російської літератури, достаток ком уточнюючого характеру, призводить до думки, що саме не поставлена кома є помилкою. Отже, грамотна робота — це твір з великою кількістю ком. Проблема причинно-наслідкового зв'язку, чи не так? Може бути, якщо ви хороший письменник, ви використовуєте багато ком уточнюючого характеру, але це не той випадок, коли кількість ком робить вас хорошим письменником…

Інтерпретація ком у класичній російській літературі — це приклад поганого аналізу даних, побудованого на відсутність допитливості і розуміння математичної статистики. Ці фактори + пристрасне бажання розвиватися в сфері інформаційних технологій — ключові в розумінні спеціальності «вченого за даними».

Читати далі →

Підвищення конверсії за допомогою Big Data: 9 платформ прогнозної аналітики

    Прогнозна аналітика — це технологія, яка спирається на великі масиви даних для прогнозування майбутньої поведінки людей з метою прийняття оптимальних рішень. Вона задіє безліч методів з статистики, інтелектуального аналізу даних, враховує як поточні дані, так і дані за минулі періоди, на основі яких становить прогнози про майбутні події. У бізнесі моделі прогнозування використовують патерни, складені на основі даних за певний період, щоб оцінити потенційні ризики та можливості. Моделі виявляють зв'язки серед багатьох факторів, щоб зробити можливою оцінку ризиків або потенціалу, пов'язаного з конкретним набором умов. Підсумком використання прогнозної аналітики є прийняття вірних (максимально ефективних для бізнесу) рішень.
 
Як прогнозна аналітика може стати в нагоді e-commerce?
 
 
Читати далі →