Datathon в рамках Data Science Week

Зараз Big Data і взагалі Data Science проникає все більша кількість компаній, і розширюється безліч цікавих бізнес-завдань, які можна вирішити за допомогою даних та їх обробки. Долучитися до цього і спробувати можна на хакатонах з аналізу даних, які останнім часом стали проводитися всі частіше, багато чули про хакатон Microsoft за машинного навчання, деякі брали участь у Deephack, хакатоне за відкритими даними від MLClass.

Щось схоже буде відбуватися і на дататоне, який буде проходити в рамках заходу під назвою Data Science Week з 29 по 30 серпня.

Офіційні партнери дататона: HeadHunter, Ozon.ru і 3data.

Перші двоє надають дані для аналізу і формулюють завдання. А компанія 3data надає всю необхідну інфраструктуру для зручної роботи на дататоне.

Тепер про найцікавіше: про завдання.

  • Прогнозування зарплати для вакансій
    Напевно, складно знайти людину, яка б ніколи не користувався сервісом HeadHunter і який би не стикався з тим, що не у всіх вакансій вказана зарплата. Можливість прогнозувати зарплату за описом вакансії дозволила б показувати здобувачеві вакансії з непроставленою зарплатою, але ймовірно потрапляють під його зарплатні очікування.
  • Схожі пошукові запити
    На жаль, не всі люди говорять на одній мові. І мова йде не про російську, англійську, китайську мови. А про те, що роботодавці можуть називати вакансії одним чином, а здобувач може шукати ті ж вакансії, але по якимось іншим словами, формулювань. Для того, щоб допомогти шукачу знайти вакансії, що його цікавили, але при цьому не знайдені по першому складеним ним запиту, необхідно вирішити задачу визначення схожих пошукових запитів.
  • Рекомендації рідкісних товарів. Хвости розподілу
    Дуже просто рекомендувати товар, який і так є популярним. Конверсія такий рекомендації буде висока, але це буде марно з точки зору бізнесу. В літературі це зветься бананової пасткою. Набагато цікавіше порекомендувати щось рідко купованих товарів. В цьому і буде полягають завдання.
На дататон потрібно буде прийти зі своїми ноутбуками, з яких можна буде зайти на розгорнутий компанією 3data кластер з передвстановленим Spark і Jupiter Notebook, а також всіма необхідними пакетами під пітон.

Взагалі здорово, що замість стандартного технічного рішення — розгорнути інфраструктуру в якому-небудь закордонному хмарі, організатори залучили партнером російську компанію. Звичайно, на 28 годин можна було легко обійтися і хмарою, але якщо говорити про продакшн рішення, навіть для стартапів — то хмари з-за курсу зараз стають все менш привабливими, а законом про персональних даних, ще й незручними.

Побачимося на дататоне. Реєстрація на івент тут.

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.