Спеціально для тих, хто не встиг зареєструватися на Superjob Data Science Meetup, ми організуємо пряму трансляцію події на Youtube або Facebook.

Початок у 19:00 за московським часом.
image

Читати далі →

Старт відкритого курсу OpenDataScience
Привіт всім, хто чекав запуску відкритого курсу щодо практичного аналізу даних і машинного навчання!


Перша стаття присвячена первинного аналізу даних з Pandas.
Поки в серії планується 7 статей, які йдуть разом з зошитами Jupyter (репозиторій mlcourse_open), змаганнями і домашніми завданнями.
Далі йде список майбутніх статей, опис курсу і власне, перша тема – введення в Pandas.
Читати далі →

Superjob запрошує на Data Science Meetup. Зустрічаємося 2 березня в нашому офісі на Малій Дмитрівці.

image

Теми та спікери:

  • «Застосування алгоритмів пошуку нечітких дублікатів в пошуку вакансій»
Дмитро Кожокарь, старший розробник Superjob, розповість про досвід створення ефективного алгоритму пошуку нечітких дублікатів серед великої кількості напівструктурованих текстових записів. У доповіді розглядається використання функції з сімейства locality-sensitive hashing з додатковими оптимизациями для виявлення схожих вакансій і подальшого об'єднання їх у кластери.

Читати далі →

Огляд Knime Analytics Platform — open source системи для аналізу даних

ПРО KNIME
Вашій увазі пропонується огляд Knime Analytics Platform – open source фреймворку для аналізу даних. Даний фреймворк дозволяє реалізовувати повний цикл аналізу даних включає читання даних з різних джерел, перетворення і фільтрацію, власне аналіз, візуалізацію і експорт.

Скачати KNIME (eclipse-based десктоп додаток) можна звідси: www.knime.org

Кому може бути цікава ця платформа:

  • Тим, хто хоче аналізувати дані
  • Тим, хто хоче аналізувати дані і не володіє навичками програмування
  • Тим, хто хоче покопатися в непоганий бібліотеці реалізованих алгоритмів і, можливо, дізнатися щось нове

Читати далі →

Мінус одна система аналітики даних

Кількість систем аналітики та візуалізації даних, необхідних для повсякденної роботи, давно перевищила всі розумні межі. З появою Firebase їх стан поповнився на одну. У даній статті ми розповімо як подружити мобільну платформу Google з іншим, більш звичним інструментом аналітики Google Analytics. Майданчиком для експериментів став наш новий продукт Tviggo (мобільний додаток + набір месенджер ботів для міжнародних дзвінків по GSM — www tviggo. net).



Читати далі →

Онлайн-програма з аналізу даних на Stepik.org

Осінь 2016 року видасться насиченою: СПбАУ РАН не тільки на перезавантажить Stepik.org вже вдруге, але і дасть старт нової онлайн-програми професійної перепідготовки, на цей раз у співпраці з Інститутом біоінформатики, і присвячена вона буде роботі з даними.

Програма розпочнеться в жовтні'16 і буде проходити без дедлайнів, тому приєднатися до неї можна в будь-який момент, а на навчання витратити саме стільки часу, скільки дозволяє ритм життя: зовсім необов'язково не спати ночами і поєднувати непросту роботу з не менш складною навчанням.



Читати далі →

World of Tanks: від чого ж залежить вінрейт танків?

Сьогодні ми поговоримо про використання Wargaming API, побудуємо багато графіків і проаналізуємо, від чого ж залежить вінрейт танків. Відразу хочу відзначити, що я не гуру World of Tanks, і якщо я десь помилився, то напишіть будь-ласка в коментарях.
image
Читати далі →

Освоєння спеціальності Data Science на Coursera: особистий досвід (ч. 2)



Ми публікуємо другу частину посту Володимира Подільського vpodolskiy, аналітика в департаменті по роботі з утворенням IBS, який закінчив навчання по спеціалізації Data Science на Coursera. Це набір з 9 курсеровских курсів від Університету Джонса Хопкінса + дипломна робота, успішне завершення яких дає право на сертифікат.

Читайте у першій частині: Про спеціальності Data Science в загальних рисах. Курси: Інструменти аналізу даних (програмування на R); Попередня обробка даних; Документування процесу обробки даних.

Частина 2

Читати далі →

Освоєння спеціальності Data Science на Coursera: особистий досвід



Нещодавно Володимир Подільський vpodolskiy, аналітик в департаменті по роботі з утворенням IBS закінчив навчання по спеціалізації Data Science на Coursera. Це набір з 9 курсеровских курсів від Університету Джонса Хопкінса + дипломна робота, успішне завершення яких дає право на сертифікат. Для нашого блогу на Хабре він написав докладний пост про своє навчання. Для зручності ми розбили його на 2 частини. Додамо, що Володимир став ще й редактором проекту по перекладу спеціалізації Data Science на російську мову, який навесні запустили IBS ABBYY Language Services.

Частина 1. Про спеціальності Data Science в загальних рисах. Курси: Інструменти аналізу даних (програмування на R); Попередня обробка даних; Документування процесу обробки даних.

Привіт, Хабр!
Не так давно закінчився мій 7-місячний марафон по освоєнню спеціалізації «Наука про даних» (Data Science) на Coursera. Організаційні боку освоєння спеціальності дуже точно описані тут. У своєму пості я поділюся враженнями від вмісту курсів. Сподіваюся, після прочитання цієї замітки кожен зможе зробити для себе висновки про те, чи варто витрачати час на отримання знань по аналітиці даних чи ні.

Читати далі →

Огляд MOOC-курсів Coursera з комп'ютерних наук

Швидше за все, якщо ви зайшли на Хабр і читаєте цю статтю, то хоч раз в житті так чули про MOOC-курси.

Але якщо все ж не чули, то MOOC (по-російськи прийнято вимовляти «мук») означає «Massive Open Online Course» — масовий відкритий онлайн-курс. Це справжній феномен в освіті XXI століття. Газета «New York Times» назвала навіть 2012 рік «роком MOOC» у зв'язку з появою на ринку дистанційної освіти 3-х «китів» — Coursera, Udacity і EdX. MOOC-ам присвячено безліч статей, хтось бачить в них майбутнє освіти, хтось, навпаки, загрозу. Намагаються також передбачити «традиційну» і «дистанційну» складники навчання майбутнього.




Однак у цій статті я не буду обговорювати перспективи розвитку дистанційної освіти, а розповім про свій досвід знайомства з курсами на платформі Coursera. Ці курси будуть корисні студентам, вивчаючим прикладну математику та інформатику, особливо аналіз даних. Багато чого з того, що мені дали ці курси, як я потім зрозумів — це знання, якими повинен володіти будь-який поважаючий себе дослідник даних (так я віддаю перевагу переводити професію Data Scientist).

Читати далі →