Хакатон з аналізу відкритих даних користувачів соціальної мережі ВКонтакте. Для школярів і першокурсників

" — Вони дуже молоді, у них все попереду, а у нас попереду — тільки вони."
«Бридкі лебеді» А. і Б. Стругацькі
image

Привіт, Хабр.

Вже більше двох років я знайомий з чудовою командою, яка робить класні штуки для школярів.
Все почалося з Яндекс-табору («Свій освітній табір з покером, 3d-принтером, роботами і посадкою на Марс»), де ми грали з хлопцями в покер (суто в освітніх цілях). Там я запив «інженерну олімпіаду», де зі скотчу і туалетного паперу потрібно було робити функціональні об'єкти, притягнув 3d-принтер (на якому ми пробували друкувати відмички) і навчив пару хлопців, як лазити у вікно вночі і мазати зубною пастою. Ах, так, ще ми написали кілька статей на Хабр, спочатку під суворим наглядом, а потім самостійно.



На наступний рік я взяв у табір наручники і нейроинтерфейс NeuroSky.
Був конкурс на швидкісне програмування в наручниках, а так само виявляли, хто довше за всіх зможе протягнути в таборі, не знімаючи браслети. Ще ми спаяли пояс для розвитку нейропластичності. «Дитячий табір: биссектрально-піфагорові трикутники, перепрограмування мозку, радар-детектор і злом наручників».
А так само стартонув «піратський» флешмоб з перекладу книги від главреда WIRED (колишнього blackhat хакера) про підпільний мільярдний ринок кардерів: «Шворінь: школярі переводять книгу про хакерів».

І ось зараз команда організаторів вирішила запустить хакатон (і серію лекцій та воркшопів) з аналізу відкритих даних і нам потрібні поради, ідеї та гіпотези від хабрачитателей.

Під катом трохи опису заходи і лекторів, а так само корисні матеріали для підготовки до хакатону. В коментах можна запропонувати свої задачки, ідеї та варіанти гіпотез на перевірку. (Згадайте себе школярем, над чим вам було б цікаво попрацювати, якщо б ви потрапили на подібний хакатон?)



Олена, організатор, зізналася мені, навіщо вони все це роблять:

  • Вся data science і суміжні дисципліни позиціонується (сприймаються) як дуже складні штуки і вчать цьому тільки на старших курсах і в ШАДах, а насправді нічого страшного там немає і частіше важлива ідея. Можна сміливо пробувати, робити дослідження. Причому аналіз даних штука корисна у всіх областях, і це ми покажемо на відкритих лекціях (на прикладах від CERNа до реклами з банками). І ідея там важливіше володіння складними інструментами.
  • По-друге, ми працюємо з поколінням школярів і першокурсників, але не так багато про нього знаємо. Так і виявилося, що соціологи знають не більше. Вони роблять опитування про часу в онлайні, задаючи питання в паперовій анкеті. У Росії якось зовсім туго з дослідженнями соцмереж, ми знайшла всього кілька соціологів, і покликали їх на хакатон.
  • -третє, ця штука освітня, нам хочеться затягнути і «вкусити» побільше хлопців всякими популярними технологіями, з якими в їх віці не знайомлять зовсім. Та й експеримент з перемішуванням школярів і младшекурсников усвідомлений, хочеться підтвердити гіпотезу про те, що різниці в їх навчанні і здібності на нових теренах несуттєва (чи ні?).


Організаційна інформаціяХакатон відбудеться 19-21 лютого, в Москві, безкоштовно.
До участі запрошуються старшокласники та студенти віком 15-18 років з усієї Росії, які вміють програмувати хоча б на одній мові, а також мають уявлення про алгоритми, структури даних і базах даних.

Для участі необхідно подати заявку на участь на сайті. Після цього організатори надішлють вам відбіркове завдання з аналізу субтитрів до роликів конференції TED, рішення якого потрібно вислати протягом рівно 10 днів з моменту відправлення вам листа організаторами. Основний та резервний список учасників буде опублікований 12 лютого, свою участь необхідно підтвердити протягом 2 днів з дня публікації списків.

За час хакатона необхідно сформулювати і перевірити одну або кілька гіпотез про своє поколінні або розробити рекомендовану систему або сервіс на основі даних відкритих даних ВКонтакте 15-18-літніх користувачів. Робота над завданням буде проходити в командах по 2-3 людини, формування яких пройде в перші години хакатона.
Кожній команді буде надано консультант, який буде допомагати долати технічні труднощі протягом всього хакатона.


Лектори та журі



image

Я десь чув про дослідження, що подивившись 5-ти секундне відео з викладачем учень підсвідомо формує у себе уявлення, наскільки ефективно він буде у нього вчитися. Ось кілька відео тих людей, яких знаю особисто.

Іван Бібілов, Яндекс
«Основи функціонального програмування»


Григорій «Бобук» Бакунов, Яндекс



Андрій Устюжанін, Яндекс
«Обробка великих даних БАК»


Олександр Білоцерківський Microsoft


Корисні матеріали

Habrahabr
imageBig Data від А до Я. Частина 1: Принципи роботи з великими даними, парадигма MapReduce
«Цією статтею я відкриваю цикл матеріалів, присвячених роботі з великими даними. Навіщо? Хочеться зберегти накопичений досвід, свій і команди, скажімо так, в енциклопедичному форматі – напевно комусь буде корисним.

Проблематику великих даних постараємося описувати з різних сторін: основні принципи роботи з даними, інструменти, приклади розв'язання практичних завдань. Окрему увагу надамо темі машинного навчання.

Починати треба від простого до складного, тому перша стаття – про принципи роботи з великими даними та парадигмі MapReduce. „


Ананлитика і візуалізація “Війни і світу»
image
voinaimir.com/info — це візуальний і лінгвістичний аналіз роману «Війна і мир»

Rusbase
Підтягни бигдату. Курси і корисні посилання по темі data science
«Rusbase публікує список освітніх курсів і корисних посилань для тих, хто хоче розвиватися в сфері аналізу великих даних. Якщо ви ще не стикалися з Data Science, то рекомендуємо вам ознайомитися з нашим словником big data, а також подивитися, які гравці працюють на цьому ринку в Росії.»

Coursera
Введення в машинне навчання

«Не так давно набув поширення термін «великі дані», який визначив нову прикладну область — пошук способів швидкого автоматичного аналізу величезних обсягів різнорідної інформації. Наука про великих даних ще тільки оформляється, але вже зараз вона дуже затребувана і в майбутньому буде затребувана тільки більше.
З її допомогою можна вирішувати неймовірні завдання: оцінювати стан печінки по кардіограмі, передбачати зарплату за описом вакансії, пропонувати користувачеві музику на підставі його анкети в інтернеті.»


ФКН ВШЕ
«Data Science, чорні ящики – і чому вам сильно пощастило»


Лектор — Андрій Себрант, компанія Яндекс
«Я розповім, чому саме зараз Data Science виявляється однією з головних причин радикальної зміни інформаційних технологій – а через них, у свою чергу, промисловості і життя людей в цілому. Ситуації, коли алгоритми ефективно замінюють людей і змінюють цілі галузі розглянуто на прикладах як сервісів Яндекса, так і деяких інших найбільших світових компаній. При цьому поряд з підвищенням ефективності та іншими досягненнями виникають і неприємні побічні ефекти, здатні в результаті вплинути на віками складалися в людському суспільстві інститути – про це теж важливо знати.»

ПостНаука


«У чому полягають сильні та слабкі сторони аналізу даних? Як перевірити спостережувані патерни? Як методи аналізу даних допомагають формувати нові концепції? На ці та інші запитання відповідає доктор технічних наук Борис Міркін.»
Стаття — Аналіз даних

Які є ніштяки

  1. [до 10 лютого] Взяти участь і попрактикуватися (якщо підробити паспорт, зробити пластичну операцію і виглядати молодше 18-ти років)
  2. [до 16 лютого] Послухати відкриті лекції крутих преподов
  3. Запропонувати завдання/гіпотезу для перевірки
  4. Приєднатися до проекту в якості експерта


Якщо у вас є на прикметі талановиті школярі/студенти — запрошуйте, мотивуючи приблизно ось так:


Бонусна задачка:
Чому дорівнює сума цифр у числі 2^1000 ?

Трохи фоток, що передають атмосферу в таборах і показують адекватність викладачів


image

image

image

image

image



p.s.
От кілька статей про «випускників» таборів і хакатонов:


Програмуванням я захопилася самостійно: сама пішла читати статті та обговорення на форумах, стала вивчати інші мови програмування. Навчальних ресурсів зараз настільки багато, що можна просто вбити в рядок пошуку щось типу «програмування для новачків» і приступати до навчання. Я вивчала мову Java на сайті JavaRush. Там навчання програмуванню дається в ігровій формі — з мультиками та балами за правильно виконані завдання. Взагалі, програмування — це практика, практика і ще раз практика. Плюс не потрібно боятися експериментувати.
Стаття «11-класниця Олена Карнаухова про штучному інтелекті і зв'язку музики з програмуванням»



Ми з хлопцями зі шкільного гуртка робимо оптокоптер для біостанції МДУ. Три рази в рік ми їздимо від школи на біостанцію, де нас вчать біології. Але я і там все одно займаюся математикою. Зробити оптокоптер по-справжньому важко. Це величезна штука, яка повинна літати над лісом, причому досить довго (хвилин 30), знімати відео і передавати його в реальному часі — прямо під час польоту. Такі завдання мені дійсно цікаві: і тому, що вони складні, і тому, що можна контролювати процес на всіх стадіях, і тому, що вони служать реальною мети.
Стаття «10-класник Андрій Сирків про алгоритмічній мисленні і пошуку вартісних ідей»

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.