image
Історія навчання з підкріпленням в залежності від того, як рахувати налічує від півтора століть до 60 років. Остання хвиля (яка захльостує зараз нас всіх) почалася разом з підйомом всього машинного навчання у середині 90-их років 20-ого століття. Але люди, які зараз на гребені цієї хвилі починали саме собою не зараз, а під час попереднього сплеску інтересу — 80-их. У процесі знайомства з історією нам зустрінуться багато персонажі, що відіграли роль у становленні вчення про штучний інтелект (що ми обговорювали в попередній статті). Само собою, це не дивно, адже навчання з підкріпленням — його невід'ємна частина. Хоча про все по порядку.
Сама назва «навчання з підкріпленням» взято з робіт відомого російського фізіолога, нобелівського лауреата Івана Петровича Павлова. У 1923 р. вийшла його праця «Двадцятирічний досвід об'єктивного вивчення вищої нервової діяльності (поведінки) тварин» [1], відомий на заході як Conditional Reflexes [2]. Але психологічні підходи були відомі і раніше.
Читати далі →

Вебінар: Введення в Singularity



Команда FlyElephant запрошує всіх на вебінар "Введення в Singularity", який проведе
Gregory Kurtzer (HPC Systems Architect і Technical Lead в Lawrence Berkeley National Laboratory).
Вебінар буде проходити завтра, 15 лютого, о 19:00 (EET) / 9:00 am (PST). Мова — англійська.

Читати далі →

Створюємо нейронну мережу InceptionV3 для розпізнавання зображень



Привіт, Хабр! Під катом піде мова про реалізацію сверточной нейронної мережі архітектури InceptionV3 з використанням фреймворку Keras. Статтю я вирішив написати після ознайомлення з туториалом "Побудова потужних моделей класифікації з використанням невеликої кількості даних". З схвалення автора туториала я трохи змінив зміст своєї статті. На відміну від запропонованої автором нейронної мережі VGG16, ми будемо навчати гугловскую глибоку нейронну мережу Inception V3, яка вже встановлена в Keras.

Ви навчитеся:

  1. Імпортувати нейронну мережу Inception V3 з бібліотеки Keras;
  2. Налаштовувати мережу: завантажувати ваги, змінювати верхню частину моделі (fc-layers), таким чином, пристосовуючи модель під бінарну класифікацію;
  3. Проводити тонке налаштування нижнього згорткового шару нейронної мережі;
  4. Застосовувати аугментацію даних за допомогою ImageDataGenerator;
  5. Навчати мережу по частинах для економії ресурсів і часу;
  6. Оцінювати роботу моделі.
При написанні статті я ставив перед собою завдання представити максимально практичний матеріал, який розкриє деякі цікаві можливості фреймворка Keras.

Читати далі →

Neurostream — новий чіп для глибокого навчання

Високопродуктивні обчислювальні системи вже знаходять застосування для пам'яті з високою пропускною здатністю (HBM) і технології Hybrid Memory Cube (HMC). В цьому напрямку активно ведуться розробки.

Вчені з Болонського університету наприкінці січня представили архітектуру для обчислень в пам'яті (PIM), здатну ефективно працювати з глибокими згортковими нейронними мережами. Вона отримала назву Neurostream.


Читати далі →

Нейросетка грає в Доту



Всім привіт! Насправді нейросетка грає не на звичну Dota 2, а в RussianAICup 2016 CodeWizards. RussianAICup — це щорічне відкрите змагання з програмування штучного інтелекту. Брати участь в цьому змаганні досить цікаво. У цьому році темою була гра схожа на Дота. Так як я вже якийсь час займаюся навчанням з підкріпленням, то мені хотілося спробувати застосувати це в RussianAICup. Головною метою було навчити нейронну мережу грати в цю гру, хоча зайняття призового місця — це, звичайно, було б приємно. У підсумку нейромережа тримається в районі 700 місця. Що, я вважаю, непогано, зважаючи обмежень змагання. У цій статті мова піде швидше про навчання з підкріпленням та алгоритмах DDPG і DQN, а не про самому змаганні.

Читати далі →

tiny-dnn — анонс бібліотеки

image

Поки TensorFlow активно завойовує світ, воює за аудиторію з такими великими гравцями ринку машинного навчання і глибоких нейронних мереж як Keras, Theano і Caffe, інші менш грандіозні проекти тим часом партизанят, намагаючись зайняти хоч якусь нішу. Про один з таких проектів я якраз і хотів сьогодні розповісти зважаючи на повну відсутність інформації про нього на Хабрахабре. Отже, tiny-dnn — це повністю автономна C++11 реалізація глибинного навчання, створена для застосування в умовах обмежених обчислювальних ресурсів, вбудованих систем або IoT. Подробиці під катом.

Читати далі →

Чому цієї зими ми знову запрошуємо всіх пограти в комп'ютерні ігри за допомогою штучного інтелекту

Хабр, МФТІ вітає тебе! Як справжні технарі, відразу переходимо до справи і запрошуємо всіх, кому цікаво, взяти участь у новому хакатоне DeepHack, який пройде на Физтехе з 6 по 12 лютого. Відбірковий етап вже розпочався і триватиме до 22 січня. Це ми все до чого… Якщо ви не з чуток знаєте, що таке DQN, deep RL і DeepHack відразу реєструйтеся на чергову наукову школу-хакатон — rl.deephack.me.

DeepHack

А якщо ви не до кінця в темі і вам, наприклад, не ясно, чому комп'ютерні ігри, яке відношення вони мають до управління дата-центрами і що насправді буде в лютому, то терміново йдіть під кат — там максимальне занурення в життя штучного інтелекту від давнини і до наших днів. Ну ви ж не думаєте, що все це винайшли лише в XXI столітті?

Читати далі →

Як ми запускали програму Deep Learning

Хабр, привіт.

Як ви знаєте, для навчання глибоких нейронних мереж оптимально використовувати машини з GPU. Наші освітні програми завжди мають практичний ухил, тому для нас було обов'язково, щоб під час навчання у кожного учасника була своя віртуальна машина з GPU, на якій він міг вирішувати завдання під час занять, а також лабораторну роботу протягом тижня. Про те, як ми вибирали інфраструктурного партнера для реалізації наших планів і готували середовище для наших учасників, і піде мова в нашому пості.

Читати далі →

Вебінар: Введення в Data Science



Команда FlyElephant запрошує всіх 21 грудня о 18.00 (EET) на вебінар «Введення в Data Science». У його рамках ми розглянемо на прикладах, що таке Data Science, Data Mining, Machine Learning і Deep Learning, хто такий data scientist і якими інструментами він користується для збору, зберігання, обробки і візуалізації даних. Поговоримо про платформі FlyElephant і чим вона може бути корисна для роботи data scientist'а.

Зареєструватися на вебінар можна тут.
Джерело: Хабрахабр