Чому цієї зими ми знову запрошуємо всіх пограти в комп'ютерні ігри за допомогою штучного інтелекту

Хабр, МФТІ вітає тебе! Як справжні технарі, відразу переходимо до справи і запрошуємо всіх, кому цікаво, взяти участь у новому хакатоне DeepHack, який пройде на Физтехе з 6 по 12 лютого. Відбірковий етап вже розпочався і триватиме до 22 січня. Це ми все до чого… Якщо ви не з чуток знаєте, що таке DQN, deep RL і DeepHack відразу реєструйтеся на чергову наукову школу-хакатон — rl.deephack.me.

DeepHack

А якщо ви не до кінця в темі і вам, наприклад, не ясно, чому комп'ютерні ігри, яке відношення вони мають до управління дата-центрами і що насправді буде в лютому, то терміново йдіть під кат — там максимальне занурення в життя штучного інтелекту від давнини і до наших днів. Ну ви ж не думаєте, що все це винайшли лише в XXI столітті?

Шпаргалка читачеві: DeepHack — формат, що поєднує в собі класичний хакатон з піцою, кока-колою і цілодобовим кодингом і наукову школу з лекціями від провідних фахівців по темі. Що розповідали на минулих хакатонах і які вийшли результати, можна дізнатися на сайтах game.deephack.me і qa.deephack.me.

Введення
Заглибимося в історію. Як ви знаєте, перші спроби створити штучний інтелект почалися дуже давно. Відповідь на питання, наскільки давно, сильно залежить від того, що саме ми вкладаємо в поняття «штучний інтелект». Ми будемо вважати, що штучний інтелект — деяка машина, здатна з допомогою логічних обчислень приймати рішення. Таке визначення дасть нам пропустити всі (безумовно, дуже цікаві) спроби створити штучний інтелект в Давнину, Античності, Середньовіччя і Нового Часу, відразу перескочивши в 19-й століття до Чарльзу Бэббиджу і Ади Лавлейс. Вони широко відомі, як творець обчислювальної машини і перший програміст відповідно. Але не будемо затримуватися тут і підемо навіть ще далі — у початок століття 20-ого, коли Давид Гільберт, який став після смерті Анрі Пуанкаре загальновизнаним математиком №1, поставив перед світовим математичним співтовариством питання: «чи можуть бути всі математичні міркування формалізовані?» Відповідь на це питання дали інші тепер відомі вчені: Курт Гедель зі своєю теорема про неповноту (1931 рік), Алан Тьюринг, запропонував машину імені себе (1936) і Алонзо Черч, придумав λ-числення (серія робіт у 1930-их). Роботи Геделя продемонстрували, що математична логіка має свої межі. Але результати Тюрінга-Черча показали, що все те, що математична логіка в змозі описати, може бути формалізована і виконано машиною.

В 1943 році вийшла робота, поклала основу всіх сучасних чудес, які демонструють нейронні мережі (наприклад, здатність відрізняти кішок від собак на сверхчеловеческом рівні): «Логічне числення ідей, що відносяться до нервової активності» авторства Уоррена Маккалока і Уолтера Піттса. Зокрема, вони запропонували формальну модель нейрона. Минуло небагато часу, і Алан Тьюринг запропонував знаменитий тест імені себе — тест на перевірку створення штучного інтелекту. А роком пізніше, в 1951-му, Марвін Мінскі побудував першу нейромережеву машину (SNARC).

Основними проблемами штучного інтелекту були недолік обчислювальної потужності машин і так званий парадокс Моравека (Hans Moravec): «Чому складні завдання, начебто докази теорем, прості для комп'ютера, а прості, начебто впізнавання осіб, складні?»

Відродження інтересу до ІІ
До недавнього часу особливого інтересу до ШІ, як до поля для дослідницької діяльності не спостерігалося, але закон Мура, справно працював з 1965 року, дав про себе знати. Першим провісником нової весни, мабуть, стала перемога комп'ютера Deep Blue в шаховій битві з тодішнім чемпіоном світу Гаррі Каспаровим в 1997 році. До речі, в цьому ж році була опублікована робота Юргена Шмидхубера Long Short-Term Memory (Довга короткострокова пам'ять), що заклала основи сучасного покоління рекурентних мереж.

Далі перемог у скарбничці ІІ ставало тільки більше. Наприклад, остання загальновідома перемога в грі го належить програмі AlphaGo. Але і до цього ходу штучного інтелекту була чутна: отримання надлюдського якості класифікації картинок на 1000 класів (ImageNet), розпізнавання мовлення (ByteNet) і доведення математичних теорем (безліч спеціалізованих пакетів). Новий період розквіту ІІ припав на 2000-ті роки і продовжується до цих пір.

Ключове завдання ІІ — управління поведінкою
В 90-е ставала все більш поширеною концепція "інтелектуального агента", який приймає рішення про свою поведінку на підставі даних з навколишнього світу. Спроби робити таких агентів почалися ще в глибоку давнину, але тільки з розвитком достатньо потужності обчислювальних машин (ми пам'ятаємо про закон Мура) такі агенти отримали поширення. Зараз інтелектуальні агенти керують торгами на біржах, садять літаки і можуть вести ваш автомобіль за вас (відразу в голову приходить безпілотна Tesla, але і звичайний круїз-контроль теж можна вважати таким агентом).

Історія DeepMind і Atari, як пісочниця для ІІ
Від реальних завдань переходимо до завдань нереальним, а саме — комп'ютерним іграм. І тут на сцену набирає Дэмис Хасабис (Demis Hassabis) — дослідник в області ШІ, розробник ігор і гравець у шахи. У 2010-му році він заснував компанію DeepMind. Дэмис, будучи розробником ігор, зберіг інтерес до них і займаючись штучним інтелектом. Так, у 2012 році з'явилися перші результати перемог інтелектуальних агентів в іграх для приставки Atari. На теренах колишнього СРСР ці приставки не отримали поширення, але приставка Dendi має близькі обчислювальні можливості і безліч портованих з Atari ігор, наприклад, Galaxy / Space Invaders. У 2014-му році компанія була придбана Google, але Дэмис зберіг свій керівний пост і продовжив рух у тому ж напрямку. У 2015-му році черговою віхою стала публікація в журналі Nature. Google же знайшла застосування отриманими результатами і в реальності — наприклад, для управління електроживленням своїх дата-центрів.

Перехід на відкриту науку
Ми вже згадували Tesla, варто згадати і її засновника — Ілона Маск, який крім інших занять у 2015 році став одним з співзасновників інституту OpenAI, метою якого є створення штучного інтелекту. Чому в назві присутнє «open»? Ілон Маск постулює, що потенційний ризик створення штучного інтелекту (досить непогано проілюстрований у тепер вже класичному фільмі «Термінатор» з Арнольдом Шварценеггером, знятому в 1984-му, ще до початку сьогоднішнього сплеску інтересу до ІІ) може бути зменшений, якщо всі отримають рівний доступ до результатів досліджень штучного інтелекту. Не зовсім очевидна стратегія, але можна згадати вчених-учасників Манхеттенського проекту, передавали креслення атомної бомби СРСР для уникнення небезпечного дисбалансу озброєнь.

Вже через кілька місяців після створення, у квітні 2016-го року, OpenAI запустив відкриту платформу gym («тренажерний зал»), на якій кожен може випробувати свої алгоритми для вирішення завдань інтелектуальних агентів в різних оточеннях — начебто пересування кубика в потрібне місце кімнати або утримання жердини у вертикальному положенні. Ще через півроку в gym додають ігри Atari і тепер будь-хто може позмагатися з фахівцями DeepMind в умінні навчати інтелектуальних агентів грати в комп'ютерні ігри.

Історія хакатонов DeepHack
Але ще до того, як це стало можливим, з'явилася ідея спробувати свої сили в змаганні на ІІ Atari. Так народився перший хакатон DeepHack, який відбувся влітку 2015-ого року.

Спільно з хакатоном було вирішено провести наукову школу, щоб лекції та спілкування з лекторами допомогли учасникам хакатона просунутися далі і перевершити результати DeepMind. Забігаючи вперед, можна сказати, що в якійсь мірі це вдалося: одна з команд навіть опублікувала наукову роботу за результатами хакатона. Лекторами на першому хакатоне DeepHack виступили: Юрген Шмідхубер (Juergen Schmidhuber) — здається, що ця людина не потребує представлення, досить сказати, що він вважається одним з батьків сучасних нейронних мереж є керівником групи у швейцарському інституті по дослідженні ШІ, Йошуа Бенжио (Yoshua Bengio) — ще один з батьків сучасних нейронних мереж, керівник лабораторії по дослідженню ІІ в університеті Торонто, Руслан Салахутдінов, голова дослідницького підрозділу компанії Apple, професор в університеті Карнегі-Меллон, а також багато інших. Детально подивитися список учасників, записи лекцій і слайди можна на сайті game.deephack.me.

Другий DeepHack
Через півроку, взимку 2016-ого, ми вирішили переключитися на не менш цікаву задачу — відповіді на питання для американського аналога ЄДІ. У цей час почався всесвітній конкурс Kaggle на даних, наданих дослідним інститутом Аллена в області ШІ (Allen Institute for Artificial Intelligence), заснованим Полом Алленом (Paul Allen, співзасновник компанії Microsoft) у 2013-му році.

Тут також працювала наукова школа, куди були запрошені провідні вчені в галузі обробки природної мови: Крістофер Меннінг (Christopher Manning), професор Стенфордського університету, автор класичної книги «Основи статистичної обробки природної мови», Томаш Миколов (Tomas Mikolov), дослідник ІЇ у Facebook, автор word2vec, Філ Блансом (Phil Blunsom), професор Оксфордського університету, дослідник в DeepMind. І знову, багато інших — подробиці на qa.deephack.me.

Новий DeepHack
Для нового DeepHack, який пройде 6-12 лютого 2017-го року був обраний OpenAI gym, як загальнодоступна платформа, і в якості завдання — складні з точки зору машини гри, начебто Пакмана (ми пам'ятаємо про парадокс Моравека). В рамках хакатона знову буде працювати наукова школа, лекції зможе відвідати кожен бажаючий. Лектори будуть оголошені пізніше, всі оновлення можна відстежувати на rl.deephack.me. Але вже зараз оголошується відбірковий тур для участі в хакатоне: потрібно домогтися кращих результатів у грі Skiing на Atari. Перші 8 команд будуть відібрані для участі, підсумки відбіркового туру будуть підведені 22 січня 2017-го року. Будемо раді бачити вас на хакатоне і науковій школі!
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.