«Тримайте руку на пульсі і дивіться по сторонам» – інтерв'ю про ІЇ з співзасновником Intento Григорієм Сапуновим

днями ми вирішили поспілкуватися з нашим головним викладачем на Deep Learning, Григорієм Сапуновим, і обговорити з ним актуальні питання, пов'язані зі сферою штучного інтелекту (ШІ). Григорій кілька років тому був керівником розробки Яндекс.Новин. Зараз є CTO і співзасновником компанії Intento. Вже 15 років займається аналізом даних, штучним інтелектом і машинним навчанням, з 2011 року займається Deep Learning, брав участь у проектах RoadAR (нейромережеве розпізнавання об'єктів на дорозі), Icon8 (нейромережеві фільтри) та ін

image

— Давно хотілося предметно поспілкуватися з тобою по темі штучного інтелекту. Ти давно в цій темі, добре розбираєшся і стежиш за нею, консультируешь n-ое кількість стартапів… Що тебе взагалі спочатку привернуло в цій темі?

— Я завжди був небайдужий до крос-дисциплінарних тем, особливо на стику таких цікавих для мене областей як програмування, біологія, математика, науки про мозок, психологія, лінгвістика, філософія. Штучний інтелект як раз знаходиться на перетині всіх цих напрямків. Тут є багато складних викликів, є постійне відчуття, що ти знаходишся на підступах до незвіданого, і при всій вже досить довгої історії цього напряму все одно за фактом ти регулярно опиняєшся в місцях, куди до тебе мало хто заходив. Це неймовірно цікаво.

— Ти почав захоплюватися цим, коли ще це не стало модним. З чим ти пов'язуєш бум, який ми зараз переживаємо з розвитком ІІ? І чи є він насправді? Може бути, це чергова галас із завищеними очікуваннями?

— Як зазвичай тут є і конструктивна історія, і неконструктивна.

Конструктивна частина в тому, що в останні роки відбувся прорив у роботі з нейромереж. Парадокс в тому, що багато з мають відношення до цього прориву ідей, алгоритмів і методів були розроблені вже давно і не є якоюсь особливою новизною. Близько п'яти років тому вдало зійшлися разом в одній точці зростання обчислювальних можливостей і поява великих датасетов. І тут з'ясувалося, що старі алгоритми загалом-то непогано працюють, а раніше просто не вистачало ресурсів, щоб їх як слід навчити. З тих пір вже й концептуально нових речей з'явилося чимало, так і з декількох галузей (наприклад, розпізнавання мови та комп'ютерного зору) deep learning успішно пройшов і витіснив традиційні методи. Більшість книг по ІІ старше п'яти років вже небезпечно читати, бо вони застаріли. Наприклад, вони постійно експлуатують приклад задачі, яку не здатний вирішити комп'ютер, але може вирішити трирічна дитина — відрізнити кішку від собаки. Це вже давно (кілька років) неправда. Комп'ютер відмінно розпізнає зображення, причому робить це з якістю вище людини. Або ще зовсім недавно (рік-два тому) вважалося, що гра го залишиться неприступною ще років двадцять. Навесні 2016 року стало ясно, що це вже не так. Мало хто очікував. Тобто в цьому місці бум повністю виправданий.

Більше того, є відчуття, що в даний момент фантазія не встигає за технологіями. Поточні напрацювання досить універсальні, можуть бути застосовані для дуже різних завдань, і про безліч таких застосувань ще просто ніхто не додумався. Або додумався, але ще не присвятив цьому потрібну кількість часу. У мене є свій шорт-лист подібних завдань, ось чекаю коли сам доберусь до них, або хтось зробить :)

Хайп з завищеними очікуваннями, на жаль, теж присутній. І на прикладі історії ІІ ми вже знаємо, що все повторюється і до чого це призводить. Ще на зорі зародження області ІІ в 1956 році один з основоположників області (Джон Маккарті) заявляв, що серйозний прогрес може бути досягнутий за одне літо, а трохи пізніше в 1965-му не менш крутий чоловік (Герберт Саймон) заявляв, що протягом 20 років машини зможуть робити все те, що вміє людина. І ці завищені очікування вже приводили до «зим штучного інтелекту», коли всі розчаровувалися відсутністю обіцяних результатів і прикривали фінансування ІІ проектів. Є ризик ще однієї зими і зараз. Тому що поряд з наявними успіхами є ще багато невирішених питань, які залишаються за дужками в захоплених публікаціях преси. Але як звичайно, хочеться вірити, що цього разу все буде по-іншому :)

— Багато хто зараз побоюються, що ШІ знищить безліч професій. Які завдання все-таки ИИ може вирішувати зараз на високому рівні? І кому в підсумку варто побоюватися конкуренції з боку ШІ?

— Різні міжнародні дослідницькі групи і медіа вже регулярно випускають списки професій, ранжованих за ризиком бути заміненими комп'ютерами. Деякі з цих списків виглядають дивно, деякі досить правдоподібно. Ви самі можете спокійно знайти кілька таких в Інтернеті.

ІЇ вже зараз може замінити або сильно потіснити людей в купі тих місць, де люди потрібні були лише для розпізнавання візуальних або голосових образів. Або там, де люди змушені перелопачувати величезні масиви інформації (це більш рідна середовище для комп'ютерів).

Я думаю, трагізм і комізм ситуації в тому, що в першу чергу ІІ вимиє безліч людей з цієї ж самої галузі і більш широко з ІТ. В даний момент є велика кількість data scientist'ів, що займаються лише застосуванням готових рецептів і перебором параметрів моделей. Це тупа нетворческая робота повинна і буде автоматизована і різні компанії вже цим займаються (див. наприклад, FBLearner Flow). У програмуванні також є величезна кількість нудних і нудних занять, які давно вже пора автоматизувати (див. чудові слова Сассмана, одного з авторів SICP: «Програмування сьогодні більше нагадує науку: ви берете частина бібліотеки і «тикаєте» в неї — дивіться на те, що вона робить. Потім ви запитуєте себе: «чи Можу я налаштувати так, щоб воно робило те, що мені потрібно?». Підхід «аналіз через синтез», використовуваний в SICP, коли ви будуєте велику систему з простих, маленьких частин, став неактуальним. Сьогодні ми програмуємо «методом тику», habrahabr.ru/post/282986). Ми, до речі, в поточному проекті Intento цілимось в автоматизацію однією з таких програмістських областей. Слідкуйте за анонсами :)

— А якщо пофантазувати на 5-10 років? Питання може бути актуальним для тих, хто тільки вступає до ВУЗУ.

— В першу чергу скрізь підуть посередності. Посередні вчителя, посередні програмісти, посередні перекладачі, посередні юристи. Якщо чого-то вчіться, стаєте кращим. Ну і не цурайтеся нових технологій. Сила все-таки не в заміні людини на ШІ, а в доповненні його ІІ. Ті, хто будуть постійно вдосконалюватися і зможуть вдало доповнити себе інформаційними технологіями нового століття, в програші ніколи не залишаться.

Якісь професії безумовно підуть у небуття, але навіть якщо ви зараз навчаєтесь на одну з таких професій, тримайте руку на пульсі і дивіться по сторонам. Частина професій піде, але скільки з'явиться нових, про які ми не здогадуємося? Коли з повсякденного життя зникли коні, виникло ціле море нових професій навколо автомобілів і транспорту. Про ці нові професії ще можна було здогадатися за аналогією, але коли з'явилися комп'ютери, виникли професії, про багатьох з яких заздалегідь навіть подумати не можна було. Якщо ви завжди відкриті новому, то без проблем знайдете собі місце в цьому новому світі.

— Зараз, кажучи «штучний інтелект», ми майже відразу ж маємо на увазі або вибудовуємо асоціацію «deep learning». Наскільки це виправдано? Що ще може бути зашитий всередині ШІ, крім глибоких нейронних мереж?

— Deep learning (DL) витіснив у медійному полі всі інші методи ШІ і практично став синонімом ІІ. Але це, звичайно, неправда. Є величезна кількість методів за межами DL. Є, наприклад, еволюційні обчислення і методи swarm intelligence, здатні знаходити рішення дуже складних задач оптимізації (часто NP-складних). Є символьні методи представлення знань і логічного виведення, які дуже сильні в області автоматичних міркувань і можуть, наприклад, пояснити як отримано той чи інший висновок. DL у даний момент на це практично не вміє (недавня свіжа публікація DeepMind про Differentiable neural computers відкриває дорогу для DL в цьому напрямку). Є цікавий напрям під назвою Probabilistic Programming. Відкрийте будь-яку адекватну книгу про ІЇ, там у змісті величезна кількість різних методів.

Можу порадити порівняно недавню мою презентацию про сучасний стан ШІ, яку я робив для школярів у рамках проекту GoTo School. Вона далеко не повна, але там є багато прикладів успіху відмінних від DL підходів.

— Чому взагалі, на твій погляд, deep learning гарний у вирішенні багатьох завдань, які виконує людина? Чи може бути щось придумане в альтернативу?

— Це насправді важке запитання: чому DL працює, і чому він працює так ефективно. Паралельний питання насправді — чому мозок людини здатний добре вирішувати ці завдання. Вчені намагаються пояснити за допомогою фізики.

Мабуть, є якась спільність принципів, хоч штучні нейромережі і досить далекі від біологічних.

Комплементарний цікаве питання, які завдання погано виконує людина і здатна добре виконувати машина (можливо, якоїсь нової архітектури). Крім очевидних швидкого рахунку і зберігання великих масивів даних. Мені в цьому сенсі дуже подобаються слова Хеммінга:“Just as there are odors dogs that can smell and we cannot, as well as sounds dogs that can hear and we cannot, so there are too wavelengths of light we cannot see flavors and we cannot taste. Why then, given our brains wired the way they are, does the remark «Perhaps there are thoughts we cannot think,» surprise you? Evolution, so far, may possibly have blocked us from being able to think in some directions; there could be unthinkable thoughts." Це те місце, де ШІ потенційно може зробити для нас революцію.

При цьому треба пам'ятати, що є ще багато інших завдань, для яких DL не підходить, а підходять інші методи. См. наприклад, символьні методи, про які я говорив раніше.

— За твоїм відчуттям, ринок зараз відчуває дефіцит фахівців, які здатні займатися навчанням глибоких нейронних мереж? Який тренд взагалі ти чекаєш?

— Запит на фахівців сильно більше, ніж їх є в наявності. Я це бачу по кількості звернень, динаміці відкритих вакансій, а також за наявності непаханных полів, де DL явно повинен здійснити переворот, як він зробив це в обробці звуку і зображення.

Із трендів я таки очікую швидке вимивання «поверхневих» data scientist'ів. Якщо ви вирішили увійти в цю область, не зупиняйтеся після перших успіхів, копайте далі. Це та область, в якій треба постійно вчитися. Якщо вам некомфортно, DL/ML/AI не для вас. Втім, що ви тоді робите в ІТ?

— Я так розумію, що це одна з причин, по якій варто піти на нашу освітню програму deep learning. Розкажи трохи детальніше про неї — як ти її бачиш? В чому її користь?

— Область величезна, стати фахівцем не можна ні за два, ні за три місяці. Я бачу свою мету в тому, щоб дати учасникам базове розуміння області DL, термінологію та інтуїцію, яка стоїть за основними методами, а також фреймворк для орієнтування в цій галузі, який вони зможуть надалі осмислено заповнювати, виходячи з своїх інтересів.

Інша мета, зняти страх перед новою областю і запропонувати легке входження в неї, навчити швидким практичним речам і показати, як можна будувати працюючі рішення з практично готових компонентів, або збирати свої з допомогою потужних доступних бібліотек.

Хоча курс і дуже насичений, а кількість матеріалу величезне, я хотів не розтягувати цей курс на місяці, а зробити його компактнішим, щоб навіть сильно зайняті люди могли його собі дозволити. Час — це дуже важливий ресурс, який я прагну оптимізувати.

— Які вимоги до людини, яка збирається піти на неї?

— Інтерес до галузі, бажання розібратися, здатність виділити час на це, а також базове вміння програмувати на python, базове знання лінійної алгебри (вектори, матриці) та матаналізу (корисно дружити з похідними, якщо хочете глибше зрозуміти суть процесів, але навчитися працювати c DL можна і без цього, зараз всі сучасні фреймворки вміють самостійно робити диференціювання для всіх типів шарів і вже давно не треба програмувати це вручну). Знайомство з областю машинного навчання також потрібно (ми не будемо заново розповідати основи машинного навчання, наприклад, не будемо заново докладно розбирати, що таке логістична регресія, а обмежимося невеликим нагадуванням важливих моментів).

— По мені так звучить все дуже цікаво. Останнє питання — напевно, класичний для цієї теми. Чи загрожує нам повстання машин? Спільнота якось дотримується різних точок зору. Одні вважають, що машини можуть стати розумнішими за нас, але не будуть нам загрожувати. Інші, в тому числі відомі технологічні компанії, стурбовані і хочуть якось запобігти можливі загрози.

— Мене більше турбує не повстання машин, а людська дурість, жадібність, недалекоглядність, недоговороздатність та інше, що призводить до перманентних воєн і конфліктів. За мірками еволюції з появи цивілізації пройшло занадто мало часу, ми все ще печерні люди. Я сподіваюся, комп'ютери зможуть трохи компенсувати ці наші слабкі сторони. Я вірю у доповнений інтелект.

Машина розумніше людини рано чи пізно з'явиться. Прочитає вона і цей текст з усіма коментарями :) Така машина безумовно змінить наш світ і я не можу передбачити, ні як вона себе поведе, ні до чого це призведе. Це ризики. Але ми тут не байдужі гравці, що від нас щось залежить. До цього моменту треба підготуватися.

Але ще раніше є купа інших ризиків від того, що ми сильно завязываемся на нові технології, не встигаючи їх як слід усвідомлювати. Ми створюємо складні системи (яким може бути дуже далеко до ІІ), про які ми не розуміємо як вони працюють. Ми погано продумуємо ризики впроваджуваних технологій. Ми, нарешті, просто використовуємо нові технології як інструменти своїх чорних справ.

Але крім ризиків я б розглянув і потенційні виграші. Наприклад, у біології, де накопичуються величезні масиви даних, які неможливо осягнути ні розумною головою одного суперэксперта, ні навіть групою експертів. Потенціал використання цих даних величезний — це краще розуміння всіх аспектів роботи живої клітини, лікування від багатьох хвороб і радикальне продовження людського життя, це більш глибоке розуміння принципів роботи мозку. В будь-якій іншій науці також є безліч проблем і невирішених завдань, які міг би допомогти вирішити ІІ, від фізики до історії. Можна було б радикально змінити освіту, на порядки підвищивши його ефективність і перевівши на абсолютно новий рівень. ІІ міг би допомогти вирішити одну з найстрашніших «невидимих» трагедій — нерозкритий потенціал кожної людини.
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.