Може машина навчити англійській мові?



Биткоин-бот імені Дональда Трампа, перемога AlphaGo над одним з найсильніших гравців в го Чи Седолем, вивчення англійської мови — що об'єднує ці три ситуації? Скрізь в тій чи іншій мірі присутня машинне навчання.

Комп'ютер може не тільки генерувати сюжетну канву, як Scheherazade, або відповідати на листи замість користувачів, як Google Smart Reply, але і створювати ідеальні підручники англійської мови.


В допомогу вчителю

У Skyeng всі вчителі ведуть уроки за допомогою інтерактивної онлайн-платформи Vimbox. Всі матеріали уроку, вправи, тексти, аудіо — і відеофайли зберігаються на платформі. Урок на Vimbox спланований буквально по хвилинах: вчитель бачить підказки про те, які питання задати учневі, як краще відпрацювати вправу і поставити на будинок. Заняття проходять в інтерактивному форматі – вчитель бачить, як учень виконує вправи, які слова додає до словника і які граматичні конструкції викликають у нього труднощі; при цьому він може оперативно допомогти, пояснити потрібну тему.

В процесі збирається великий обсяг статистичних даних. Платформа фіксує всі дії учня і вчителя – скільки вони розмовляли, на якій мові, як швидко учень робив вправи, які у нього вийшли відповіді і де вчитель йому допомагав. Ми можемо оцінити обсяг домашнього завдання, швидкість взаємодії з текстами і вправами, обсяг пояснень, кількість прослуханих записів і багато інших параметрів взаємодії вчителя і учня на уроці. Учень може дати оцінку і матеріалами уроку, і вчитель (цю оцінку вчитель не бачить).



Цей масив даних служить помічником для викладача. Перед кожним уроком система нагадає йому, яким обсягом лексики володіє учень, з якими проблемами довелося зіткнутися на попередніх заняттях, які завдання були видані і наскільки швидко студент з ними впорався і т. д. аж до його інтересів і хобі. Це важлива підмога, оскільки викладач не може пам'ятати всі подробиці про кожного свого учня. Однак поки вчитель аналізує цю інформацію самостійно і вибудовує урок на підставі власних висновків. Чи може йому допомогти навчається машина?

Ми вважаємо, що так. Обсяг збирається під час уроків інформації настільки великий, що вчитель просто не зможе всю її переварити за п'ять хвилин підготовки до уроку. А машина – цілком. Мало того, вона може порівняти дані конкретного студента з базою даних по всім учням, виявити закономірності, і на підставі всього цього масиву аналізувати поточний урок «на льоту», видаючи вчитель підказки: з цієї граматичною конструкцією у студента будуть проблеми, заостряем на неї увагу; це завдання можна пропустити, тому що воно не викличе ніяких труднощів, замінюємо його ось цим; ця тема учневі цікава, а з цього він, швидше за все, «закриється» і т. д. Навчається машина стає свого роду другим, закулісним викладачем, підвищує ефективність уроку.

Застосування машинного навчання вигідно нам і комерційно:
— заощаджується час викладачів і методистів. ІЇ може взяти на себе рутинну роботу, так і базову аналітику;
— підвищується ефективність викладачів. Машина завжди підкаже, якщо вчитель щось забув, пропустив або допустив помилку;
— перед нами відкривається безліч нових можливостей. Ми можемо створювати унікальні продукти, недоступні нам раніше;
— нарешті, ми з повною підставою можемо розповідати про свою високотехнологічності в маркетингових матеріалах.

Семантичний аналіз

Ще одне завдання з області вивчення мови, яку можна успішно вирішити машинним навчанням – створення семантичного аналізатора. Припустимо, ви читаєте текст на улюбленому веб-сайті або пост в соціальній мережі. Вам попадається незнайоме слово англійською, потрібен його переклад у даному контексті. Не всі варіанти значення слова, представлені в англо-російському словнику, і не машинний переклад всієї фрази, а саме переклад цього слова в даному місці. Семантичний «парсер» аналізує всі слова в тексті і зв'язку між ними, робить розмітку, щоб вивудити релевантне значення потрібного слова.
Забивати всі можливі семантичні зв'язки вручну – завдання практично нездійсненне. Тут нам на допомогу приходить машинне навчання. Учитель в ході звичайного уроку просто «підправляє» автоматичний переклад, а аналізатор, переглянувши навколишній текст, намагається виявити і запам'ятати всі закономірності. Кілька таких поправок – і результат перекладу стає близьким до ідеального.

Семантичний аналізатор допоможе читати тексти, відразу отримувати релевантні перекази і додавати слова у потрібному значенні персональний словник. У Vimbox словник функціонально пов'язаний з мобільним додатком, яке використовується для повторення слів між уроками. Робота мобільного додатка заснована на алгоритмі, який копіює системність роботи довготривалої пам'яті, тому заучування слів відбувається не рандомно, а з певними інтервалами. Але це тім'я для окремої публікації, яку ми теж готуємо.

Ідеальний підручник

Процес поліпшення змісту навчальних матеріалів – важлива задача, якої стурбовані всі світові видавці підручників, такі як Oxford University Press, Macmillan, Cambridge і Pearson. Неоціненну допомогу в цій справі надає багата статистична база про взаємини учня і вчителя, зібрана школою Skyeng.

Ми проаналізували 308 000 уроків, проведених на платформі Vimbox, і прийшли до цікавих висновків. Наприклад, є вправи, які вчителі регулярно пропускають і не ставлять своїм учням. Є вправи, де кількість правильних відповідей досягає 98%. Ми задалися питанням – в чому сенс таких вправ, не є вони занадто легкими і очевидними з точки зору учня? Несуть вони педагогічний ефект?


Викладач пропускає те або інша вправа на основі власного досвіду та інтуїції. Використовуючи алгоритми машинного навчання та накопичені дані, ми можемо створити систему, що імітує досвід та інтуїцію відразу всіх наших викладачів, і створити з її допомогою «ідеальний урок» для кожного учня, а з таких уроків – персонифицированый «ідеальний підручник».



У навчанні англійської можна аналізувати підручник і скласти якусь подобу Google Knowledge Graph. Наприклад, в якій послідовності повторюється раніше вивчений матеріал, як лексичний, так і граматичний, правильно йде вивчення граматики, наскільки взаємопов'язані вивчаються теми. Можна виявляти оптимальну довжину аудіювання для того чи іншого рівня знання англійської, налаштовувати показ відеороликів, оптимальну модель чергування письмових і усних вправ – все це буде можливо за допомогою машинного навчання. Ми зможемо аналізувати типові помилки у письмових роботах учнів в нашому інструменті Есе і перевіряти роботи в напівавтоматичному режимі з видачею підказок для оптимізації роботи.

Ми поки знаходимося на самому початку шляху, тому активно цікавимось усіма сучасними напрацюваннями в області машинного навчання, намагаємося брати участь в експериментах, пов'язаних з цією темою. Один з таких експериментів – конкурс BlackBoxChallenge, партнером якого є школа Skyeng. Знавці мови Python можуть спробувати свої сили в створенні штучного інтелекту – агента, який вирушає в Чорний Ящик, де його чекають невідомі пригоди і загадки. На вході учасники не мають ніякої інформації про те, що відбувається в Ящику, і їм потрібно створити Агента, який зможе сам навчитися грати в гру з невідомими правилами.
Конкурс вже підходить до кінця — прийом рішень завершується 30 травня.

Призовий фонд становить 600 000 рублів, зараз за нього борються близько 1280 осіб.
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.