Як оптимізувати запам'ятовування іноземних слів



Перш ніж взятися за розробку мобільного додатку для вивчення лексики, ми в школі Skyeng витратили масу часу на вивчення алгоритмів роботи пам'яті і запам'ятовування слів. У результаті розробка Awords зайняла трохи більше часу, але ми більш впевнені в результаті використання певних алгоритмів у показі слів допомагає ефективніше поповнювати словниковий запас.


На ринку представлена велика кількість додатків для запам'ятовування іноземних слів. Всіх їх об'єднує спільна риса — використання зубріння (дриллинга) в якості основного інструменту навчання. Чим більше часу учень проводить за повторенням слів, тим вище шанс, що він їх запам'ятає. Наприклад, цілком реально за годину вивчити сто слів. Однак без повторення вже через 6 годин половина з них буде забута. Ще через шість годин в пам'яті залишиться не більше 15 слів. Щоб цього не сталося, необхідно регулярно повторювати весь набір (зубрити).

Якщо учень робить у повторенні списку паузу (на тиждень, на місяць, на відпустку, на робочий аврал, ...) — висока ймовірність, що слова забудуться, і зубріння доведеться почати з початку. Якщо він переключився з одного набору слів на наступний і не повторив перший через деякий час — він його забуде. Для того, щоб таке запам'ятовування працювало ефективно, необхідно самостійно або з допомогою викладача скласти чіткий план і неухильно слідувати йому, інакше зубріння перетвориться в безглузду втрату величезної кількості часу без явного, прогнозованого результату.

Ми задумалися: чи можна зробити додаток, яке буде забезпечувати не тільки процес «дриллинга», але також складання і підтримку плану занять та контроль за отриманими знаннями? Як максимізувати ефективність навчання і заощадити час учня?

Почати доведеться здалеку: з розмови про будову нашої пам'яті, яка буває короткостроковій і довгостроковій.

Зубріння vs запам'ятовування
Короткострокова добре знайома студентам, які здають який-небудь не дуже потрібний формальний предмет. Якщо простудіювати підручник вночі напередодні іспиту, є висока ймовірність, що велика частина інформації, хай і в розрізненому вигляді, залишиться в пам'яті достатньо довго, щоб здати іспит або залік. Проте вже через пару днів вона безслідно вивітриться (точніше, як показують дослідження, не вивітриться, але так надійно сховається в глибинах свідомості, що витягти її звідти буде проблематично).

Довгострокова пам'ять – це те, що дозволяє нам легко згадати отримані відомості і через рік, і через п'ять років. Але для того, щоб вона запрацювала, необхідні регулярні тренування, причому найбільш ефективний формат цих тренувань – не перечитування підручника, а перевірка з контрольних питань або постійне застосування отриманих знань на практиці.

Наприклад, студент, який вивчає нову мову програмування, отримує цю тренування у вигляді щоденних сесій кодинга. Збагнувши тему об'єктів C++, він зможе назавжди її запам'ятати, якщо буде регулярно використовувати. Тому викладачі вимагають об'єктного програмування навіть тривіальних завдань, де розумно було б обійтися без нього.

Довгострокова пам'ять потрібна не завжди. Хіміку зовсім не обов'язково знати всі формули; юристу не потрібно мати в голові повні версії кримінального, цивільного і процесуального кодексу. Їм на допомогу завжди можуть прийти довідники; для них важливіше розуміння принципів роботи і знання напрямки пошуку даних.

Але є сфери, де довгострокова пам'ять необхідна. Найбільш очевидні – медицина і лінгвістика. Лікар повинен пам'ятати симптоми будь-яких, навіть рідкісних хвороб. Людина, що претендує на вільне володіння англійською мовою, повинен знати слово serendipity, навіть якщо він ніколи в житті з ним не зіткнеться. Зрозуміло, найбільш ефективний спосіб розвинути таку довгострокову пам'ять – практика. Випускник медичного вузу на кілька років відправляється в ординатуру або інтернатуру. Професійний перекладач обов'язково їде на стажування в середу носіїв мови.

Але що робити, якщо такої можливості немає? І як бути, якщо лікар за час ординатури так і не зіткнувся з випадком синдрому Кавасакі?

Необхідно розвивати довгострокову пам'ять якось інакше. Не дивно, що основні дослідження в цій області проводяться як раз медиками і лінгвістами.

Польський студент і німецький психолог
Петро Возняк, автор найвідомішого алгоритму запам'ятовування SuperMemo, задумався про оптимізацію цього процесу в 80-ті роки, будучи студентом Познанської Політехніки. Одним із завдань, які він ставив перед собою, було повноцінне володіння англійською мовою – його не влаштовував той поверхнево-професійний рівень, яким цілком задовольнялися його однокурсники.

Возняк виявився досить упертим хлопцем. Він створив базу з карток з англійської мови та біології, що містять питання і відповідь, і зайнявся щоденними тренуваннями, ретельно записуючи результати в щоденник. Під кінець експерименту у нього утворилося три тисячі карток з англійської та понад півтори тисячі з біології.

За допомогою нескладних обчислень, заснованих на отриманих даних, Возняк встановив, що для запам'ятовування невеликого словника в 15 тисяч англійських слів йому потрібно витрачати на тренування щодня по дві години. Витрачений час зростає пропорційно кількості слів для запам'ятовування 30 тисяч потрібно чотири години повторень щодня. Не дуже зручно.

На щастя, за сто років до Петра Возняка аналогічною проблемою перейнявся німецький психолог Герман Еббінгауз, теж досить упертий чоловік. Еббінгауз провів два річних експерименту, в ході яких запам'ятовував безглузді набори складів. В результаті було зроблено кілька відкриттів, найважливішим з яких є Крива забування.

Еббінгауз експериментальним шляхом встановив, що швидкість забування інформації падає після кожного повторення. Після першого запам'ятовування даних забування йде дуже швидко: вже через годину з голови вилітає приблизно половина матеріалу, через десять годин – 65%; втім, близько 20% залишається і через місяць після вивчення. Проте, якщо протягом першої години повторити весь матеріал, процес його забування значно сповільниться, і нове повторення можна робити вже через добу. Скориставшись Кривої забування, можна розставити повторення таким чином, щоб відбулося максимальне довготривале засвоєння матеріалу за мінімальну кількість тренувань.

Цей метод називається «інтервальні повторення» (Spaced Repitition). У 30-ті роки був проведений експеримент, який показав, що така техніка дійсно благотворно впливає на процес навчання. Однак популярності вона в той час не отримала з-за своєї надмірної складності: необхідно було готувати тисячі карток з питаннями-відповідями, правильно їх тасувати, вчасно повторювати… Але потім з'явилися комп'ютери.



Повернемося до польського студенту Петру Возняку, який хотів вивчити англійську, але не горевшему бажанням витрачати на тренування по чотири години в день. Він вирішив алгоритмізувати техніку інтервальних повторень, що врешті-решт вилилося в програму SuperMemo. Зрозуміло, все виявилося далеко не так просто, і розробка SuperMemo стала, по суті, справою його життя.

Алгоритмізація методу інтервальних повторень – завдання досить очевидна. Головна проблема цього методу – необхідність точно розрахувати час, коли повторення буде максимально ефективним, тобто той самий момент, коли інформація забувається. Якщо написати програму, яка буде не тільки проводити тренування, але і своєчасно нагадувати користувачеві про їх необхідність, це теоретично дозволить домогтися більш ефективного навчання.

Тут є свої особливості. Сама по собі крива забування – явище універсальне, однак у різних людей на неї накладаються різні експоненти. Комусь третє повторення потрібно через 20 хвилин, комусь- через годину; аналогічним чином змінюється відстань між подальшими повторами. Тому тренування повинні бути гнучкими – в їх ході алгоритм намагається зрозуміти швидкість забування конкретного учня і підлаштуватися під неї.

Важливою проблемою на шляху до успішного навчання стає людський фактор. Для того, щоб ефективно запам'ятати максимальний обсяг інформації за мінімальний термін, потрібно точно слідувати графіку. У реальності це створює незручності, і учні вирішують відкласти на потім. В результаті, пропустивши потрібний момент, вони відкочуються назад – на крок, на два, а то й до самого початку навчання. Цей відкат також треба правильно прорахувати, щоб мінімізувати витрати із-за пропусків.

Ліцензія на слова
В основі нашого мобільного додатку Awords лежить концепція «ліцензій на слова» — за аналогією з обмеженими за часом ліцензіями. Після першого запам'ятовування «ліцензія» діє приблизно годину; якщо не повторити слово, воно буде забуто. Якщо повторити слова в кінці цього години, з'явиться нова «ліцензія», вже на шість годин. Наступна «ліцензія» буде на добу, потім на три дні, тиждень, місяць, півроку, два роки. Найбільш ефективний момент для повтору — прикордонний, коли попередня «ліцензія» закінчується, і для того, щоб згадати слово, треба докласти певні зусилля. Всі «ліцензії» для кожного слова зберігаються на нашому сервері облікового запису учня, і завдання мобільного додатка — вчасно нагадати, що настала пора їх оновити.

Базовий алгоритм, що лежить в основі Awords, можна описати таким псевдокодом:

function makeRepetition( user, word, license ){
var timePassed = (new Date()) - license.startTime;
var answer = showWordCard( word );

user.tuneParameters( license, timePassed, answer.quality );
word.tuneComplexity( license, timePassed, answer.quality );

if(answer.quality > 0) {
license.next( timePassed );
} else {
license.rollback( timePassed );
}
}

Код основний цього алгоритму визначає, чи можна дати збільшену «ліцензію» на слово, або ж його треба вчити знову. tuneParameters і tuneComplexity — умовні посилання на настроювальні алгоритми; якість відповіді (answer.quality) являє собою число від 0 до 1. Це число дорівнює одиниці, якщо учень швидко, з першого разу дізнався слово; в нього добре працює пам'ять, завдання виявилося для нього занадто легкою. В цьому випадку алгоритм збільшить інтервали повторень. Якщо якість відповіді близько менше 0,5 — відповідь була дана з працею, після підказок; стандартний інтервал повторів для цього учня занадто великий, необхідно проводити тренування частіше.

Оригінальна крива забування була побудована на основі даних синтетичного експерименту. Еббінгауз навмисно використовував нічого не значущі склади, щоб в результаті отримати максимально чисті результати.

Сучасні студенти-медики успішно використовують криву забування в її початковому вигляді, наприклад, для запам'ятовування даних з фармакології (теж, загалом, складається з наборів букв). Ось, наприклад, типова інструкція повторення матеріалу:

— перший повтор – відразу після прочитання (перевірка по контрольних питань);
— другий повтор – через 20 хвилин;
— третій – через добу;
— четвертий – через 48 годин після третього;
— п'ятий – через 72 години після четвертого.

Існують універсальні алгоритми, що дозволяють використовувати метод інтервальних повторень для ефективного запам'ятовування будь-якої інформації. Найвідоміша (і до того ж безкоштовно) така програма — Anki. Вона, зрозуміло, не враховує особливостей, пов'язаних з вивченням іноземних мов, проте може здорово стати в нагоді, якщо потрібно надовго запам'ятати щось дійсно важливе.

При вивченні ж іноземної мови ми маємо справу не з хаотичними наборами літер, а з осмисленими словами. Ступінь осмисленості та зрозумілості слова учню безпосередньо впливає на швидкість запам'ятовування. Так, інженер значно швидше запам'ятає слово «шестірня», ніж філософ. Звичні, легко подаються слова («дуб») запам'ятовуються легше, ніж екзотичні («смерека»). Як наслідок, необхідно акуратно підбирати групи з приблизно однаковою швидкістю запам'ятовування. Алгоритм SuperMemo використовує для такого підбору суб'єктивну оцінку користувача – наскільки йому важко дається слово; це не дуже точний показник. Ще один чинник – вже наявна в учня словникова база, яку необхідно оцінити для складання програми. Все це теж має бути алгоритмизировано. Втім, це теми для окремих статей.

Алгоритми, використовувані в нашому мобільному додатку, протягом півроку тестувалися на добровольцях з числа співробітників та їх знайомих. Це дозволило нам підібрати деякі середні параметри (термін «ліцензій»), які використовуються для оптимізації процесу довготривалого запам'ятовування слів. Зараз, коли додаток стало доступне всім бажаючим, ми зможемо зібрати значно більше аналітичних даних для подальшої точного налаштування цих параметрів. І все це можна побачити, скачавши мобільний додаток в App Store. В кінці жовтня додаток буде викладено в Google Play, а в листопаді — доступно на Web.

А якщо ви самі хочете взяти участь у розробці подібних штук — у нас маса цікавих вакансій!
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.