Голуби брутфорсят парадокс Монті Холла краще людей

Голуби дають людям фору у вирішенні дилеми Монті Холла, що могло б дозволити їм успішно виступати на однойменному ток-шоу. Це закономірність може, в свою чергу, вилити світло на те, чому людям так важко вона дається.

Чим примітна ця дилема? При уявній простоті, вона заплутує логічні ланцюжки наших висновків, змушуючи людей (але не голубів), в буквальному сенсі, блукати в трьох соснах, вірніше — в дверях. Це властиво представникам самих різних культурних традицій: американці, китайці, шведи і бразильці здійснюють однаково невірний вибір.
Когнітивний психолог Massimo Piattelli-Palmarini зауважив з цього приводу: Ні одна статистична завдання навіть поруч не стоїть по здатності обдурювати всіх людей і на всі часи.
У цій статті ми дізнаємося, в чому полягає дилема, знайдемо теоретичне вірне рішення, перевіримо його в R, розповімо про інтелектуальну битву людей з голубами і дізнаємося її результати.
Дилема Монті Холла
Так звана дилема Монті Холла є добре відомою загадкою, названої так на честь першого телеведучого на американському ТБ-шоу «Пропоную Угоду», в якій той давав учасникам на вибір три дверей, за однією з якою була машина, а за двома іншими — козли. Приз і козли заздалегідь розставлялися випадковим чином і далі не міняли свої місця розташування. Після того як учасник робив свій вибір, ведучий завжди відкривав одну із двох дверей, за якою, як він знав наперед, не було призу. Потім гравцеві пропонувалася можливість поміняти свій вибір або залишити все як є.

Насправді існує кілька можливих стратегій Монті.
  • Пекельний Монті: ведучий пропонує змінити, якщо двері правильна.
  • Ангельський Монті: ведучий пропонує змінити, якщо двері неправильна.
  • Ведучий вибирає одну з кіз і відкриває її, якщо гравець вибрав іншу двері.
Класикою стала стратегія неупередженості ведучого, коли він при будь-якому початковому виборі гравця відкриває козло-двері та пропонує змінити свій вибір або залишити все як є. Від неї ми і будемо відштовхуватися далі.
Переважна більшість гравців, опитуваних і випробуваних відмовлялися змінювати свій вибір, не дивлячись на те, що це удваивало їх шанси на виграш. При цьому люди мислять, що в останніх двох дверях шанси на виграш рівні і змінювати свій вибір немає ніякого сенсу. Якщо ви думаєте так само, не дивуйтеся, бо не один ви помиляєтеся.
Коли колумніст Mаrilin vos Savant[1] опублікувала рішення в журналі Parade Magazine, на неї посипався простошквал листів читачів, висловлює свою незгоду. Ось наприклад такі.
Я упевнений, що скоро Ви отримаєте багато листів від студентів вищих шкіл і коледжів. Можливо, Вам слід зберегти ці адреси, вони допоможуть Вам у наступних випусках.
Robert W. Smith, Ph.D. / Georgia State University

Я в шоці від того, що навіть після того, як Вас виправили щонайменше три математика, Ви все ще не бачите свою помилку.
Kent Ford / Dickinson State University

Ти сама коза.
Glenn Calkins / Western State College
Всього — близько 10 тис. листів. Як бачимо тролінг процвітав ще в ті часи, коли для цього потрібно було витратити набагато більше часу і зусиль, ніж зараз, а ще сплатити поштовий конверт і поштову марку.
Талановитий угорський математик Paul Erdős також попався на гачок і відмовлявся навіть прийняти рішення, поки не побачив своїми очима комп'ютерну симуляцію результатів експерименту. Чесно кажучи, важко в це віриться, але чутка пішла, тим не менш.
Викриття
Саме лаконічне пояснення рішення ДМХ (Дилеми Монті Холла) дано в круговій діаграмі.


Внутрішній коло показує двері за якою приз, середній коло вказує на початковий вибір учасника а зовнішній — двері, що відкриє Монті. Останній також вказує на виграшні розклади — вони показані червоним кольором і їх удвічі більше ніж програшних синіх. Проста арифметика показує нам, що шанси виграти при постійному виборі рівні
1/3
, а зміна вибору дає
2/3
.
Розглянемо тепер формальне рішення задачі, на основі Теореми Байєса про умовної ймовірності.
  • Нехай А — подія, при якому машина за 1-й дверима.
  • Нехай Б — подія, при якому Монті Хол відкриває 2-ю двері з козлом.

Pr(A)
вважається просто — 3 двері з однаковою ймовірністю вибору, значить машина за першими дверима з імовірністю
1/3
. Ймовірність знаходження призу в останніх двох однакова, звідси
Pr(B|A)=1/2
.
Розрахувати
Pr(B)
, що в знаменнику, трохи складніше. Враховуючи, що:
  1. Ви вибираєте двері під номером 1, а Монті показує цапа за дверима під номером 2.
  2. Якщо машина за 1-й дверима, то Монті з імовірністю 1/2 покаже двері під номером 2.
  3. Якщо машина за 2-й дверима, то Монті завжди буде відкривати двері під номером 3, так як він ніколи не показує машину.
  4. Якщо машина за 3-й дверима, то Монті завжди буде відкривати двері під номером 2, так як він ніколи не показує машину.
Так і виходить, що ймовірність виграшу дорівнює 1/3, коли гравець не змінює двері. Відповідно, зміна двері, після демонстрації козла провідним, дорівнює 2/3.
А голуби що?
Чимало здивовані відсталістю деяких патернів людського розуму, дослідники Julia Schroder і Walter Hebranson задалися метою перевірити результати на голубах, які непогано себе зарекомендували в ряді практичних теоретико-імовірнісних завданнях.
Пернаті і цього разу не обдурили очікувань. Після деякого тренування, голуби емпіричним шляхом навчилися вибирати вірну стратегію, а от люди в тому ж експерименті — ні.
Справа була так. Вчені відібрали шістьох пересічних сизих голубів і дали їм на вибір три світяться годівниці. Слідував початковий вибір дзьобом, всі три годівниці затухали і після недовгої паузи знову починали світиться дві, з яких голуб одну вибрав початку. Комп'ютерна симуляція підміняла Монті Холла, прибравши одну порожню годівницю, після чого випробовуваний міг вибрати по-новому з решти двох. Призом була їжа — коли голуб правильно вгадував годівницю, та відкривалася і птиця отримувала нагороду. Нагорода посилювала стимул і давала імпульс до навчання. Потім з'являлася нова трійка світяться годівниць.
Птахи швидко навчилися рахувати свою вигоду і за 30 днів відсоток перемикань годівниці зріс з 36.33% 96.33%.

Графік зростання голубиних показників: на вертикальні лінії над стовпчиками — довірчий інтервал. Лівий стовпчик показує зміну вибору, а правий — той самий вибір. Деякі птахи досягли абсолютних показників — переключалися завжди.
З людьми вийшло інакше. За 30 днів експерименту деякий прогрес спочатку спостерігався, але виявити тенденцію не вдалося.

Зростання надоїв показників з 56.67% 65.67%. Межі довірчого інтервалу вказують на те, що вибір міг визначатися випадковістю.
Була проведена ще одна серія випробувань, в яких умови дилеми Монті Холла ставилися так, що вигідніше стало дотримуватися початкового вибору. Метою було перевірити здатність мозку знайти оптимальну стратегію навіть коли умови несподівано змінюються. У другому експерименті, місцезнаходження призу фіксувалося тільки після початкового вибору.
Результат підтвердив тенденцію. ЦОД голубиного мозку знову все вірно розрахував. Перший день помилкової стратегії дотримувалися 30.17% випадків, в останній 15-й день — лише у 4.33%. Результат юних home sapiens був ледь відрізнити від його відсутності: в перший день змінювали вибір у 30%, в останній день — 27.67%.
Що все це значить?
В самому загальному вигляді ці результати можна інтерпретувати наступним чином. Справа в тому, як ми навчаємося і вчимося оцінювати ймовірність подій. Найчастіше наша думка бродить по відбудованим в роки навчання коридорами в пошуках оціночної моделі. Потім ми заганяємо в неї дані і на виході отримуємо готову відповідь. Часто беруться на озброєння різноманітні евристичні методи. В цілому, це непогано працює, але іноді трапляються знатні фейли, як у випадку з ДМХ.
Альтернативою є емпіричний брутфорс: спостереження, агрегація, висновок. Це більш трудомісткий і повільний спосіб прийняття рішень, але в даному випадку саме він забезпечує голубам вироблення правильної стратегії.
Можливо, відповідь слід шукати в серії статей про Логіку Мислення. Людський і навіть пташиний мозок несе в собі ще багато загадок, тому замість спекуляцій, на завершення теми, краще спробуємо емуляцію ДМХ на R. Висновок скрипта русифікований.
5:543)$ R -f monty.r

Monty Hall Problem Simulation
"Залишити попередній вибір"

Виграш = 3380 
Кількість повторів = 10000 
Спостережуване співвідношення виграшів = 0.338 
Співвідношення виграшів в теорії = 0.3333333 

"Змінити вибір"

Виграш = 6620 
Кількість повторів = 10000 
Спостережуване співвідношення виграшів = 0.662 
Співвідношення виграшів в теорії = 0.6666667> 
> ## Plot 'convergence' to true winning proportions
> ## Blue is switching doors, red is staying
> plot.new()
> plot(cumsum(changewin) / c(1:N), main = "'Convergence' to True Winning Proportions",
+ xlab = "Trial", ylab = "Win Percent", ylim = c(0, 1), col = "blue")
> abline(h = 2/3)
> points(cumsum(staywin) / c(1:N), type = "p", col = "red")
> abline(h = 1/3)

Графік збіжності асимптотичної до ймовірностям
1/3
та
2/3
.


Використані матеріали
  1. Are Birds Smarter Than Mathematicians? Pigeons (Columba livia) Perform Optimally on a Version of the Monty Hall Dilemma
  2. Pigeons Beat Humans at Solving 'Monty Hall' Problem
  3. Pigeons outperform humans at the Monty Hall Dilemma
  4. Monty Hall Problem: Intuitive and Mathematical Solutions


  1. Автор колонки Ask Merilin, володар рекорду Гіннеса за найвищий IQ.
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.