Жінки і вбивства: чи є тут взаємозв'язок? [частина 1 з 2]


Дослідження, нещодавно опубліковане в престижному науковому журналі Human Nature, виявило, що переважання жінок пов'язане з більш високою злочинністю. Висновок сильно суперечить життєвому поданням про те, що де чоловіки, там і злочини. Однак він знаходить підтримку у порівняно молодих теоріях формування шлюбних ринків.
Незважаючи на стрункість використаних у дослідженні методів, мені здається, в ньому упущена важлива змінна, можливо, ключова. Було б чудово перевірити на тих же даних, але автори їх не публікують додатком до статті, а зібрати самостійно — досить велика робота. Поки вирішив піти іншим шляхом — вирішити проблемну змінну з дизайну дослідження.
Я перевірив, чи спостерігається подібна закономірність в Європі на рівні країн. Зацікавлених прошу під кат.
Трохи про цьому пості не надто хабровского форматуСпочатку мою увагу до дослідження привернув пост у блозі демографа Бориса Денисова. дискусії з ним же народилася ідея перевірити закономірність на країнах Європи. Перевірив. Результати цікаві. І став думати, де опублікувати. В черговий раз прийшов до висновку, що краще хабра варіанту немає. Розумію, що тема, ймовірно, зацікавить меншу частину аудиторії спільноти. І все ж я сподіваюся на доброзичливе ставлення і цінні коментарі — дуже хочеться почути думки "з". Що стосується категоризації статті — думаю, на хабре не завадив би хаб (або навіть потік) "Академія" (писав це раніше в коментарі).
В своє виправдання можу сказати, що ті, кому не цікава демографія, знайдуть в цьому пості
R
код, що дозволяє в автоматичному режимі завантажити дані про населення з двох прекрасних баз даних Eurostat і Human Mortality Database. Крім того, тут я вперше публікую функцію для швидкого побудови симпатичних карт Європи в
R
(є туманні плани на майбутнє — написати пакет
R
для подібного шаблонного картографування).
Отже, що ж мене збентежило?
Трохи детальніше про дослідженняSchacht, R., Tharp, D., & Smith, K. (2016). Marriage markets and male mating effort: violence and crime are elevated where men are rare. Human Nature, 1-12. https://doi.org/10.1007/s12110-016-9271-x
Вивчивши співвідношення статей у дорослому населенні графств США (понад 3 тис. адміністративних районів) та дані про скоєння тяжких злочинів, Райан Шахт, Дуглас Тарп і Кен Сміт прийшли до висновку, що між показниками є чітка взаємозв'язок – чим більше чоловіків, тим менше злочинів (табл. 1).
Таблиця 1. Результати регресійної моделі, що описує взаємозв'язок коефіцієнта вбивств (на 100 тис. чол.) і співвідношення статей у віці 15-45 років. [N = 3082 counties, DF = 3077; −2loglikelihood = 12,372]








Мінлива Коефіцієнт Стандартна помилка t p-value Перетин 6,338 0,245 25,86 <0,0001 Співвідношення статей, 15-45 років -0,008 0,001 -6,43 <0,0001 Частка бідних (%) 0,019 0,005 3,69 <0,0001 Частка білого населення (%) -0,018 0,002 -10,34 <0,0001 Північ/Південь (0,1) 0,187 0,067 2,77 0,006
Висновок сильно суперечить уявленню про те, що де чоловіки, там і злочини. Це інтуїтивно зрозуміле подання протягом десятиліть досить безпідставно, а краще сказати спекулятивно, домінувало в соціологічних працях. На противагу цим теоретичним побудовам існують відносно недавно набули поширення теорії, засновані на моделюванні шлюбних ринків, які передбачають зворотну залежність. Нещодавно переглянуті соціологічні теорії шлюбних ринків передбачають негативний ефект від надлишку жінок та недостатньої конкуренції серед чоловіків. Саме з цим витком сучасної наукової літератури узгоджується емпіричне дослідження Шахта і співавторів. Логіка приблизно така: достаток жінок призводить до зниження зусиль, прикладених чоловіками для формування пар, що в свою чергу веде до безладної життя і загального зростання злочинності.
Джерело: мій Демографічний Дайджест в журналі Демоскоп
Незважаючи на привабливість аналізу малих територій (при інших рівних завжди приємніше аналізувати більш дробові дані), виникають великі сумніви щодо можливої упущеної в дослідженні змінної — поділ американських графств за принципом центральності/периферійності (urban/rural).
Справа в тому, що жінки активніше чоловіків у внутрішній міграції. Це один із законів міграції Равенштейна-Чи.
Трохи літератури для зацікавленихВихідні статті Ернста-Георга Равенштйна.
Стаття Еверетта, застолбившая за Равенштейном право вважатися батьком миграциологии.
На російській мові є хороша оглядова стаття моїх колег з Інституту демографії НДУ ВШЕ.
  • Абылкаликов, С. В., & Винник, М. В. (2012). Економічні теорії міграції: робоча сила і ринок праці. Бізнес. Суспільство. Влада, (12), 1-19. https://www.hse.ru/mag/27364712/2012--12/71249233.html

В силу цієї закономірності в містах співвідношення статей зазвичай перекошується в бік жінок. Для ілюстрації наведу карту Росії моєї магістерської роботи (рис. 1).

Малюнок 1. Співвідношення статей у віці 16-29 років в муніципальних районах і містах Росії, за даними Всеросійського перепису населення 2010 року. (кликабельно)
Як бачимо, в містах жінок більше (є регіональні центри, де більше чоловіків, але, як правило, це пояснюється військовими частинами — окрема тема). І це при тому, що хлопчиків завжди народжується більше, ніж дівчаток, і в молодому віці хлопців, в цілому, більше. Але про це трохи пізніше. Отже, завдяки внутрішній міграції, в містах концентруються жінки.
І в містах же вище злочинність. Тут причин дуже багато (в основному різні соціологічні теорії про відірваності від оточення), але і доводити цю тезу немає необхідності.
Так от, на мій погляд, у дослідженні Шахта, Тарпа і Сміта, ймовірно, упущено ключова відмінність між містом і периферією. У містах більше злочинність тому що це місто, а не тому що там більше жінок і менше чоловіків. Цілком можливо, що включення в модель пояснює змінної urban/rural нейтралізує виявлений ефект.
Але щоб перевірити, чи так це, треба мати ті ж дані, що використовували дослідники. Ймовірно, займуся цим як-небудь пізніше. А поки у дискусії ми прийшли до висновку, що було б цікаво перевірити виявлену залежність на даних європейських країн. Перехід на рівень країн багато в чому має вирішити впливу міграції.
Перевірка на європейських даних
Отже, ідея в тому, щоб перевірити виявлену взаємозв'язок даних про населення і злочинності європейських країн. Перехід на більш високий рівень агрегації даних покликаний вирішити питання класифікації територій на центральні і периферійні.
Дані
  • вікова структура населення — Human Mortality Database (нас цікавить показник Exposure to risk);
  • дані про кількість вбивств в країнах Європи — Eurostat (зацікавив нас датасет називається "crim_gen", скачати простіше тут).
Дані з двох баз перетнулися в 28 країнах (насправді 26, просто Шотландія і Північна Ирладндия присутні в статистиці окремо). Непогано. Дані є, далі все просто. Розраховуємо ASR, adult sex ratio, ставлення чоловіків до жінок у віці 15-49 років (автори статті в Human Nature використовують віковий інтервал 15-49 років; відступ від їх методології продиктовано особливостями даних Євростату) та HR, Homicide Rate, коефіцієнт вбивств на 100 тис. чоловік місцевого населення.
Далі — лінійна регресія. Знаю, що автори використовують більш витончену статистичну модель, але для початку підемо простим шляхом.
Трохи про вибір типу регресійної моделіСправа в тому, що регресія Пуассона має великий сенс, коли у великому масиві даних багато значень, близьких до нуля або нульових. Для аналізу американських графств це, дійсно, представляє значну складність. При нашому аналізі країн цілком можна обмежитися простою лінійною регресією.
Кому цікавий питання застосовності регресії Пуассона для моделювання процесів з малими ймовірностями (малих коефіцієнтів) зверніть увагу на класичну статтю.
Метод широко застосовується в епідеміології. Я використовував регресії Пуассона у своєму недавньому дослідженні припливу мігрантів в Москву. Там як раз така ситуація: коли ми розглядаємо міграційні потоки роздільно для чоловіків/жінок, п'ятирічних вікових груп і 125 районів міста, дуже часто виявляється, що поєднання всіх ознак дають нульові коефіцієнти. Тому зручно використовувати регресію Пуассона. Кому цікава стаття, ось вона (безкоштовний постпрінт тут):

Але спершу подивимося на карти.
Ось співвідношення статей у віці 15-49 років у країнах Європи (тут і далі Британія дана як зважене середнє складових частин — я полінувався шукати просторові дані і возитися з ними).

Малюнок 2. Співвідношення статей у віці 15-49 років у країнах Європи
Як бачимо, розкид досить великий (на всяк випадок, в Естонії і Великобританії дані є, просто значення дуже близькі до 1). І це наводить на думку про необхідність додаткової перевірки (але про це — в кінці статті).
Поширеність вбивств в країнах Європи сильно розрізняється між Сходом і Заходом (рис. 3). У країнах Балтики показник настільки вище, ніж в інших країнах Європи (рис. 3-А), що нам доведеться виключити їх (рис. 3-В) на підставі регресійного аналізу як відверті викиди.

Малюнок 3. Коефіцієнти вбивств, випадків на 100К населення в рік.
Нарешті, ще одна змінна, яка включена в аналіз авторами оригінального дослідження — частка населення за межею бідності. Карта європейських країн виглядає так (рис. 4).

Малюнок 4. Частка населення за межею бідності.
Виключивши країни Балтики, перейдемо, нарешті, до моделювання.
Регресійний аналіз
Моделюємо рівень вбивств (hr) з допомогою даних про співвідношення статей у віці 15-49 (asr), дамм-змінних років і, по другій моделі, частки людей за межею бідності (pov). Отримуємо наступний результат (табл. 2).
Таблиця 2. Результати моделювання.
Statistical models
Model 1 Model 2
(Intercept) 98.94 (24.46)*** 97.38 (20.04)***
asr -80.30 (24.01)*** -88.77 (19.69)***
year2001 -0.73 (1.91) -0.72 (1.57)
year2002 -0.75 (1.91) -0.74 (1.57)
year2003 -2.26 (1.91) -2.26 (1.57)
year2004 -1.69 (1.91) -1.68 (1.57)
year2005 -3.47 (1.92) -3.45 (1.57)*
year2006 -4.32 (1.92)* -4.28 (1.57)**
year2007 -3.51 (1.92) -3.46 (1.57)*
pov 0.43 (0.04)***
R2 0.10 0.40
Adj. R2 0.07 0.37
Num. obs. 200 200
RMSE 6.77 5.55
***p < 0.001, **p < 0.01, *p < 0.05
Виходить, дійсно, більш низьке співвідношення статей корелює з більш високими показниками злочинності. І мінлива бідності, хоча і пояснює значну частку варіації даних, не нейтралізує взаємозв'язку між співвідношенням підлоги і злочинністю.

Малюнок 5. Кореляція між рівнем злочинності (вбивства) і співвідношенням статей у дорослому віці.
Проте, давайте зауважимо, що співвідношення статей значно нижче в Східній Європі (рис. 2), ніж у Західній. Тут ми, ймовірно, стикаємося ще раз з проявом впливу міграції, але цього разу міжнародної міграції. Ще один із законів міграції Равенштейна-стверджує, що у міжнародній міграції, навпаки, активніше чоловіки. Можливо, що результати моєї невеликий перевірки зазнали викривлення від міжнародної міграції. Перевіримо, усунувши ефект міжнародної міграції.
Аналіз по віковій структурі таблиць смертності
Для того, щоб виключити вплив міжнародної міграції, вдамося до розрахунку співвідношення статей за таблицями смертності, які також можна скачати і Human Mortality Database.
Кортоко про периодной таблицях смертностіТаблиці смертності — це базовий інструмент демографів для вивчення смертності. Вони моделюють вимирання гіпотетичного покоління. Припустимо, ми розраховуємо ТЗ для країни А в році Х. Вихідні дані — вікові коефіцієнти смертності в році Х. Далі ми моделюємо вимирання умовного покоління (зазвичай воно береться чисельністю 100К, але це не принципово), допускаючи, що в кожному віці його представники будуть вмирати з інтенсивністю, характерною для жителів країни, А в відповідному віці в році Х.
Принадність ТЗ полягає в тому, що отримані на її підставі оцінки (найвідоміша — очікувана тривалість життя) не залежать від вікової структури населення. Таким чином, можна коректно порівнювати смертність абсолютно різних населення, наприклад, дуже стару Японію і зовсім молоду Нігерію.
Зрозуміло, МС можна розраховувати окремо для чоловіків і жінок, та, взагалі, для будь-якого населення — були б дані.
Розрахуємо співвідношення статей у дорослому віці як співвідношення чисельності чоловіків і жінок за таблицею смертності, помножене на початкове співвідношення статей при народженні.
Трохи про співвідношення статей при народженніХлопчиків завжди і скрізь народжується більше, ніж дівчаток. Це непорушний закон природи. У середньому на 100 дівчаток народжується 106 хлопчиків.
Справедливості заради зазначимо, що, як правило, смертність чоловіків вище смертності жінок у всіх віках. Тому до певного віку співвідношення статей вирівнюється.
Ось як виглядало середнє співвідношення статей при народженні в наших країнах у 1990-2010 роках (рис. 6).

Малюнок 6. Первинне співвідношення статей у країнах Європи (А) і стандартне відхилення показника (В), 1990-2010.
Як бачимо, відхилення від 106 незначні. Проте, я все одно врахую їх при подальших розрахунках.
Таким чином, ми одержали співвідношення статей у дорослому віці, яким воно було б, якби на чисельність поколінь впливала тільки смертність. Тобто, міграція виключена з розгляду. Ось як виглядає наш показник на карті (рис. 7).

Малюнок 7. Співвідношення статей у дорослому віці на підставі оцінок за таблицями смертності.
Нарешті, порахуємо моделі з новим співвідношення статей у дорослому віці. При подібному аналізі, отримуємо наступні моделі.
Таблиця 3. Результати моделювання, співвідношення підлог на основі теблиц смертності.
Statistical models
Model 1 Model 2
(Intercept) 503.99 (78.42)*** 466.81 (63.99)***
asr_lt -4.68 (0.75)*** -4.41 (0.61)***
year2001 -0.76 (1.80) -0.76 (1.46)
year2002 -0.80 (1.80) -0.80 (1.46)
year2003 -2.32 (1.80) -2.32 (1.46)
year2004 -1.78 (1.80) -1.78 (1.46)
year2005 -3.65 (1.80)* -3.65 (1.46)*
year2006 -4.65 (1.80)* -4.65 (1.46)**
year2007 -3.96 (1.80)* -3.96 (1.46)**
pov 0.40 (0.04)***
R2 0.21 0.48
Adj. R2 0.18 0.45
Num. obs. 200 200
RMSE 6.35 5.17
***p < 0.001, **p < 0.01, *p < 0.05
Бачимо, що коефіцієнти при змінній співвідношення статей залишилися негативними і значно збільшилися.
Проміжний висновок
Результат не виправдав моїх очікувань. Ні перехід на рівень країн (для ліквідації ефекту внутрішньої міграції), ні використання співвідношення статей за таблицями смертності (для виключення ефекту міжнародної міграції) не змінив характер взаємозв'язку між коефіцієнтами вбивств і співвідношенням статей у дорослому віці.
У другій частині буде перевірка гіпотези на американських даних.
Буду вдячний за коментарі — напевно, щось упустив.
Примітка: публікую статтю зараз для синхронізації вийшов сьогодні Демографічних Дайджестом. В найближчий час зроблю апдейт, щоб включити обіцяний на початку статті
R
код

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.