Соціальна нерівність і зарплати чиновників

Волею доль, до мене в руки потрапили дані про заробітні плати, преміях і понаднормових безлічі держслужбовців одного великого портового міста, від мера до сторожа басейну. Не втрачаючи ні хвилини, я кинувся вгризатися в цифри. Немає нічого цікавіше, ніж дивитися на чужі зарплати, особливо, коли можна виправдати себе тим, що займаєшся Data Science!

Як тільки пройшли перші напади заздрості, я усвідомив, що в датасете є інформація не тільки по великим керівникам, але і рядовим співробітникам від самого низького рівня. Виходить, що за цим даними можна спостерігати основні закономірності в розподілі доходів у реальному світі. Користуючись нагодою, запрошую всіх диванних економістів в захоплююче турне в світ розкішних окладів і скупий статистики!

Сьогодні ми поговоримо про середні і медіанні зарплати, індекс соціальної нерівності Джині, відносини між багатими і бідними (індекс Rich/Poor), нездоланний розрив доходів (ефект Матвія) і кар'єрний ріст.

San Francisco

Відразу вскрою основну інтригу — що це за дані і звідки я їх взяв. Це реальна інформація про заробітних платах муніципальних службовців міста Сан-Франциско (на фото), що у Каліфорнії, США. У датасете присутній справжні імена, займані посади, оклади, премії, понаднормові і премії деяких (можливо, всіх) службовців за 4 роки — з 2011 по 2014 включно. Дані не дуже чисті і не зовсім стандартні, але працювати з ними можна. Все це люб'язно надала адміністрація штату в рамках проекту Transparent California. Всі суми в доларах на рік, до вирахування податків.

Я свідомо пропущу етапи вивчення і підготовки даних, а також код побудови графіків. Бажаючі можуть вивчити все це в github. Там Python, Jupyter, Pandas і Seaborn. Отже, приступимо.

Розподіл заробітних плат
У датасете є не тільки базові доходи співробітників, але і різні надбавки. Щоб не вдаватись у дрібниці, будемо розглядати тільки базовий дохід і загальний дохід з урахуванням усіх надбавок та премій.

Ось так виглядає розподіл базових доходів працівників за 4 роки:
Базові доходи

Ці чотири… гхм… «морквини» символізують розподіл доходів за 4 роки. По осі Y — величина доходу, по осі X — щільність імовірності розподілу доходів. Поперечні пунктирні лінії — це квартилі 25%, 50% (медіана) і 75% розподілу. Чітко видно кілька ущільнень — в районі $5.000, $65.000, $110.000 і $170.000. Так виглядають класи співробітників — тимчасові робітники, лінійний персонал, висококласні фахівці і топ-менеджмент. Здається, що «морквина» повільно їде вгору, що може означати як зростаючий рівень добробуту, так і інфляцію.

Тепер подивимося на розподіл загального доходу співробітників:


Дані за 2011ый рік сильно відрізняються від наступних. Виявилося, що у нас немає даних про преміях протягом цього року. Взагалі, дані за 2011ый рік відформатовані інакше, що сильно ускладнює їх використання. Крім того, в цьому році змінилося виборче уряд, з-за чого зарплати людей на виборних посадах пораховані не за повний рік.

В інших роках ми бачимо, що шар премій «згладив» «морквину» розподілу, практично ліквідувавши чіткий розподіл співробітників по класах. Тобто, з урахуванням премій хороший лінійний фахівець заробляє порівнянно з ненапрягающимся експертом.

Сан-Франциско — недешевий місто. Офіційна мінімальна зарплата становить близько $20.000 в рік, суб'єктивний прожитковий мінімум — від $40.000 в рік. Незрозуміло, звідки ж така велика кількість людей з зарплатою менше МРОТ? Відповідь криється в ознаці Status — FT (Full-time) і PT (Part-time), тобто у вибірці є не тільки штатні співробітники, але і сумісники, в т. ч. разові підробітку. Ознака Status проставлений тільки для 2014го року.

Ось так виглядає розподіл загальних доходів з поділом на штатних і позаштатних працівників:


Як видно, медіанний дохід штатника становить близько $130.000 в рік.

Давайте заодно відповімо на питання, якому присвячено безліч спорів в інтернетах — як пов'язані середня і медіанна зарплата. Існує думка, що середня зарплата значно вище медіанної рахунок доходів топ-менеджменту.

Перевіримо, чи так це:


На верхньому малюнку ви бачите спробу підігнати розподіл зарплат до нормального. Найбільшим значенням щільності розподілу відповідає середня зарплата, яка становить $90.000. На нижньому малюнку зображені квартилі розподілу зарплат, середня лінія усередині прямокутника — медіанна зарплата, і вона становить $85.000. Як бачимо, дійсно, середня зарплата вище медіанної, але аж ніяк не суттєво.

Соціальна нерівність
Найбільш хвилюючим в зарплатах є питання їх справедливого розподілу (від кожного — за здібностями, кожному — за працею?). Мудрі предки залишили нам чисельні показники нерівності розподілу доходів. До найбільш популярним відносяться індекс Джині та індекс R/P. Давайте поговоримо про них докладніше.

Індекс Джині — це статистичний показник ступеня розшарування величини. В економіці його зазвичай використовують для вимірювання розшарування населення за доходами. Вважається індекс Джині як виражене у відсотках відношення площі між кривої Лоренца і діагоналлю y=x (зелена область) до площі всього трикутника нижче діагоналі (синя + зелена області):


Показник вимірюється від 0 до 100, де 0 — повна рівність (все синє), а 100 — усі доходи у однієї людини (все зелене). приклад, Джині Росії — 42.0, США — 45.0, Німеччини — 27.0, Китаю — 47.3. Найменший Джині у Швеції — 23.0, найбільший — у африканських бананових монархій, де він може підніматися понад 60.

На малюнку вище зображено крива Лоренца для доходів штатних співробітників. Індекс Джині для них становить 18.9, що говорить про практично комуністичної зрівнялівки. Можна трактувати це так — якщо вам вдалося потрапити в штатні співробітники мерії Сан-Франциско, зарплатою вас не скривдять. А можна так — якщо ви працюєте в мерії, кар'єрна драбина у вас невисока.

Ще одним цікавим індикатором розшарування є відношення доходів найбагатших до доходів бідних. Подивимося на темно-синій трикутник на малюнку вище. Його ширина — 20%, це 20% найбагатших людей. Висота темно-синього трикутника — 31%. Це означає, що на 20% найбагатших людей припадає 31% сукупного доходу. Тепер зверніть увагу на червоний трикутник. Його ширина — 20% (найбідніших людей), а висота — 12% (доходу), тобто на 20% найбідніших людей припадає 12% сукупного доходу. Індекс Rich/Poor 20 відображає співвідношення доходів найбагатших 20% до найбідніших 20% суспільства. Для штатних працівників муніципалітету Сан-Франциско R/P 20 становить 2,5. Можна трактувати це як висоту стелі зростання на кар'єрних або соціальній драбині.

Тепер для порівняння подивимось на криву Лоренца для позаштатних співробітників:


Ми бачимо разючу відмінність від попереднього графіка. Дуга кривої Лоренца прогнулася далеко вниз, зелена область збільшилася в розмірах. Багатий трикутник займає майже половину висоти, а бідний трикутник майже не видно. Індекс Джині становить 53.6, а R/P 20 дорівнює 45. Це приблизно відповідає бідним країнам Південної Америки, з яскраво вираженим розшаруванням на заможних капіталістів і простакуватих мучачос.

Ефект Матвія
Мудрість поколінь свідчить, що "всякому маючому дасться йому та додасться, а хто не має відніметься і те, що має". Іншими словами, зазор між бідними і багатими постійно збільшується. Це кумедне явище прото-соціологи спостерігають протягом тисячоліть, а останнім часом його усвідомлення стало доступно широким масам. Ефекту Матвія, як його називають економісти, випливає висновок, що єдиний спосіб примножити свій стан і залишити спадщину своїм дітям — належати до верхівки суспільства. Ця гіпотезу дуже неприємно усвідомлювати, і було б непогано, якщо б вона виявилася помилковою. Так давайте ж її спростуємо!

На малюнку нижче ви бачите сумарний розмір фонду оплати праці муніципалітету Сан-Франциско за 3 роки. Він виріс з $3,70 млрд в 2012ом році до $3.82 млрд в 2014ом, показавши зростання +3,2% загального обсягу.


Тепер давайте побудуємо графіки середнього доходу вищого і нисшего децилей (10% найбільших і найменших зарплат). Як видно, середній дохід у вищому дециле збільшився на +3,0%, в той час, як дохід у нисшем дециле істотно впав на -12,6%.


Це означає не тільки те, що ефект Матвія є, але і те, що він дуже сильний і легко помітний неозброєним поглядом. Можна припустити, що саме цим пояснюється впевнене зростання індексу Джині в США протягом останніх 30 років.

Варто зазначити, що через відсутність розмітки full-time/part-time в ранніх роках, ми оцінювали доходи децилей на змішаною вибіркою з штатників і позаштатників. Це могло внести суттєві корективи в результат, так що я в ньому не впевнений — надто неправдоподібно виглядає величина зазору.

Кар'єрне зростання
Раз вже ми заговорили про кар'єрне зростання, давайте перевіримо, чи є він, чи це фантастика? Оскільки розбиратися в ієрархії американських чиновників немає ніякого бажання, будемо вважати, що кар'єрне зростання зводиться до зростання зарплати. У датасете є імена і прізвища людей, і вони очікувано повторюються з року в рік.

Давайте подивимося на доходи одних і тих же людей в 2012ом і 2014ом роках, порахуємо зростання у відсотках і побудуємо розподіл зростання в перерахунку на один рік:


Зліва зображено графік щільності ймовірності зростання доходу, праворуч — графік функції розподілу зростання доходу. По-перше, видно, що зростання доходів 20% співробітників лежить в діапазоні від 0 до 2%, що приблизно покриває інфляцію. Найбільш поширений зростання доходів — від 2% до 5%, він спостерігається в 50% випадків, це мода швидкості кар'єрного зростання. Далі, приблизно 15% людей змогли досягти зростання в 5-10%, такий темп зростання можна вважати високим. І не більше 5% людей показали видатний зростання доходів більш ніж на 10% рік до року. Варто також відзначити, що 10% співробітників показали негативний зростання доходу, тобто їх зарплати зменшувалися рік до року.

Зауважимо, що для побудови цього графіка мені довелося накласти на вибірку угрубляющие фільтри, щоб зрізати «довгий хвіст», утворений людьми, хто перейшов з разових контрактників в штат, тим самим збільшивши свої доходи від муніципалітету в 50-100 разів. Ці фільтри могли істотно вплинути на розподіл.

Висновок
Виявилося, що на прикладі навіть такої маленької мірка, як муніципалітет міста Сан-Франциско, можна вивчати соціологічні та економічні закономірності.

Ми можемо відзначити наступні тези:
  • зарплати у муніципалітеті дуже скупчено
  • хороший фахівець може заробляти не менше посереднього керівника
  • медіанна зарплата несильно відрізняється від середньої
  • розрив доходів між багатими і бідними збільшується
  • навіть у спокійній держслужбі є можливості для кар'єрного зростання
Однак, це лише один сектор економіки і тільки в одному дуже нетиповому місті. Я не рекомендую робити на основі цієї статті далекоглядних висновків про економічної статистики в США і, тим більше, в світі в цілому.

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.