Неякісний світ відкритих держфінансів

image
Джерело картинки: indianexpress.com/article/business/budget/budget-2016-rs-25k-cr-falls-short-of-psu-banks-hopes

Відкриті дані (як і всі інші напрямки) розвиваються в Росії своєрідно: складно зрозуміти і звикнути до того, що про доходи і витрати держави дізнатися набагато простіше, ніж про екологію, освіту, охорону здоров'я. При цьому федеральні і регіональні відомства публікують в основному реєстри підвідомчих установ, списки актуальних вакансій та адреси культурних закладів та аптек (вельми «заїжджені» масиви даних з обмеженими областями застосування).

Фінансові державні органи дивляться на відкритість набагато ширше:

  1. Міністерство фінансів регулярно публікує дані про зведеної бюджетного розпису (витрати федерального бюджету), відкриває історичні бюджетів, проводить конкурси та зустрічі для розробників
  2. Регіональні і муніципальні фінансові органи розміщують інформацію про бюджети, їх проектах, звітах про виконання бюджетів (так, не завжди якісно, не завжди в одному місці, але дані є і ними можна користуватися). У цифрах: приблизно 90 регіональних і 23 000 муніципальних бюджетів в рік.
  3. Федеральне казначейство розміщує реєстри субсидий учасників і неучасників бюджетного процесу, дані про державних контрактах. У цифрах: реєстр учасників бюджетного процесу налічує понад 150 тис. записів, кількість записів державних контрактах наближається до 20 мільйонів.
  4. Ряд інших відомств, таких як ФНП, теж починають робити перші дії по відкритості. Надання базових даних з ЕГРЮЛ в машиночитаемом форматі і безкоштовно, природно, не планується, але спробу знайти щось цікаве в них все ж можна зробити.


В цілому, робота держорганів у цьому напрямку не може не радувати, за що окреме спасибі Мінфіну Казначейству (на правах піару та реклами даних), відкритим до діалогу і запитам розробників. Одна велика проблема тільки в тому, що у всій цій діяльності відсутній системний підхід, внаслідок чого дані публікуються де завгодно (спробуйте, наприклад, зібрати бюджетів усіх муніципалітетів Санкт-Петербурга) і як завгодно (а потім всі ці бюджети вивчити, виявити помилки і спробувати довести муніципалітетам, що їх дані не вірні), а їх якість залишає бажати кращого. З очевидних спірних моментів можна виділити наступне:

Розстановка пріоритетів
Незважаючи на спостереження за роботою Мінфіну з моменту оголошення "курсу на відкритість" (2012-2013 рік), для мене досі залишається загадкою пріоритизація розкриття даних. Однією з основних мотивацій для запуску цього напрямку в Росії було входження в ТОП-5 в міжнародному рейтингу Open Budget Index. Він складається з двох показників: прозорість (доступ до інформації та даних) і можливість участі громадян у бюджетному процесі. З другим показником у нас поки що все погано (і в цьому «винне» не тільки держава, але і самі громадяни), а ось про перший можна поміркувати.

З точки зору доступу до інформації про витрати і доходи (не розглядаємо критерій «машиночитаемость») — Росія якщо і не лідер у світі, то в першій трійці-п'ятірці точно: інформація розкривається на федеральному, регіональному, муніципальному рівнях. Але вибір масивів для розкриття викликає питання, і, якщо раніше стандартним поясненням було: «ми не знаємо, що вам [розробникам] треба», то зараз йде відсилання на проведені Мінфіном опитування про затребуваність фінансових даних. В опитуваннях були перераховані такі цікаві дані, як реєстри видаткових зобов'язань, федеральний бюджет, переліки публічних нормативних зобов'язань і ще близько 30 пунктів, а в підсумку опубліковані в цьому році будуть дані про діамантів, смарагдів і інших дорогоцінних каменях (потрібно зазначити, що 2-3 цікавих нових набору все ж таки будуть). За чотири роки я не зустріла жодного російського або зарубіжного людини, який би цікавився російськими даними про алмази (про продаж нафти, «госконтрактных» даних, бюджетах, фінансування ЗМІ запитують, а хто голосував" за відкритість смарагдів для мене залишається загадкою).

Питання про сумнівну виборі даних для розкриття не виникло б, якби були опубліковані «базові» дані, до яких, в першу чергу, відноситься федеральний бюджет (тобто Закон «Про федеральному бюджеті»). Це не тільки основний показник для рейтингів (Open Budget Index, Open Data Barometer), заради яких все і затівалося, але й основний фінансовий документ, за яким живе і функціонує держава. Зведена бюджетна розпис (витрати федерального бюджету) публікується в машиночитаемом форматі і оновлюється на сайті Мінфіну, а всіх інших даних із закону «Про федеральному бюджеті» (доходи, різні нормативи, субсидії тощо) в машиночитаемом вигляді немає. Дані регіонів і муніципалітетів в XLS і CSV публікуються (не всіма, але багатьма), дані за контрактами і звітів про виконання бюджетів теж є, а от федеральний бюджет у нас досі тільки в PDF. Хоча щодо офіційної позиції (тричі озвученої на зустрічах з розробниками) «розкриття ФЗ „ПРО федеральному бюджеті“ нічого не перешкоджає і це буде зроблено». Ось тільки після появи цих даних сказати про те, що "і року не пройшло" вже не вийде. Пройшло.

Низька якість даних
Припустимо, вам пощастило і ви знайшли потрібні дані (навіть подвійно пощастило — вони не тільки є, але і машиночитані). Радість від їх наявності зазвичай триває недовго — приблизно до першої спроби розібратися в них: структура буває заплутаною (передаю привіт «драбинці» Мінфіну, малопридатною і для програміста, і для «звичайної людини»), документація практично завжди відсутній. Зрозуміти базові дані, такі як бюджети та контракти, можна, але складно, — Бюджетний кодекс, системно описує бюджетну систему, Альбоми ТФФ, документирующие дані про госконтрактах і держзакупівлі, докладні, але об'ємні і усипані специфічною термінологією (що, безумовно, знижує привабливість цих даних для розробників). Основні проблеми починаються при детальному розгляді і спробі використовувати і зіставляти дані:
  1. Офіційні дані, отримані з сайту zakupki.gov.ru, рясніють наявністю помилок у назвах організацій, плутаниною із зазначенням валюти (про кількість контрактів, укладених в австралійських доларах ми розповідали в розсилці держфінансів минулого тижня), плутаниною в розмірності (дані зазначаються в тисячах, коли повинні бути вказані в рублях), помилками в ІПН (фантазія фізосіб при заповненні поля "ІПН/КПП" безмежна; логіка представників організацій, що вказують ІПН банку замість ІПН своєї організації не піддається поясненням).
  2. З бюджетами не краще. При їх формуванні та/або публікації невірно використовуються класифікатори (наприклад, відсутні провідні нулі, цифра «0» замінюється літерою «о») використовуються биті посилання (наприклад, на інші xls файли з комп'ютера Маші з адміністрації муніципалітету), рідше зустрічаються розбіжності в сумах або некоректне розуміння представниками муніципалітетів тонкощів Бюджетної системи РФ (наприклад, МО Палацовий використовував у 2015 році однакові коди для муніципальних програм, що недопустимо згідно офіційної відповіді Комітету фінансів СПб).


Докладніше поговорити про якість даних можна на хакатоне Budget Stories, який пройде 25-26 червня в Санкт-Петербурзі (мене запросили взяти участь в ньому в ролі ментора, тому не буду приховувати свою особисту зацікавленість у залученні тих, з ким можна обговорити фінансові дані, їх якість та ідеї додатків).

Відсутність відповідальних і низька зацікавленість у підвищенні якості даних
Виправити помилки, привести адреси і телефони до єдиного формату трудомістке, але реалізовується. Складніше розібратися з змістовними помилками, для усунення яких потрібні коментарі першоджерела. У випадку з муніципальними даними (в основному з бюджетами) складно подвійно — рівень ІТ-грамотності і розуміння специфіки «відкритих даних» на муніципальному рівні об'єктивно нижче, завдань і проблем і без відкритих даних повно. Крім того, формально муніципалітети не є третім рівнем влади, тобто на якість їх даних ні Мінфін, ні регіональні державні органи вплинути не можуть. І, якщо проблема не усувається взаємодією з джерелом даних, то наступною інстанцією офіційно є Прокуратура, звернення до якої не є «позитивним» способом вирішення проблеми і навряд чи посприяє продовженню комунікацій з муніципалітетом (якщо ви плануєте, наприклад, виступати з пропозиціями).

З госконтрактами та іншими даними, отриманими на zakupki.gov.ru ситуація аналогічна — в загальних словах Казначейство «реалізувало попереджувальний контроль на відповідність інформації про постачальників, зазначеної користувачем, даними ЕГРЮЛ/ЕГРІП», а в офіційних відповідях на конкретні питання з прикладами невірних даних йде відсилання на «персональну відповідальність, яку несе особа, яка має право діяти від імені замовника».

Резюмуючи: даних про держфінанси багато, вони цікаві, не завжди якісні і складні. А вони вам потрібні? Може бути ви вже використовуєте? А якщо ні, то які причини зупиняють?

У будь-якому випадку спасибі за роботу з відкритості і справедливості, треба зауважити, що одне виправдання у Мінфіну все-таки є — їм не вистачає звернень і фідбек за якістю даних від розробників. Зрозуміло, що залишати офіційні звернення на сайті держорганів не особливо зручно (а у випадку з Мінфіном потрібно ще витратити час на вибір неочевидних категорій), але можна написати їм листа на opendata@minfin.ru (поодинці у мене не вийшло зрушити лічильник звернень з нуля), залишивши коментар на сторінці facebook або навіть відзначити «федеральний бюджет» та інші корисні масиви даних в опитуванні про затребуваність даних. До речі, представники Казначейства на зустрічі з розробниками оголосили, що жодне звернення з приводу даних не залишається без відповіді, перевіримо? ;-)
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.