Трансфер відкритих даних

Реальним і найважливішим мотивом публікації даних у вільному режимі є необхідність пошуку нових рішень, нових методів, моделей і технологій – нових знань означеної предметної області.



Вільне та відкрите поширення даних (відкрита публікація) – це окремий випадок системи транзакційного цільового обміну інформацією між двома суб'єктами при якій перший передає інформацію другим згідно з домовленістю (контрактом).

Розглянувши мотивацію відкритих даних спробуємо розібратися в суті самого процесу передачі даних необмеженому або умовно-обмеженому колу осіб і виділимо його відмітні особливості в порівнянні з закритою схемою.

У сучасній «информатизированной» економіці без обміну інформацією, а зокрема цифровими даними, підтримувати менеджмент на високому рівні вже практично неможливо.

Причому роль інтенсивного обміну даними постійно зростає за рахунок ряду факторів:

  1. Цифровізація економіки: дані охоплюють все більше аспектів господарської і соціальної діяльності людини.
  2. Великі дані: кількість і щільність даних зростає постійно і неухильно.
  3. Всі підключається до глобальної мережі зв'язку: єдиної інформаційної мережі безліч генераторів і споживачів різноманітних цифрових структурованих даних.
  4. Мобільність інформації: інформація (і цифрові дані, зокрема) швидко створюються та розповсюджуються як копіюванням, так і посиланнями і стають доступними в будь-якої географічної точки, де є доступ в Інтернет.
  5. Гнучкі спільноти: робота з даними організовується різними способами і рівнями в рамках активно формуються і трансформуються в мережі формальних і неформальних спільнот, а ті в свою чергу створюють і перерозподіляють нові первинні і вторинні дані і поширюють їх.
  6. Відкрите взаємодія: націленість на залученість як окремих громадян, так і професійних співтовариств або бізнесів у формування ефективної соціально-справедливої і гарантує безпеку системи регулювання і контролю спільної діяльності громадян і соціальних груп.

Враховуючи активний тиск наведених факторів, економічні суб'єкти, в рамках власних потреб у даних, змушені вирішувати для себе кілька важливих питань:

— де взяти дані? – вибір джерел даних;
— які дані потрібні? – оцінка і фільтрація складу (вмісту) даних;
— як управляти даними? – застосування техніки та інструментів;
— що робити з цими? – вибір і використання методологій і технологій;
— в чому перевага даних? – пошуку кращого рішення на основі даних;
— які ризики пов'язані з даними? – оптимізації роботи з даними по витратам і результативності (наслідків).

І звичайно ж, відповідаючи на подібні питання неминуче постає технологічна проблема обміну даними з обраним колом контрагентів, державних організацій, споживачів, постачальників, конкурентів, експертів, спільнот. Вирішенням такої проблеми є механізми передачі даних між двома і більше суб'єктами, які реалізуються в рамках різноманітних платформ, систем, протоколів і т. п.

Домовимося позначати терміном «трансфер даних» передачу даних від одного суб'єкта до іншого з допомогою таких механізмів у відповідності з заданим контрактом.

Трансфер даних (data transfer) – передача даних одним суб'єктом (постачальником) іншому суб'єкту (одержувачу) відповідно до обговореними умовами (контрактом) для спільної або паралельної реалізації економічних, маркетингових та управлінських цілей (завдань).

Кілька елементарних прикладів трансферу данихБізнес регулярно передає дані в державні податкові органи для перевірки обчислення і податкових платежів у відповідності з законодавством – це трансфер даних від господарюючого суб'єкта державі.
Споживач передає свої паспортні дані для оформлення кредитного договору з банком за нормами закону про комерційних банках і за правилами самої кредитної установи – це трансфер даних від громадянина банку.
Служба державної статистики публікує дані по безробіттю на власному сайті в Інтернеті – це трансфер даних від держави бізнесу і громадянам, які знаходяться в пошуку нового місця роботи.

Прямий вплив на розвиток і підвищення ефективності інструментів, технологій, якості та обсягів трансферу даних надають три ключові завдання, які стоять перед інформаційним менеджментом:

  1. Завдання збільшення обсягу використовуваних даних в менеджменті.
  2. Завдання розвитку і ускладнення цілей, розв'язуваних на основі даних.
  3. Завдання підвищення ефективності управління даними.
Але кожна з зазначених завдань по-своєму вирішується виходячи з типу і призначення використовуваних даних з урахуванням виконуваних суб'єктом ролей у процесі трансферу.

При розгляді схеми трансферу даних або навіть трохи виходячи за її рамки, варто розрізняти дев'ять ролей суб'єктів-учасників:

  1. генератор (автор) даних – суб'єкт, який безпосередньо створює дані;
  2. власник даних – суб'єкт, який володіє визнаним правом власності на дані;
  3. постачальник (видавець) – суб'єкт, який віддає дані;
  4. одержувач даних – суб'єкт, який приймає дані;
  5. споживач даних – суб'єкт, який зацікавлений в отриманні даних;
  6. переробник даних – суб'єкт, який приймає та обробляє дані;
  7. контролер даних – суб'єкт, який перевіряє дані при передачі;
  8. регулятор передачі даних – суб'єкт, який визначає правила та процедури передачі даних;
  9. координатор передачі даних – суб'єкт, що допомагає передавати дані та/або частково управляє процедурами передачі даних.
У простому випадку перші три ролі (1-3) реалізуються одним суб'єктом, а наступні три ролі (4-6) реалізуються іншим суб'єктом.

Якщо одержувач даних проходить ідентифікацію, аутентифікацію, наступну авторизацію по операції отримання конкретного набору даних і обмежений у використанні набору даних, то мова йде про закритою або захищеної (protected) схемою трансферу даних.

Це означає, що постачальник безпосередньо передає одержувачу з обмеженого, ідентифікованого та довіреної кола осіб кінцевий і відомий набір даних у відповідності з двосторонньою угодою (контрактом) про кількість, якість даних і способі їх надсилання-отримання.

Якщо одержувач даних не проходить ідентифікацію або проходить формальну ідентифікацію і не проходить авторизацію при операції отримання конкретного набору даних і не обмежений у подальшому використанні набору даних, то мова йде про публічної (public) схемою трансферу даних.

Це означає, що постачальник безпосередньо чи опосередковано передає одержувачу з необмеженої або формально обмеженого, не ідентифікованого або формально идентифицируемого кола осіб заданий набір даних у відповідності з публічною угодою (контрактом) про кількість, якість і спосіб їх передачі, до якого одержувач приєднується.

Кілька ключових моментів для порівняння двох схем трансферу даних:

Protected-схема

  1. Одержувач ідентифікується і проходить аутентифікацію
  2. Доступ до даних здійснюється після авторизації одержувача даних
  3. Формат і вміст даних готуються особливим чином
  4. Умови передачі даних узгоджені сторонами в закритому вигляді (документ)
  5. Застосовується спеціальна захист даних і каналів їх передачі


Public-схема

  1. Одержувач анонімний або ідентифікований формально
  2. Доступ до даних не вимагає авторизації або вимагає формальну авторизацію
  3. Формат і вміст даних готуються стандартним чином
  4. Умови передачі декларуються постачальником даних
  5. Захист даних і каналів передачі не застосовується або мінімальне


Захищена схема трансферу даних застосовується, наприклад:

  • для обміну даними з економічними партнерами (споживачами, дилерами, дистриб'юторами, постачальниками, аутсорсинговими компаніями);
  • для передачі облікових даних в державні регулюючі та контролюючі органи;
  • для галузевого комерційно значущого інформаційного партнерства (саморегульовані організації, асоціації, партнерства, консорціуми);
  • як внутрисубъектная (корпоративна) передача комерційних даних: междивизиональная, транскордонна і т. п.
При цьому, protected-схема має такі особливості:

  1. Закриті схеми і протоколи обміну.
  2. Посилені процедури безпеки.
  3. Високі вимоги до достовірності інформації.
  4. Незмінний формат і склад даних.
  5. Узгоджені або нормативні умови обміну даними (двосторонній контракт).
  6. Єдина або сумісна на високому рівні інформаційна система постачальника і одержувача даних.
  7. Високі ризики при «витоку» даних у процесі обміну.
  8. Особлива комерційна (економічна) цінність даних.
В протилежність захищеною, публічна схема трансферу даних застосовується у тому числі:

  • для обміну даними з вторинними (кон'юнктурними) економічними суб'єктами;
  • для передачі даних на громадське ознайомлення і контроль;
  • для відкритого інформаційного взаємодії з галузевими та непрофільними асоціаціями та експертами (проведення спеціальних заходів);
  • як корпоративна відкрита соціальна мережа (напр., обмін даними з колегами і активними клієнтами).
Таке застосування пояснює особливості public-схеми:

  1. Відкриті процедури та протоколи обміну.
  2. Прості процедури безпеки.
  3. Довірча вірогідність інформації.
  4. Постійний контроль формату і складу даних одержувачем.
  5. Декларовані умови обміну даними (контракт приєднання).
  6. Гіпотетична несумісність інформаційних систем постачальника і одержувача даних.
  7. Зниження ризиків при «витоку» даних за рахунок їх попередньої фільтрації та агрегування.
  8. Дані мають слабку або невизначеною комерційною цінністю.
Кожен з варіантів схеми передачі даних є корисним для тієї чи іншої задачі і конкретний вибір залежить від поставленої мети.

Головним же критерієм вибору між захищеною і публічної схемами звичайно ж є цінність самих даних. Якщо це дані, які визначають конкурентну перевагу бізнесу (організації) або взагалі є його комерційною таємницею, то public-схема не може розглядатися як прийнятна, навіть якщо поширення даних передбачається серед широкого кола осіб (партнерів).

Слід враховувати і розуміти, що дані передаються публічно – це:

  • дані, публікації яких невідоме, або до кінця незрозуміло, як і для яких цілей буде їх використовувати одержувач;
  • дані, які не підлягають розповсюдженню серед конкретних осіб, а серед умовно-обмеженого чи не обмеженого зовсім безлічі користувачів;
  • дані, відносно яких не передбачається контроль кількості зроблених копій;
  • машиночитані валідні дані;
  • придатні для обробки (аналізу) і подальшого використання дані (тобто представляють певний осмислений набір інформації по конкретному предмету);
  • дані, які явно або неявно супроводжуються метаданими, визначальними: схему або модель даних, оцінку якості даних, цільове призначення;
  • дані посилаються на контекст (або надають таку відсилання);
  • людині-зрозумілі при читанні дані (іноді).
Дані у відкритому доступі для великого числа споживачів повинні володіти певною мірою «незалежності» і «самостійності».

Це пов'язано з тим, що постачальник даних не буде мати можливості роз'яснювати кожному користувачеві їх призначення, склад, якісну характеристику і т. п. до Речі, тут постає питання супроводу публічних даних такими ж публічними метаданими.

І, ще раз...

Публічна схема трансферу даних – це погана схема для передачі даних складових комерційну чи державну таємницю, а також спеціальних даних, поширення яких обмежено чинним законодавством.

Public-схема трансферу даних – це і є спосіб публічного «відкриття» даних для великого числа не ідентифікованих користувачів.
Залишимо осторонь тему захищеного обміну даними, тим більше, що велика і важлива частина зводиться до інструментам і технологіям захисту каналів зв'язку, алгоритмів надійного шифрування при передачі, захисту цілісності і т. п.

Відкрито опубліковані дані не обов'язково повинні зовсім не мати обмежень по використанню.

Навіть скоріше навпаки. Публічні дані обов'язково мають ряд обмежень, у тому числі юридичних застережень. Найпростіше з них зазвичай доступно прямо або за посиланням внизу сторінки для скачування відкритого набору цифрових даних і звучить воно приблизно так: «користувач даних повинен вказувати посилання на джерело відкритих даних». Це лише один з обов'язкових юридичних аспектів відноситься до опублікованих відкрито даними. Щось регулюється на законодавчому рівні, а на рівні корпоративних регламентів.

Але відносно вільно розповсюджуваних даних правове регулювання швидше грає дозвільно-роз'яснювальну роль. Суворе ліцензування та жорстке авторське право не має особливого сенсу застосовувати до цифрових даних, що публікуються для широкого кола споживачів. Який взагалі сенс передавати дані відкрито, якщо ви все одно не зможете повноцінно контролювати виконання умов виданих ліцензій чи авторських угод.

Дані на вільний трансфер повинні бути завжди дійсно вільними для розповсюдження.

У будь-якому випадку постачальник ніколи не зможете стовідсотково проконтролювати кількість зроблених споживачем копій.

А треба якось відкрито для публікованих даних посилатися на вільні ліцензії типу Creative Commons Attribution?Питання не однозначний. Кожен видавець сам має право відповісти на нього виходячи з власної правової позиції. Але, знову ж, не забуваємо про головної мотивації безоплатного розкриття даних. Постачальник даних публікує їх вільно не для того, щоб потім коли-небудь і як-небудь переслідувати користувачів. Якщо дані відкриваються, значить, з ними дозволяється робити майже все що завгодно. І ніякі вмовляння у вигляді складних юридичних вишуканих документів не завадять одержувачу даних як-то «по-своєму» їх обробити, проаналізувати і передати третій особі. Видавцеві ж простіше всього в зрозумілій формі викласти те, як він бачить використання опублікованих ним даних і що він очікує від сумлінних користувачів.

Потенційна можливість якось обмежити використання даних передаються публічно існує – це декларування обмежень. Причому можна оголосити обмеження на доступ до даних, так і на використання даних.

Обмеження доступу до даних (варіанти):

  1. «обрані» – доступ отримують лише деякі особи, які входять у цільові (галузеві) експертні спільноти, асоціації, організації і т. п. (але при цьому вони не обмежуються у вторинній передачі даних по public-схемою);
  2. «правильні» – доступ одержують тільки особи, які погоджуються виконувати задані постачальником умови та/або відповідають кваліфікаційним вимогам постачальника;
  3. «всі» – доступ мають будь-які зацікавлені в даних користувачі, фактично відсутність будь-якого обмеження.
Обмеження використання даних (варіанти):

  1. «як умовлено» – дані можуть бути використані тільки на встановлених постачальників умовах в окремому документі;
  2. «як вільні» – дані можуть бути використані вільно, а за копію даних не повинна стягуватися плата;
  3. «як завгодно» – дані можуть бути використані без будь-яких обмежень, в тому числі навіть їх копії можуть передаватися за плату.
Але всі ці обмеження є умовними і лише декларуються – формалізуються і заявляються – постачальником даних. Ряд технологічних інструментів, звичайно ж, дозволяє встановити контроль виконання заданих обмежень, але тільки в якихось реальних межах. Значні обмеження просто переведуть дані з розряду публічно доступних в захищені.

До речі, мета обов'язкового посилання на джерело відкрито опублікованих даних, яку змушені вимагати постачальники – встановити прямий зв'язок між публічними даними і створених на їх основі рішенням (знанням, продуктом, сервісом тощо). Посилання на джерело цифрових даних дозволяє отримати важливу зворотну реакцію аналітиків і користувачів. Вона є найпростішим способом контролювати варіанти використання безкоштовно-розповсюджуваних даних.

Якщо повернутися до визначень відкритих даних, які були приведені у попередній публікації, то в них відсутня вказівка на суб'єкт, який їх розкриває. Передбачається, що вільно поширювати дані може хто завгодно. Швидше за все для соціального, культурного чи політичного значення справді немає різниці, хто опублікував дані: держава, бізнес або громадянин. Але з точки зору економічних взаємовідносин і конкуруючих ринків – це видається важливим.

P. S. дана публікація продовжує тематичну серію за відкритими даними, розпочату в статті Чому дані можуть бути відкритими і безкоштовними і є виключно авторською точкою зору не претендує на істину в останній інстанції.
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.