Куди рухається сучасна біометрія

Біометрія це така тема, яка супроводжується міфами і легендами. Про 99% точність, надійність, про проривні технології, про розпізнавання людей Вконтакте. Пару днів тому була стаття про Ощадбанк, наприклад. Розповідаючи про біометрію дуже просто маніпулювати інформацією: мало хто з людей відчуває статистику.

Років п'ять тому я вже писав на Хабре серію статей про біометрію і те як вона влаштована1, 2, 3). Як не дивно, за ці роки досить мало що змінилося, хоча зміни і відбулися. У цій статті я спробую якомога більш популярно розповісти про сьогоднішні технології, про те який прогрес йде і чому до словами Грефа про те, що до слів «карта, основне завдання якої полягає в ідентифікації, відходить у минуле» варто відноситься з скептицизмом.

найголовніше

У біометрії є одна головна характеристика, яка визначає якість будь-якої системи. Точніше їх дві, але вони нерозривні:
• Ймовірність помилкового зіставлення з об'єктом у базі (ймовірність помилкового допуску, FAR — false access rate)
• Ймовірність відмови розпізнавання об'єкта перебуває у базі (FRR — false reject rate)

Написати програму з 100% точністю підтверджує особистість людини може кожен з вас за хвилину. Потрібно просто завжди виводити «так, це шуканий людина». Тільки от помилкове зіставлення у такої програми теж буде 100%. Зможе пройти будь-яка людина.
Тепер ви знаєте, що коли Греф говорить про 99.9% точності — вам щось недоговорюють.


Пару слів про точності

Точність це взагалі така штука, про яку складно говорити в контексті великих цифр. 99.9% це багато чи мало? А вірогідність 90%, це може досить?

Візьмемо FAR рівним 0.1% (хвалені 99.9%). Припустимо, що сам з собою людина завжди збігається (FRR=0, хоча це буде далеко не так).
Припустимо, у вашій компанії працює 100 осіб і ви хочете зробити облік робочого часу. При FAR=0.1% людина буде прийнятий за когось іншого приблизно в 100*0.1=10% випадків. Тобто з 100 працівників 10 осіб будуть проходити як інші люди кожен день.

З іншого боку, даних характеристик вистачає в тих випадках, коли у людини є карта доступу. Щоб проникнути на ваше підприємство йому знадобитися скористатися картою приблизно 1000 разів, щоб зійти за її власника. При мінімальній охорону це неможливо
Точності 0.1% FAR цілком достатні для забезпечення верифікації користувача CALL-центру (після того як він представився, або після визначення його номера телефону), але не для ідентифікації.

Поки що розглянемо інший приклад. Вірогідність віч (один з найбільш точних методів розпізнавання) прийняти одну людину за іншого (FAR) — 0.00001%. Здається, що це дуже добре? Але якщо в нашому банку мільйон клієнтів, а ми не використовуємо картки? А це значить, що у кожного користувача з імовірністю 10% у нас випадає джекпот — доступ до чужого рахунку.
Звичайно, можна розпізнавати по двом очам, все буде значно краще, ймовірність помилкового доступу буде всього 0.0001%. Але якщо за день користуються банкоматами хоча б 100 тисяч осіб, то кожен день з імовірністю 10% ми будемо мати один помилковий доступ до чужого рахунку.

Хитрощі у відсотках

В реальності вас обманюють. Як я сказав, все написане вище без урахування FRR. Помилковий відмова доступу теж неприємний. Як його вважають розробники:
• Найчесніші роблять так: беремо відкриту базу з біометричними характеристиками, вважаємо що виходить.
• Шахраюваті виробники викидають з бази одного-двох чоловік, які псують всю статистику. Такі люди завжди є.
А тепер секрет. Перший пункт це теж обман. Хоча і законспірований. Відкриті бази — це найчастіше ідеальні картинки/дані, які набирали в лабораторії при правильному освітленні/рівні шумів. Всі нерізке/двозначне з таких баз прибирають вручну.
В реальності все не так добре. Припустимо я хочу пройти по райдужці ока або по обличчю або по венах рук (і там і там сканери дуже схожі). З чим я можу зіткнутися?
1. Сканер не помітить, що в нього хтось з'явився в полі зору
2. Сканер неправильно виставить фокус
3. Сканер засвічений сонцем
4. Сканер захопить не те що потрібно
5. Параметри моєї біометричної характеристики знаходяться поза межах роботи алгоритму: величезна/маленька рука, опік обличчя, змінена геометрія райдужки
6. Бази на яких працює алгоритм розпізнавання голосу зазвичай набирають не в метро і не на найгірших телефонах.
Усе це не враховується при підрахунку FRR.
В результаті алгоритм, який дає 0.1% відмов при розпізнаванні людини по базі найчастіше дає 20-30% в реальних умовах. І це не проблема базового алгоритму, найчастіше це проблема використовуваної техніки або умов в яких вона використовується.
Ці 20-30% користувачів пробують повторити розпізнавання у другій, третій, четвертий раз. Статистика FAR зростає.

Помилки
А є люди, які взагалі не працюють. Наприклад, за відбитками пальців. Нам розповідали, що на хімзаводі 20% персоналу не мало відбитків, які міг би захопити сканер. Є люди з захворюванням очей/рук/голосу/особи, які НІКОЛИ не розпізнаються. В принципі.
Для кожного алгоритму є певний відсоток таких людей. Виробники часто його замовчують або самі не знають, якщо не мали великого досвіду впровадження.

Люди
Люди не люблять користуватися чимось новим. Особливо якщо вона їх контролює. Не хочуть вчитися. Я бачив людей, які принципово не могли відсканувати свою руку. Завжди прикладали з помилкою і не слухали порад. Бачив людей які панічно боялися сканування очі (це навіть якась поширена фобія). А вже скільки людей намагаються поламати ненависні їм сканери по обліку робочого часу, завісивши ганчіркою/замазавши або забруднивши камеру.
Так, встановивши сканер компанії можуть забутий таку тривіальну річ, як періодично протирати його ганчірочкою. Статистика падає.

Системи

Але, давайте відвернемося і поговоримо конкретно про існуючі системи. Що відбулося в останні роки і куди йде прогрес. Все-таки вчора Ощадбанк заявляв про принципово нових рішеннях.
Пара загальних слів. Прогрес не стоїть на місці, але експоненціального зростання немає. Наприклад новомодний Deep Learning, який останнім часом все рве і метає, зачепив лише кілька областей біометрії. Зате відбувається шалений прогрес в електроніці. Обчислювальна потужність з'являється в кожній платі. Raspberry Pi, Jetson, і. т. д.
Велика частина написаного нами 5 років тому і раніше актуальна. Основні зміни я спробую відобразити.

Серйозна біометрія
Серйозна біометрія — це така біометрія, яку можна застосовувати де завгодно, незалежно від контексту. Вона має найкращі характеристики. Найчастіше її можна ставити в режим ідентифікації по базі (коли ми маємо справу з невеликою компанією).

Очі
Моя улюблена тема — розпізнавання по райдужці ока. статистично це сама потужна і швидка технологія. У неї завжди було два великих мінуса. Ціна апаратури і зручність використання. Зараз йде планомірний розвиток саме в цих напрямках. Є істотні обмеження накладаються оптикою, яка більш-менш дійшла до своєї межі. Швидше за все в найближчі роки відбудеться деяке просування технології за рахунок нової бази по електроніці. Поки що використовується досить рідко.

Пальці
П'ять років тому мені здавалося, що розпізнавання за папиллярному узору досягла всього, чого тільки могло. Як я помилявся. За останні роки було висунуто багато принципово нових ідей:
• Розпізнавання 3d образом пальця. Є кілька конкуруючих алгоритмів, але зміг знайти тільки посилання. Різниця — у використовуваному 3д сканері

• Розпізнавання по судинах видним в ІК. Знову ж таки, як я бачив на виставках, зараз є кілька конкуруючих ідей

• Принципово інша математика, не зав'язана на стандартні дактилоскопічні ознаки. Застосування адекватних моделей пальця і кореляційних алгоритмів.
Якщо чесно, то я навіть не знаю характеристик більшої частини всіх цих нових систем. Вони краще, ніж звичайна біометрія по пальцях. Кажуть, що сильно менше відсоток непрацюючих людей. Точно більш висока ціна, ніж у стандартних сканерів пальців.
Поки що немає баз на яких можна було б незалежно випробувати і підтвердити відсотки. Кожен виробник створює свій специфічний сканер — це його новизна та унікальність.

Пальці — найбільш часто використовувана технологія, але рідко хто використовує новомодні поліпшення. Зазвичай використовується сама слабка версія.

Вени рук
Дуже хороша характеристика. Програє по точностям райдужці ока, але перевершує по зручності. Люди куди простіше навчаються, більш стабільна до зовнішніх умов. Дешевше, ніж райдужка очі.

За останні роки дещо подешевшала апаратна база, але в цілому — технологія зараз досить стабільна.

3д особа
Алгоритм по 3д особі безпосередньо прив'язані до існуючих 3д сканерів та їх ціною. Цим обумовлено їх розвиток. Сама по собі непогана характеристика, порівнянна з венами рук. Але значно зручніше і чим вени і чим райдужка. Досить просто подивитися на сканер і вас пропустило.
Так як 3д сканерів зараз існує десяток, то на кожен з них може бути своя система. Точність системи зазвичай обумовлена якістю сканера. Наприклад, можна розпізнавати обличчя і через RealScense, але високої точності не буде.
Для більшості систем, що цей напрямок — один з найбільш дорогих за ціною сканера. Багато фірм не озвучують цінник.

Біометрія для спеціальних цілей
Вся біометрія яку я зазначив вище була ще 5 років тому. Нехай трохи в іншому форматі. Але два напрямки зазнали за ці роки принципове розвиток. Вони не стали «серйозними методами», але вони стали працездатними. Це верифікація по голосу і по 2д особі. Років п'ять тому їх було практично неможливо використовувати. Зараз вони досить непогано закріпилися в задачах верифікації (підтвердження особи) і в завданнях проріджування бази. І там і там метод повинен використовуватися в якості «підказки» для оператора. Наприклад:
• В колл-центрах для підтвердження особи мовця (голос)
• В магазинах для того щоб продавець відразу бачив що купив покупець в минулі рази + звертатися по імені-по батькові (особа)
• Find Face (особа)
• Банки перед видачею кредиту (обличчя, голос)
Дані методи не дають однозначний результат, але можуть бути привабливі для бізнесу. Саме тут застосуємо гучний Deep Learning і тут йде основний прогрес.
Передбачити, що станеться з цими методами в найближчі роки неможливо.

Біометрія Just for lulz
Я не знаю як по іншому назвати цю біометрію. Звичайно, вона дає якусь ймовірність правильно розпізнати людину і відкинути зловмисника. Напевно шафка у гардеробі можна замкнути. Або телефон запаролити, якщо там немає нічого важливого. Але на більше я б не розраховував.
• Біометрія електрокардіограмі
• Біометрія за почерком
• Біометрія за ходою
Десь раз в пару місяців на Хабре обов'язково буває стаття про щось чергове з цієї серії. Ідентифікація по тому, як людина тримає телефон. Або з того, як стукає по клавіатурі. Це дуже погані методи, які при бажанні завжди можна обійти, які генерує більше проблем, ніж рішень.

Померлі методи
Ще є пара методів, про які давно нічого не чути. Незручність використання, складність обладнання, погана точність:
• Біометрія по сітківці ока
• Біометрія з геометрії рук

Що не так з проектом Ощадбанку.

Теоретично всю країну можна загнати в біометричну базу і розпізнавати по ній. Напевно навіть правильно зібраний сканер райдужки, який працює за двома очам і 3D особі — впорається із завданням. Але ціна такого сканера буде висока. Плюс — його немає на ринку, треба розробляти з нуля.
Проблеми будуть ті ж — ми отримаємо 5-10% користувачів хто не зможе ним користуватися. У масштабах країни це дуже багато.
Під проектом може не ховатися нічого нового. Можливо мається на увазі телефонний банкінг + видача кредитів. Там біометрія давно використовується в інших банках.
В темі біометрії я періодично кручусь з 2008 року. В основному як розробник, іноді як консультант. І ще в 2009 багато банків цікавилися цією технологією. Вбудовували біометрію в тестові банкомати, наприклад. Але нічого тоді не пішла. Принципово нових технологій з тих пір немає (за винятком Deep Learning осіб і голоси, які вже використовуються банками). Мене дивує знову оживає інтерес до теми.
Так само мені незрозуміло як реалізувати «відмова від карток» при розплату в магазинах. Зараз ціни хороших і надійних біометричних сканерів починаються десь від 600 доларів. Скоріше це в районі 1000, особливо з урахуванням інтеграції. І ціна багато в чому виправдана чисто на рівні заліза. Гаразд, припустимо, що при мільйонних тиражах можна досягти 400. У порівнянні з мобільними терміналами — це суттєва ціна.
Якщо ж робити свій сканер очі+обличчя — це кілька тисяч доларів.
Якщо ж працювати в режимі «верифікація» з дешевими сканерами пальців — картка потрібна раніше.
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.