Як камерою смартфона зробити фотографії, придатні для OCR, або дещо про ABBYY Mobile Imaging SDK

Кількість програм — мобільних клієнтів, прив'язаних до різних систем автоматизації діяльності підприємств, постійно зростає. Згідно дослідження компанії IDC, до 2016 року воно збільшиться в 4 рази (у порівнянні з 2014 роком). Звичайно, ABBYY не могла залишитися в стороні від цих тенденцій, і у нас є мобільні продукти, орієнтовані на корпоративних користувачів. Про один з них – ABBYY Mobile Imaging SDK (MI SDK) – ми ще жодного разу не розповідали в блозі, виправляємося.

Наші користувачі звикли, що мобільні продукти ABBYY – це або про словники, або про розпізнавання. Відразу обмовимося – в ABBYY Mobile Imaging SDK немає ні того, ні іншого. Питається, чому нам знадобилося випускати таку програму? Відповідь – звичайно, щоб продати OCR ще більшому числу клієнтів :). Адже ABBYY Mobile Imaging SDK зазвичай використовується в зв'язці з нашими «корпоративними» рішеннями для розпізнавання даних (наприклад, ABBYY Recognition Server або отримання даних (наприклад, ABBYY FlexiCapture). Цей невеликий продукт покликаний допомогти нашим «великим» рішенням працювати краще, точніше розпізнавати.

Життя змінилося, і якщо раніше основним пристроєм, з якого ми отримували зображення для розпізнавання, був сканер, то тепер його все частіше замінює мобільний телефон. Чим він відрізняється від сканера? Звичайно, тим, що отримати з нього зображення гарної якості набагато складніше (зрозуміло, в даному випадку хороша якість = достатня для того, щоб наші OCR-технології могли розпізнати текст на фото).

ABBYY Mobile Imaging SDK дозволяє додаткам, в які він вбудований, перевіряти якість зображення прямо на смартфоні, і просити користувача сфотографувати документ ще раз, якщо якість зображення погане. Що означає «погане» для оптичного розпізнавання?

1. На зображенні можуть бути яскраві плями від спалаху:



2. Зображення може бути темним, не контрастним:



3. Зображення може бути розмитим:



MI SDK також може бути використаний для стиснення якісних зображень, щоб їх можна було швидше передати на сервер з телефону. При цьому продукт не просто стискає зображення, але і обрізає фотографію так, щоб на ній залишився тільки сам документ.

image

Тепер – трохи про проекти, в яких використовується цей продукт.

Проект в компанії з «великої четвірки» аудиторів
Одна з аудиторської компаній «великої четвірки» зіткнулася зі специфічною проблемою на російському ринку: законодавство нашої країни зобов'язує аудиторів зберігати копії всіх документів, на основі яких складається аудиторський звіт. Робити копії паперових документів в офісі клієнта не так складно, але в більшості випадків документів дуже багато, возити туди-сюди їх незручно, та й потім все одно доведеться сканувати – мати електронний архів з можливістю пошуку зручніше, ніж два ангари з макулатурою. Виходить, краще відразу робити електронні копії, і тут можливі варіанти:

1) Відсканувати документи на сканері клієнта і відправити їх в офіс. Копії при цьому виходять хорошої якості, але потрібно знайти сканер, підключити його до свого ноутбука і займати цей сканер досить довго, що може бути незручно клієнту.
2) Привозити в офіс клієнта власний сканер. Навряд чи комусь прийде в голову возити з собою МФУ, тим більше що в потоковому режимі відсканувати документи все одно не вийде – багато з них зшиті, тому треба сканувати кожну сторінку окремо. Залишаються планшетні сканери, але навіть оснащувати ними кожного аудитора – досить дорого.

Самим дешевим та зручним виявляється третій варіант:

3) Сфотографувати документи на смартфон і надіслати в офіс за допомогою мобільного додатку. Мобільний інтернет є практично скрізь, фотографувати камерою смартфона швидко і зручно. Залишалося вирішити проблему якості знімків – щоб воно було достатнім для подальшого розпізнавання. Для цього використовується Mobile Imaging SDK.

Рішення:

1. На смартфони співробітників аудиторської компанії встановлено програму-клієнт, пов'язане з програмою обробки документів, яка розгорнута на сервері компанії. Перебуваючи в офісі у клієнта, співробітники фотографують документи.

2. Додаток використовує функціональність ABBYY Mobile Imaging SDK для:

A. Стиснення зображень
B. Перевірки якості зображень

3. Зображення відправляються на сервер, де вони конвертуються у формат PDF/A з текстовим шаром для подальшого пошуку, індексування та вилучення даних. В даному випадку використовується ABBYY Recognition Server, але для цих цілей також підходить ABBYY FineReader Engine.

4. Конвертовані файли відправляються в існуюче файлове сховище компанії.



Проект для Одного Великого Банку (тм)

У банку є менеджери, які їздять на зустрічі з представниками малого бізнесу і пропонують послуги банку (ведення рахунку, кредитні продукти тощо). Робота цих менеджерів з клієнтами організована наступним чином: вони приїжджають в офіс компанії, якщо компанія проявляє зацікавленість в продуктах банку, менеджери роблять копії документів, що потрібні для заявки (наприклад, на відкриття рахунку), потім везуть ці копії в офіс банку. Там їх сканують, завантажують у систему, витягають дані за допомогою ABBYY FlexiCapture, дані передаються співробітникам, відповідальним за прийняття рішень. Якщо рішення позитивне, менеджер роздруковує договір і знову їде до клієнта. Весь процес займає кілька днів, за цей час клієнт може запросто перейти до конкурента, тому банк зацікавлений в тому, щоб прискорювати обслуговування.

Цілі проекту:

1. Скоротити час, який йде на відкриття рахунку, з 2-3 днів до 40 хвилин.
2. Підвищити ефективність роботи менеджерів, які безпосередньо контактують з клієнтами.

Рішення, розроблене для банку:

Було створено програму-клієнт, яке встановлюється на смартфони співробітників банку і пов'язане з програмою обробки документів, розгорнутої на сервері в банку – ABBYY FlexiCapture. У програмі на смартфоні менеджер може вибрати тип юридичної особи, для якої подається заявка, програма видає список документів, необхідних для перевірки клієнта і оформлення договору. Після цього можна вибрати вид документа і відразу ж зробити фотографію цього документа.

Програма перевіряє комплектність пакета документів (всі запропоновані види документів сфотографовані), а також (за допомогою ABBYY Mobile Imaging SDK) визначає, чи достатньо якість фотографії для подальшого вилучення даних. Після цього документи відразу відправляються на сервер банку, де проходять цілий ряд перевірок (комплектність пакета – ще раз, відповідність фотографій типами документів та ін). Якщо допущені помилки, менеджеру повертається звіт про помилку.

Якщо все в порядку, з документів отримано дані, які потім дуже швидко верифікуються операторами і надходять до співробітникам, відповідальним за прийняття рішень. Весь цей процес відбувається дуже швидко – за час, поки менеджер розмовляє з потенційним клієнтом. Якщо банком прийнято позитивне рішення, програма-клієнт вміє повертати менеджеру договір підперті реквізитами клієнта. Таким чином не тільки може бути прискорене саме обслуговування, але значно зменшується час і зусилля, яке менеджер витрачає на одного клієнта.

image

Ось, власне, і все. В описаних проектах ABBYY Mobile Imaging SDK працює на платформах iOS і Android. Якщо у вас є питання – задавайте.

Алсу Иовкова,
департамент продуктів для розробників


Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.