Видеоаналитика 2.0 або при чому тут залишені предмети. Частина 1

image

Які думки у вас виникають, коли ви чуєте поняття «Видеоаналитика 2.0»?
Рішення будь-яких актуальних завдань можна було б доручити гіпотетичним технологій відеоаналізу наступного покоління?

Серед популярних відповідей напевно зустрінуться «некооперативное розпізнавання особистості людини серед натовпу йде з імовірністю, близькою до 100%», «виявлення зловмисників серед відвідувачів», «межкамерное одночасне супровід безлічі об'єктів без зриву трекінгу», «розпізнавання та класифікація без помилок все, що видно в кадрі».

Інженер, пов'язаний з інсталяціями систем безпеки побажає максимальної автоматизації налаштування детекторів за рахунок просунутих алгоритмів самонавчання, що дозволить істотно знизити витрати на пуско-наладку, гарантійне обслуговування.

А найрозумніший хтось скаже, що видеоаналитика 2.0 можлива тільки при наявності штучного інтелекту, що на поточному рівні розвитку технологій неможливо. Тому нам нічого не залишається, крім як спостерігати за лідерами ринку аналітики, які і так вичавлюють максимально можливе з наявних обчислювальних ресурсів і чекати масового впровадження квантових комп'ютерів. Сподіваючись, що воно все ж таки відбудеться.



image
Хоча відповіді на поставлене питання будуть різними, одне загальне поняття (часто воно навіть не озвучується, а просто мається на увазі) зустрінеться в кожному з них – видеоаналитика наступного покоління зобов'язана ефективно працювати в реальних умовах застосування – на вулицях, вокзалах, метро, в побуті.

Який би це був детектор: залишених предметів, бійок, вандалізму, розпізнавання осіб – він обов'язково повинен працювати в реальних, а не лабораторних умовах і при цьому повністю задовольняти (а краще перевершувати) очікування споживачів.

Пов'язано це в тому числі і з тим, що вже близько 5 — 6 років ринок відеоспостереження знаходиться в очікуванні якісного прориву в області ситуаційної відеоаналітікі. (Ситуаційна видеоаналитика — видеоаналитика виявлення заданих, детермінованих ситуацій.)

Після буму відеоаналітікі 2009-2010 роки, про який згадується у статті "Погані хлопці ринку відеоаналітікі", ситуаційна видеоаналитика була серйозним чином дискредитована, споживачі розчарувалися в її можливостях з-за невідповідності рекламних обіцянок реальним результатам в «польових» умовах застосування.
Як би дивно це не звучало, але й сьогодні, в 2016 році, положення ситуаційної відеоаналітікі лише трохи краще, ніж в 2010.

image
І, якщо з детекторами, призначеними для «тихих» сцен без руху ще більш-менш нормально, то з детекторами, яким необхідно працювати в умовах інтенсивних пасажиропотоків або великої активності в кадрі – ситуація залишає бажати кращого.

Навіть лідерам галузі інтелектуального відеоспостереження не вдається вийти на якісно інший рівень ефективності ситуаційних детекторів і забезпечити їх працездатність, що задовольняє очікування споживачів у звичайних, а не лабораторних умовах.
Найбільш наочно і досить точно становище в галузі показують можливості детекторів залишених предметів, пропонованих сьогодні майже усіма гравцями ринку.

Чому?

По-перше, в архітектурі детектора, в залежності від підходу, можуть застосовуватися майже всі базові технології, що використовуються в видеоанализе: сегментація фону, робота з багатовимірним гауссовим розподілом та іншими статистичними інструментами, розпізнавання образів (HOG-ом або згортковими нейромережами), трекінг та мультитрекинг.

По-друге, завдання детектування залишеного предмета добре формалізована, що дозволяє об'єктивно оцінювати ефективність детектора того чи іншого виробника.

Подивимося, які рішення пропонують зарекомендували себе компанії, у яких є видеоаналитические детектори власної розробки.

Рішення російських компаній

  1. Macroscop пропонує модуль до свого ПО вартістю 1500 р. Модуль, як того і слід очікувати, має налаштуванням часу, після якого об'єкт вважається залишеним, а так само цілим рядом умов на перекриття об'єкта іншими об'єктами переднього плану, а так само на якість відео (роздільна здатність не менше 640x480, частота кадрів не менше 5 кадрів/с). Докладно про них розповідає директор Macroscop розробок Петро Харебов в наступному відео (про детекторі — з 12:26):



    На жаль, можливості модуля невеликі:



    На цьому (офіційному, зауважимо, розміщеному і в блозі на Хабре) відео, об'єкт, сильно виділяється контрастом від фону (червоний пластиковий стаканчик), чомусь виявляється системою як два незалежних об'єкта, а з двох об'єктів від фону відрізняються слабкіше (трубки від стаціонарних телефонів), в один момент часу виявляється лише один; більш того, розміри об'єктів, ні їх стан не збігаються з областями виявлення.

    Окремо варто звернути увагу на такий параметр, як розмір виявленої предмета. Заявлені Макроскопом 3% звучать, на перший погляд, непогано, але на ділі 3% від кадру — це дуже багато:
    image

    Уявіть собі валізу такого розміру.

    Прихований текстВони, звичайно, різні бувають,
    image
    але все ж.


    Фактично це означає, що виявлення предметів цим детектором можливо тільки в безпосередній близькості від об'єктива камери.
    Як наслідок, якщо таким чином вирішувати завдання ефективного виявлення предметів на пероні — потрібно встановлювати відеокамери через кожні 5-7 метрів, що зробить вартість рішення захмарним і не врятує навіть дешевизна детектора.

    Але, що стосується відеоаналітікі, до Макроскопу тут претензій бути не може, так як видеоаналитика — це все ж не їх основна спеціалізація.

    Насамперед, вони творці прекрасного масштабується для відеоспостереження, однією з ключових особливостей якого є акуратне ставлення до ресурсоємності процесу відображення і збереження відеопотоків, що дозволяє будувати масштабовані системи, не переплачуючи за апаратні ресурси.

    Тому подивимося, що пропонують компанії, що спеціалізуються, в першу чергу, на розробці алгоритмів інтелектуального аналізу відео.

  2. Синезис, одна з найбільш шанованих компаній в даній області на російському ринку. На Хабре багато публікацій Синезиса, з яких видно, що колектив активно займається завданнями ситуаційної відеоаналітікі: пропонує широкий спектр класичних детекторів, експериментує з поведінковим аналізом, вирішує інженерні задачі в області комп'ютерного зору.
    На відміну від Макроскопа, Синезис наводить приклади роботи детектора предметів вже в умовах метро.



    Але, якщо об'єктивно — це не реальні умови метро: в місцях тестування детектора безлюдно, ніхто не перекриває предмет і сам предмет контрастний, статистично сильно відрізняється від фону.
    Звичайно ж ситуація в метро виглядає приблизно так:

    image

    А іноді трапляється й таке:

    image

    Різниця з демонстрованим Синезисом відеороликом катастрофічна.

    Візуалізація статистики дає ще більш наочне уявлення про різницю:

    image

    Зліва — статистичне відмінність предмета від фону у відеоролику Синезиса, праворуч — відхилення від фону, що виявляється детектором залишених предметів «Видеоинтеллект» в реальній ситуації.

  3. Вокорд.

    Досвідчена компанія, 17 років на ринку. За інформацією з їх сайту, у штаті працюють 120 фахівців, 80% з яких «математики, програмісти, інженери»
    Судячи з серйозних людських та інтелектуальних ресурсів, рівень відеоаналітікі також повинен бути серйозний.

    У складі продукту Vocord Tahion пропонується модуль «залишених/віднесених предметів». На youtube-каналі компанії є приклад роботи модуля:



    На жаль, знову та сама гнітюча, дуже проста для детектування і не має ніякого відношення до реальності ситуація: рівний світлий підлогу, контрастна чорна сумка і безлюдність.
    Хоча, треба віддати належне, Вокорд, на відміну від Синезиса, імітував часткове перекриття об'єкта людиною. Але наскільки така постановка експерименту відрізняється від реальності і яка корисність такого детектора в реальних умовах — можна навіть не говорити.

    Складається враження, що великі гравці, не маючи можливості створити реально працюючий алгоритм, змушені робити частину детекторів чисто для галочки, просто щоб їх продукт за формальною ознакою відповідав вимогам будь-якого тендеру.


Закордонні рішення

Хто-небудь скаже: «А чому ви тільки вітчизняних виробників розглядаєте, закордонні, швидше за все, пропонують продукти більш високого класу».

Але, як не дивно, якість детекторів залишених предметів зарубіжних виробників знаходиться рівно на тому ж рівні. Тільки просять вони за них вже зовсім інші гроші.

Наприклад, детектор розробки ізраїльської компанії Agent Vi, який вважається одним з кращих на ринку, в рекламному відео демонструє наступні можливості:



Знову контрастний об'єкт і нікого кругом.
Вартість цього детектора — більше 45 000 руб за 1 канал відео.

Або ось детектор італійської Technoaware, вартістю близько 30 000 руб за канал:



Можливості детектора знову практично ідентичні всім перерахованим вище.

Чому так і що ж робити?

На цьому місці допитливий розум припустить логічне: якщо навіть лідери галузі, зі штатом у сотні чоловік до цих пір не запропонували ринку мало-мальськи працює в реальних умовах детектор залишених предметів, то може бути це пов'язано з якимись об'єктивними причинами? Як-то:

  1. Детектор залишених предметів нікому не потрібен, тому ніхто не вкладає коштів у його розробку.
  2. Якісний детектор залишених предметів неможливий на поточному рівні розвитку науки і техніки. Лідери ринку відеоспостереження і так вичавлюють все можливе з технологій.


Що стосується першого припущення немає, функція виявлення залишеного предмета актуальна і затребувана.

По-перше, у технічних завданнях на системи інтелектуального відеоспостереження для метро або вокзалів детектори залишених предметів часто прописані явним чином. Гроші там зазвичай чималі, і за них йде серйозна боротьба серед великих інтеграторів.
Але розробники, тим не менше, чомусь не можуть запропонувати працює в реальних умовах варіант навіть за гроші.

По-друге, і на споживчому ринку відеоспостереження нормально працює детектор також затребуваний.

Як підтвердження можна згадати масштабний конкурс на розробку алгоритмів відеоаналізу, який в кінці 2012 року проводила відома хабравчанам компанія Ivideon, творець найуспішнішого у світі сервісу хмарного відеоспостереження. У конкурсі були тільки три завдання, і однієї з них якраз і був детектор залишених предметів.

Про конкурс Ivideon— детектор появи і зникнення предмета/об'єкта в кадрі. Дуже хочеться навести мишкою на брудну чашку на столі і знайти момент у відеоархіві, коли вона там з'явилася і хто її залишив!

Актуальність детектора для Ivideon, як провайдера сервісу хмарного відеоспостереження, зрозуміла: добре працює детектор залишених предметів дозволить запропонувати клієнтам цікаву функціональність, за допомогою якої можна стежити за автомобілем або паркувальним місцем у дворі, за коляскою або велосипедом у під'їзді та ін

Але це можливо лише за умови, що детектор забезпечить близьку до 100% ймовірність детектування ситуацій і, при цьому, не буде «спамити» користувача помилковими спрацьовуваннями. В іншому випадку функцію неможливо буде монетизувати, і, навіть якщо пропонувати її безкоштовно, як піар-фічу, то велика ймовірність, що вона тільки зашкодить репутації, дискредитувавши якість сервісу в очах споживачів.

Якщо взяти до уваги, що через 3 повних роки з моменту проведення конкурсу, Ivideon так і не запропонував ніяких нових функцій відеоаналітікі, можна зробити висновок, що успіх у створенні якісного детектора залишених предметів досягнутий не був.

Тому, можливо, що вірно припущення №2, і виявлення залишених предметів в умовах метро або вокзалів — це принципово нерозв'язна зараз завдання. До речі, деякі авторитетні і заслужені в области відеоаналітікі і відеоспостереження компанії, прямо про це і говорять.

Думка лідерів галузіКомпанія Спецлаб — піонер галузі відеоаналітікі і творець, за їх власними словами, самого терміна «видеоаналитика», має таку думку, часто висловлювана в досить категоричній формі. Цитата:

“Детектор залишених предметів придумали ми десять років тому, і він ніде ніколи не працював за всі десять років тому, ні в одній компанії, ні на одному об'єкті. Давайте залишимо казку, казку про детектор залишених предметів".
(На відео цей момент з 15:47)


Або, компанія ITV, яка входить в десятку найбільших гравців галузі і є лідером російського ринку систем відеоспостереження, також говорить, що є об'єкти, де видеоаналитика не може ефективно працювати, і що вона взагалі призначена тільки для роботи із стерильними зонами (з 11:22):


Але чи насправді це так? Досвід показує, що ні.

Думка ж великих гравців ринку більше пов'язано з дещо іншими, різними для різних компаній, причинами: від простої конкурентної боротьби, до неприйняття реальності — раз вже ми не змогли цього зробити за 20 років роботи, то значить це в принципі неможливо.

Вищевикладене підводить нас до думки про те, що майбутнє відеоаналітікі саме за новими творчими колективами. Тими, які не озираючись на сформовані стереотипи, будуть прагнути шукати нові підходи до вирішення завдань відеоаналізу.

До речі, саме на це вказує кількість публікацій на Хабре про нові розробки в області відеоаналітікі, нейронних мереж і глибокого навчання. Переважна більшість з них написано молодими колективами та окремими авторами. Наочно видно, що саме вони шукають нові технологічні підходи і рішення.

На підтвердження цього у наступній статті ми розповімо, якого результату можна досягти в задачі виявлення залишених предметів в реальних умовах інтенсивних пасажиропотоків Пітерського метро і що спільного між ядерною фізикою, кварк-глюонної плазмою і видеоаналитикой.

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.