Алгоритм виявлення курця по кардіограмі: Проміжні підсумки дослідного конкурсу



На Geektimes вже писали про проект мобільного кардіографа CardioQVARK, а на Хабре — про проведеному його командою дослідному конкурсі для розробників і математиків. Коротко, суть його полягає в розробці алгоритму розпізнавання курця за його кардіограмі.

Конкурс стартував наприкінці грудня і привернув увагу великої кількості фахівців у галузі математики, алгоритмів і машинного навчання. Сьогодні ми розповімо про його попередні результати.

Навіщо все це потрібно

Існують дослідження фахівців з машинного навчання, які показують, що ЕКГ-сигнал несе в собі інформацію про функціонування всіх систем організму, а не тільки серця. При цьому кожне захворювання по-своєму «модулює» ЕКГ-сигнал, а значить знаки прирощень інтервалів і послідовних амплітуд кардіоциклу можна використовувати для діагностики інформації про можливі проблеми зі здоров'ям у людини, в тому числі на ранніх етапах їх виникнення.



В доповіді на V Міжнародній конференції «математична біологія та біоінформатика» Костянтин Воронцов з Обчислювального центру ім. А. А. Дородніцина РАН продемонстрував відмінності в знаках збільшення інтервалів (dRn), амплітуд (dTn) і кутів (dαn) кардіоциклу у здорових і страждаючих різними захворюваннями людей.

Пошук курця по кардіограмі допоможе добитися головної мети змагання — отримання результату, який би продемонстрував можливість або неможливість здійснення якісної діагностики за допомогою ЕКГ і алгоритмів виявлення в сигналі кардіограми маркерів захворювань різних органів.

Це по-справжньому цікава і важлива задача, вирішення якої допоможе прискорити подальші дослідження, коли з'явиться велика база даних кардіограм, знятих за допомогою мобільного кардіографа.

Загальна статистика

В ході першого етапу конкурсу його учасниками стали 148 команд і індивідуальних конкурсантів, які відправили 1738 рішень. У підсумковий рейтинг потрапили 72 учасника. Тепер перший етап змагання завершено, і до 15 березня організатори приймають роботи 10 кращих конкурсантів.

Під спойлерами нижче представлений список університетів, наукових інститутів РАН, компаній та організацій, чиї співробітники сформували команди для участі в змаганні (у дужках вказується кількість членів команди, якщо цифри немає — це означає, що брав участь один чоловік):

Університети:

  • МДУ їм. М. в. Ломоносова: Мех-мат, ВМК, Фізичний факультет (28)
  • МФТІ (20)
  • Спбду
  • МАМІ
  • МГТУ імені Н.Е. Баумана (3)
  • НДУ ВШЕ (6)
  • Казанський ГМУ
  • ПензГТУ (3)
  • ВятГУ(2)
  • ВлГУ
  • УГНТУ
  • САФУ їм. М. в. Ломоносова
  • УГАТУ (2)
  • LUT, Фінляндія
  • бєлгородський державний технологічний університет ім. В. Р. Шухова
  • Пріокскій державний університет
  • Білоруський державний університет (2)
  • SMMS (NY) (2), США
  • УрФУ
  • НДУ МЕІ
  • НДУ МИЭТ
  • ТДТУ
  • КНУ ім. Т. Шевченка
  • Грду їм. Янки Купали
  • ПДТУ
  • РГРТУ
  • ННДУ ім.Лобачевського
Інститути РАН:

  • ІСА РАН
  • ВЦ РАН ім. А. А. Дородніцина (4)
  • ИБХ РАН
  • ИММ УрО РАН ім. Н.Н.Красовського
  • ІАП РАН
  • ІПУ РАН ім. В. А. Трапезникова
  • СПИИРАН
  • ЇМ ІЗ РАН (2)
  • ІППІ РАН (3)
Компанії та організації:

  • Яндекс (1) і Яндекс ШАД (2)
  • Searchmetrics
  • COMODO
  • BBOXX Ltd
  • Cinimex
  • Softsystem
  • Rambler&Co
  • Ident
  • NetCracker Technology Corp
  • ЦГЭ
  • ВЕБРОБОТИКС
  • МЕТКОМБАНК
  • Baker Hughes
  • Luxoft
  • Сфіт Лайф Фудсервіс
  • Кіровський науково-дослідний інститут гематології та переливання крові
А ось як виглядає десятка лідерів, яким вдалося створити алгоритми, які показали найкращі показники чутливості і специфічності:

1. Бєлавін Владислав Сергійович (belavin). МФТІ. Перше рішення: Se = 54,69%, Sp = 45,70%, Sum = 100,39%. Краще рішення: Se = 60,94%, Sp = 78,57%, Sum = 139,51%.

2. Дияконів Олександр Геннадійович (djakonov). МДУ їм. М. в. Ломоносова, ВЦ РАН ім. А. А. Дородніцина. Перше рішення: Se = 39,06%, Sp = 46,24%, Sum = 85,30%. Краще рішення: Se = 73,44%, Sp = 67,74%, Sum = 141,18%.

3. Ісаков Роман Володимирович (IRV). ВлГУ. Перше рішення: Se = 57,81%, Sp = 53,76%, Sum = 111,57%. Краще рішення: Se = 62,50%, Sp = 70,97%, Sum = 133,47%.

4. Брюханов Ілля Олександрович (ibryukhanov). МДУ їм. М. В. Ломоносова. Перше рішення: Se = 54,69%, Sp = 59,14%, Sum = 113,83%. Краще рішення: Se = 50,00%, Sp = 81,18%, Sum = 131,18%.

5. Докукін Олександр Олександрович, Сенько Олег Валентинович, Чучупал Володимир Якович (alex_dok). ВЦ РАН ім. А. А. Дородніцина. Перше рішення: Se = 28,13%, Sp = 56,99%, Sum = 85,12%. Краще рішення: Se = 59,38%, Sp = 66,67%, Sum = 126,04%.

6. Цацорин Євген Анатолійович (eugtsa). Перше рішення: Se = 50,00%, Sp = 50,00%, Sum = 100,00%. Краще рішення: Se = 60,94%, Sp = 63,98%, Sum = 124,92%.

7. Тихонов Олексій Іванович (potom20). Перше рішення: Se = 64,06%, Sp = 31,72%, Sum = 95,78%. Краще рішення: Se = 57,81%, Sp = 65,05%, Sum = 122,86%.

8. Дубнов Ігор Андрійович (dubnov). МФТІ. Перше рішення: Se = 89,06%, Sp = 14,52%, Sum = 103,58%. Краще рішення: Se = 40,63%, Sp = 75,27%, Sum = 115,89%.

9. Семенов Олександр Сергійович (AlexSemenov). МФТІ. Перше рішення: Se = 70,31%, Sp = 29,03%, Sum = 99,34%. Краще рішення: Se = 39,06%, Sp = 75,81%, Sum = 114,87%.

10. Татараидзе Олександр Бидзинович (leksotat). МГТУ імені Н.Е. Баумана. Перше рішення: Se = 79,69%, Sp = 12,37%, Sum = 92,06%. Краще рішення: Se = 42,19%, Sp = 72,58%, Sum = 114,77%.

Переможці змагання отримають винагороду: 300 тис. рублів за перше місце, 150 тис. за друге, і 100 тис. — за третє.

Вибірка конкурсу не так велика, як хотілося б. Навчальна вибірка містить 100 унікальних маркованих спостережень 50 курців і 50 некурящих людей, а контрольна — 250. Проте навіть цих даних має бути достатньо для отримання відповіді на головне питання про можливість виявлення за допомогою ЕКГ ознак різних захворювань.

І кращі результати представлених конкурсних алгоритмів дозволяють сподіватися на те, що він буде позитивним.

Рейтинг учасників доступний з посилання. Слідкуйте за ходом змагання!

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.