Ще 12 big data кейсів

Хабр, привіт. Сьогодні ми підготували ще 12 прикладів того, як технології великих даних приносять компаніям гроші.

Орієнтація на клієнта

1. Компанія: Білайн.

Галузь: телеком.

Білайн володіє величезним набором даних про своїх абонентів, які компанія планує використовувати не тільки для внутрішньої оптимізації і роботи з клієнтами (підвищення продажів, утримання клієнтів, протидія шахрайству), але і для виведення нових аналітичних продуктів на ринок (надання даних для кредитного скорингу, таргетованої цифрової реклами, створення геоаналитических звітів, IPTV аналітика, зовнішній консалтинг). Компанія реалізувала безліч big data проектів. Наприклад, було здійснено сегментування бази абонентів на основі розширеного клієнтського профілю, в тому числі з передбаченням статі і вікової категорії, побудовою соціальних графів; реалізовано проект з розпізнавання та захисту абонентів від грошових махінацій і вірусних активностей; були виділені абоненти, що користуються послугами зв'язку на декількох типах пристроїв, а також абоненти, що знаходяться в аеропорту і відлітають за кордон, для пропозиції їм відповідних послуг і тарифних планів. І це далеко не повний перелік. Для зберігання і обробки даних компанія використовує HDFS і Apache Spark, для аналізу даних – rapidminer і python, у тому числі бібліотеку scikit-learn.

Результат: до 2018 р. прогнозовані доходи від big data складуть понад 20% виручки компанії.

2. Компанія: Caesars Entertainment.

Галузь: розваги, гральний бізнес.

Caesars Entertainment – один з лідерів грального бізнесу США, керує відомим казино caesar's Palace в Лас Вегасі і ще понад 50 гральними закладами по всьому світу. Сама компанія нещодавно було оштрафовано більш ніж на 20 млн. $ за відмивання грошей, і її підрозділ, керуючий казино, було піддано процедурі банкрутства. Однак за 17 років компанія накопичила великий обсяг даних і аналітики за своєю програмою лояльності Total Rewards, який тепер є одним з найбільш цінних її активів і був оцінений в 1 млрд. $. В ігровій індустрії важливі дані про кожного клієнта: деякі гравці вищої, сьомої категорії за класифікацією компанії, щорічно витрачали в казино близько 500 тис. $, а один бізнесмен в базі і зовсім залишив у Лас Вегасі за рік 200 млн. $. Дуже важливо мати можливість зустріти такого клієнта по імені, проводити на улюблену гру і запропонувати безкоштовні додаткові опції за його смаку: розваги, авіаквитки, поїздки на лімузині, проживання в готелі і т. д. З допомогою накопичених даних про смаки і поведінку клієнтів і просунутих методів аналізу даних компанія могла знаходити клієнтів такий підхід, щоб вони залишили як можна більше грошей і обов'язково поверталися знову. Компанія використовує Hadoop і хмарні рішення, обробляючи більше 3 млн. записів в годину. Аналіз даних також використовується для сегментації клієнтів і підвищення стандартів безпеки.

Результат: створено найбільш цінний індивідуальний актив компанії вартістю понад 1 млрд. $, досягнуто зростання прибутковості та стандартів безпеки.

3.Компанія: eHarmony.

Галузь: сайти знайомств.

eHarmony – сайт знайомств, орієнтований на побудову довгострокових відносин. В анкеті на сайті користувач може залишити дуже докладну інформацію про себе, вказати понад 1000 параметрів. Далі, використовуючи ці дані, а також історію симпатій і розвитку відносин користувачів сайту, система рекомендує найбільш підходящі варіанти знайомств, причому не просто на основі схожості інтересів і переконань. Аналізуються фотографії користувачів, що доповнюють один одного і збігаються, але при цьому викликає особливе тяжіння між людьми характеристики. Наприклад, вдалося з'ясувати, що вегетаріанці швидше утворюють стійку пару, ніж любителі гамбургерів, і площа особи на фотографії певним чином впливає на взаємну привабливість.

Також компанія аналізує ефективність каналів маркетингових компаній, використовує персоналізовану рекламу, управляє лояльністю користувачів, протидіє відтоку клієнтів.

В аналізі даних компанія використовує рішення SPSS, рекомендаційні системи, Hadoop, Hive і хмарні технології.

Результат: Щодня система робить близько 100 мільйонів припущень про те, що дві людини можуть підходити один одному, 10 млн. $ щорічно зберігається за рахунок протидії відтоку клієнтів і за рахунок скорочення неефективних маркетингових витрат.

4. Компанія: Nippon Paint.

Галузь: хімічна промисловість, виробництво лакофарбових матеріалів.

Nippon Paint – японська компанія, що займає 7 місце по обороту в світі серед компаній з виробництва фарб, лідируюча компанія галузі на ринку Китаю. З допомогою запущеного компанією сайту iColor, який дозволяє випробувати різні кольори фарби на реальних інтер'єрах, отримав широку популярність серед як серед приватних клієнтів, так і серед дизайнерів і оформлювальних компаній. Аналіз отриманих з допомогою цього сайту даних дозволяє відслідковувати нові тренди в кольорах і дизайні, щоб розробляти нові продукти і планувати виробництво. Також, з допомогою даної платформи компанія взаємодіє з дизайнерами та оформлювальними компаніями, щоб через них просувати продукцію компанії, сегментує споживачів та створює для них спеціальні пропозиції. Для обробки і аналізу даних компанія використовує рішення на базі SAP HANA і Hadoop.



Результат: компанія отримала потужний інструмент для виявлення та відстеження ринкових трендів, що дозволяє планувати попит і розробляти нові продукти, а також платформу для вирішення ряду інших завдань цільового взаємодії з клієнтами.

5. Компанія: Hitachi Consulting, Vital Connect, ClearStory Data.

Галузь: охорона здоров'я.

У США сепсис займає 10 місце в рейтингу причин смерті серед хвороб. Щорічно сепсис виникає приблизно у 1 млн. американців, від 28% до 50% з них помирає. На лікування сепсису щорічно витрачається близько 20 млрд. $.

При цьому основна причина смертельних випадків – недостатній лікарський контроль. Пацієнти виписуються з госпіталю або отримують першу допомогу, і після цього за ними не спостерігають. Однак після цього великий ризик розвитку сепсису, симптоми якого – жар, озноб, дихання і пульс прискорені, висип, розгубленість і дезорієнтація – схожі на симптоми інших поширених захворювань. Часто пацієнти надто пізно звертаються до лікаря або захворювання не вдається правильно діагностувати на ранніх стадіях. В результаті швидко розвивається септичний шок і відбувається необоротне ураження багатьох органів.

Для контролю стану пацієнтів пропонується використовувати сертифіковане пристрій HealthPatch від компанії Vital Connect, який буде збирати основні показники стану пацієнтів, включаючи навіть пози і рухи (при сепсисі вони змінюються). Далі інформація надходить на сервери ClearStory Data, де об'єднується з іншими медичними даними про пацієнтів і аналізується в реальному часі з допомогою рішення на базі Apache Spark. У перспективі такі пристрої будуть отримувати всі пацієнти, які залишають госпіталі і отримали першу допомогу по станам, за якими може слідувати сепсис. Подібна система, але з меншим рівнем аналізу даних, вже успішно реалізована в Сінгапурі.

Результат: створено рішення, яке дозволить системі охорони здоров'я США значно знизити смертність від сепсису (загального зараження крові).

6. Компанія: JJ Food Service.

Галузь: доставка продуктів харчування b2b.

JJ Food Service – одна з найбільших британських b2b компаній з доставки продуктів харчування, що має понад 60 тис. клієнтів у формі кафе, ресторанів, шкільних та офісних їдальнях і т. п. В 2010 р. майже всі замовлення компанія брала через call-центри, сьогодні 60% замовлень приймається через Інтернет-портал. Це підвищило ефективність роботи, проте призвело до втрати персонального контакту з клієнтом. По телефону клієнту пропонували придбати більш дорогі або доповнюючі товари і послуги, повідомляли йому про тенденції в його сегменті ринку. Ці можливості потрібно було реалізувати на новому рівні з допомогою технологій великих даних. Для вирішення цих завдань компанія звернулася до фахівців Microsoft, щоб побудувати рішення на базі хмарних сервісів Azure Machine Learning. Рекомендації, що формуються побудованими на цій платформі предиктивными моделями, тепер використовуються не тільки на Інтернет-порталі, але і співробітники колл-центру. Коли клієнт дзвонить в колл-центр або заходить на сайт, його корзина вже заповнена на підставі історії покупок і рекомендацій (враховуються рецепти, подібні замовлення інших користувачів, додаються новинки, про яких клієнти ще не знають). Близько 80% цих товарів покупці дійсно залишають в кошику набувають. Таке рішення можливе в b2b індустрії, т. к. часто потрібні досить регулярні поставки певного набору продуктів. Безпосередньо перед оформленням замовлення враховується тип закладу і використовуються ним рецепти, щоб визначити, чи не забув клієнт купити щось необхідне. Впровадження системи зайняло 3 місяці.



Результат: 80% товарів в попередньо заповнених споживчих кошиках купується клієнтами, зростання продажів, швидкості обслуговування і задоволеності покупців.

Внутрішня оптимізація

1. Компанія: Ощадбанк.

Галузь: банківська.

У попередньому пості ми вже описували деякі кейси застосування великих даних в Ощадбанку, цього ми розповімо ще про одному кейсі – АС САФІ.

Ця система аналізу фотографій для ідентифікації клієнтів та запобігання шахрайства з документами була розроблена і впроваджена в Ощадбанку до початку 2014 р. В основі роботи системи лежить порівняння фотографій з бази із зображеннями, отриманими веб-камерами на стійках, з допомогою технологій комп'ютерного зору. В результаті втрати від такого виду шахрайства скоротилися в 10 разів.

Основою АС стала біометрична платформа «Каскад-Пошук» від компанії «Техносерв». Спочатку ця система була розроблена для використання в оперативній, довідкової та експертній роботі, але була адаптована для потреб Ощадбанку та інтегрована з автоматизованою системою розгляду кредитних заявок. Система працює дуже швидко: завдяки ряду інноваційних рішень, таких як In-Memory Processing, зіставлення зображень камери і зображень у базі займає всього кілька секунд.

Результат: втрати від шахрайства з документами фізичних осіб скоротилися в 10 разів.

2. Компанія: FarmLogs.

Галузь: сільське господарство.

FarmLogs – компанія, що надає фермерам big data аналітику та зручні сервіси для планування та оптимізації їх роботи. Мобільні і веб-додатки компанії вже використовуються більш ніж третю фермерів США. Сервіси FarmLogs використовують відкриті геодані про типі грунтів, детальні дані про погодні умови, опади і сонячної активності. Також широко використовується аналіз супутникових знімків для автоматичного визначення посівів різних культур, моніторингу їх стану і врахування історичних даних для прогнозування і формування рекомендацій. Компанія надає фермерам в оренду пристрої, які встановлюються в сільськогосподарські комбайни і автоматично записує в систему дані про всі проведені операції, маршрутах і витраті палива. У результаті формуються детальні рекомендації по веденню сільського господарства і автоматично ведуться всі необхідні розрахунки, в тому числі фінансові.

Результат: порівняно далекий від високих технологій фермерський сектор економіки США охоплений big data оптимізацією більш ніж на третину.

3. Компанія: Dubai Airports.

Галузь: транспорт – аеропорти.

Міжнародний аеропорт Дубая – самий завантажений у світі аеропорт за обсягом міжнародного пасажирського трафіку, один з найбільших в світі. Великі дані про показники роботи аеропорту, рейси і переміщенні пасажирів широко використовуються для оптимізації роботи аеропорту і підвищення задоволеності пасажирів.

Аеропорт використовує складні алгоритми для оптимізації динамічного призначення виходів для посадки і прильоту. Зокрема, якщо два рейси мають велику кількість пасажирів, пересаживающихся з одного рейсу на інший, їх виходи будуть призначені поруч.

Дуже багато пасажирів відвідують Дубай для шопінгу, і аеропорт має безліч магазинів в зоні duty free. Однак захоплення шопінгом призводить до того, що пасажири часто запізнюються на рейси. Багато з них не говорять ні англійською, ні на арабському – на мовах, на яких робляться оголошення. Після впровадження нової програми сповіщень у кожному з магазинів аеропорту скануються посадочні талони пасажирів, і вони отримують сповіщення про те, до якого виходу їм потрібно пройти, за яким маршрутом, і скільки на це потрібно часу, на мові, якою вони володіють.

Результат: оптимізовано призначення виходів на посадку і приліт, значно скоротилася кількість запізнень на рейси.

4. Компанія: macy's.

Галузь: роздрібна торгівля, одяг, взуття та аксесуари.

Macy's – велика мережа універсальних магазинів, заснована в 1858 р. і сьогодні має понад 840 магазинів в 45 штатах США. Протягом року хоча б 1 раз магазини мережі відвідують 70% американців.

Компанія аналізує великі обсяги даних щодо попиту, акцій, відсутності товару в конкретних магазинах, поєднує ці дані з уподобаннями покупців, які живуть на даній території, і таким чином оптимізує асортимент всіх категорій товарів в кожній з торгових точок.

Використовуючи технології SAS Institute, ритейлер виробляє корекцію цін на 73 мільйони товарів практично в реальному часі, використовуючи дані про попит і наявних товарних запасах.
Компанія використовує великі дані не тільки в частині внутрішньої оптимізації, але і в частині орієнтації на клієнта. Наприклад, інтернет-магазин Macys.com як і інші онлайн-ритейлерів, використовує персоналізацію, таргетовані рекламні банери і розсилку по електронній пошті, оптимізацію пошукової системи сайту, щоб покупець легко міг знайти товар, що цікавить його. Персоналізація рекламних повідомлень і пропозицій в компанії дуже висока, число унікальних варіацій однієї поштової розсилки може досягати 500 000.

Результат: високі темпи зростання продажів (до 50% на рік), як мінімум, 10% з яких, за оцінкою компанії – чистий ефект big data.

5. Компанія: Ancestry.

Галузь: банк даних, довідкова система.

Основний актив компанії Ancestry – величезна база даних сучасних і історичних документів, що дозволяє відновлювати родинні зв'язки між людьми і будувати генеалогічні дерева. Сьогодні банк даних компанії містить вже понад 5 млрд. профілів людей, що жили в різний час (починаючи з 16 століття) у великій кількості країн, було побудовано понад 45 млн. генеалогічних дерев, які задають сімейні зв'язки між ними.

Історичні дані, як правило, представлені не в машиночитаемом форматі. Це можуть бути, наприклад, рукописні записи в облікових книгах. Крім того, такі дані можуть бути суперечливими, неточними і неповними. В обробці, доповнення і перевірки даних компанії допомагають алгоритми data mining і машинного навчання, у тому числі алгоритми нечіткого зіставлення (fuzzy matching).

Для зберігання та аналізу даних використовуються технології великих даних. Дані Ancestry обробляються на трьох кластерах MapR (дистрибутив, заснований на Hadoop). Перший порівнює із зразками в базі результати аналізу ДНК (у базі вже понад 120 тис. зразків), які користувачі можуть отримати всього за 99$, плюнувши в трубку і надіславши зразок слини в компанію поштою. Другий реалізує алгоритми машинного навчання, третій – майнінгу даних.

Попередній аналіз бази дозволяє спрощувати пошук родичів і формувати припущення, які полегшують розслідування сімейної історії. Сьогодні величезна кількість відкриттів, зроблених користувачами, забезпечується попередніми з'єднанням профілів і ранжируванням результатів, проведених системою на основі аналізу даних профілів і попередньої історії пошуку в системі. Ще кілька років тому всі такі відкриття були заслугою виключно користувачів системи. Користувальницький досвід у системі також постійно аналізується, щоб виявляти етапи, де у користувачів виникають труднощі, щоб додавати ці області додатковий контент або ранжувати результати пошуку.



Результат: накопичена величезна база історичних даних з очищеними, підтвердженими і попередньо сполученими записами, що забезпечує легке і продуктивне використання системи.

6. Компанія: Rolls-Royce Holdings.

Галузь: машинобудування, виробництво двигунів.

Rolls-Royce Holdings – британська мультинаціональна компанія, що виробляє двигуни і турбіни для аерокосмічної галузі, морських суден і енергетики. Двигуни, які вони виробляють, дуже великі і дорогі, прорахунки і помилки в їх провадженні можуть коштує мільйони і призвести до загибелі людей. Rolls-Royce використовує технології великих даних в розробці, виробництві і подальшої підтримки своїх двигунів після продажу.

При розробці двигунів широко використовується комп'ютерна симуляція, що виробляє терабайти даних. Аналіз і візуалізація цих даних здійснюється на високопродуктивних обчислювальних кластерах. Виробничі системи компанії взаємодіють один з одним за допомогою Інтернету речей.

Двигуни Rolls-Royce забезпечені сотнями датчиків, які реєструють найменші деталі їх роботи. Ці дані оперативно обробляються з допомогою алгоритмів машинного навчання та передаються інженерам у разі виникнення відхилень.

Компанія не дає точної оцінки эффектнивости впровадження big data технологій, однак за заявами керівництва компанії, вони дали значне скорочення витрат. Великі дані також змінили бізнес-модель компанії: завдяки ним компанія змогла запропонувати клієнтам нову модель обсаджування «Total Care», коли компанії оплачують погодинно моніторинг стану роботи двигунів під час їх роботи.

Результат: значне скорочення витрат у розробці і виробництві, підвищення надійності, впровадження нової бізнес-моделі.

Будемо раді вашим коментарям.

І чекаємо вас на «Фахівець з великим даними», старт 15 березня.
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.