Apriori: нове або добре забуте старе



Рекомендаційні (вони ж рекомендаційні) системи вже близько 20 років використовуються в e-commerce. Найуспішніші приклади ми можемо бачити у гігантів Amazon і Taobao. Але як же бути з offline рітейлом? Застосувати до нього наявні рекомендаційні системи? І чи є альтернатива?

Перед командою Datawiz виникла завдання: створити подібну рекомендаційну систему для offline рітейлу. Все, що ми мали — дані про клієнтів, які мають рітейлери — різні програми лояльності.

Нестандартне рішення знайшлося відразу — старий, добрий і перевірений алгоритм Apriori. Хочете дізнатися, як використовувати парний аналіз по-новому? Ласкаво просимо під кат.

Давайте розглянемо один із прикладів проведення парного аналізу за даними програми лояльності магазину електроніки.

Приклад схематичний, не осудіть:)

Отже, Ігор і Сашко — постійні клієнти супермаркету одній мережі, вони є учасниками програми лояльності і у них є дисконтні картки цього магазину.
Це їх купівлі:



Стандартне рішення: Якщо застосувати класичний парний аналіз до цих чеках, то алгоритм Apriori проаналізує кожну окрему купівельну корзину (кожен окремий чек). Алгоритм обчислює всі можливі пари в кожному чеку; ймовірність і частоту купівлі цих товарів разом.

У нашому прикладі, Apriori виявить одну очевидну пару «Телевізор — Перехідник», з високою ймовірністю і частотою покупки. Але чи це так? Всього лише одна пара?

Наше рішення: алгоритм той же — інший підхід. Цікаво?

КРОК 1
Ми об'єднуємо всі чеки Ігоря в один чек. Також чинимо і з чеками Саші та інших клієнтів з програми лояльності. Ми отримуємо кількість чеків, рівне кількості клієнтів, що беруть участь у програмі лояльності.


КРОК 2
Після того, як ми об'єднали чеки для кожного клієнта, застосовуємо до них алгоритм Apriori. Алгоритм все так само виділяє пару «Телевізор-Перехідник», як часто купується. Але при цьому він видає й інші пари з високою ймовірністю покупки, які раніше були невидны: «Телевізор-Аудіосистема», «Перехідник-Аудіосистема» і т. д.

КРОК 3
Визначаємо часова відстань між подіями, тобто інтервал між покупками знайдених нами пар. Це значення буде усереднюються. Для пар «Телевізор-Аудіосистема» і «Перехідник-Аудіосистема» цей інтервал буде 1 рік 4 міс.( (1 рік + 1 рік 8 міс)/2).
Отже, ми виявили пари, «розкидані» в часі (ну або так — розподілені по тривалому проміжку часу).

Навіщо нам це потрібно і що ми маємо з цього гусака"?:)
Застосувавши алгоритм Apriori до даних по програмі лояльності і виявивши ці «розкидані» пари, ми можемо створити рекомендаційну систему.

Наприклад кожному новому клієнту, який купує Телевізор або Перехідник, приблизно через 1 рік 4 міс. можна робити вигідну пропозицію з придбання Аудіосистеми.

На виході у нас буде таблиця з рекомендаціями: коли і з яким клієнтом зв'язатися, і що йому запропонувати.

Далі вибір за інструментом директ-маркетингу: e-mail, sms, телефонний дзвінок — всі засоби хороші.

Застосування парного аналізу даних по програмах лояльності для різних типів рітейлу:
У ритейлі електроніки парний аналіз за програмою лояльності краще всього проводити не по товарах, а по категоріях товарів. Так як відбувається постійне поповнення асортименту, зміна і розширення модельних рядів.

Для рітейлу одягу новий метод парного аналізу також слід проводити по категоріях товарів. Це пов'язано з коротким циклом життя товару (зміна колекцій, брендів та інша специфіка даної індустрії).

У food-ритейлі парний аналіз за програмою лояльності також застосуємо.
Тут частота покупок дуже висока, але тим легше виявити патерни (купівельні шаблони) клієнтів. Хоча і пар буде значно більше.
Приклад: клієнт грунтовно «тарится» раз на тиждень — у суботу, але посеред тижня (вівторок-середа) постійно приходить за йогуртом, булочками та іншими вподобаннями. Якщо рітейлер запропонує цьому клієнту хорошу знижку на йогурти-булочки в суботу, клієнт з високою ймовірністю не встоїть перед цією пропозицією, бо він їх і так би купив. А до середовища йогурт благополучно закінчиться і клієнт прийде в магазин знову, адже це звичка:).

До чого це все?
Виявлення типових шаблонів покупок і для тих пар, які неможливо виявити за допомогою класичного парного аналізу — це джерело додаткового прибутку для компанії.

Ну, і чим краще ви знаєте своїх клієнтів, і чим персонализированнее ваше спілкування з ними — тим вище лояльність. Адже саме для цього і існують програми лояльності, чи не так?

P. S.
Про парному аналізі для рітейлу у нас є стаття на Хабре. (Як за допомогою алгоритму Apriori ми аналізуємо кошики і виявляємо парні товари (основні і супутні), і яке практичне застосування такого аналізу при розміщенні товарів у торговельному залі).

Не забудьте також ознайомитися з ще однією нашою статті «Кластеризація: розкажи мені, що ти купуєш, і я скажу хто ти».

Всім добра!

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.