Досить часто enterprise завдання з обробки даних зачіпають дані, які супроводжуються тимчасовою міткою. В R такі мітки, зазвичай зберігаються як клас
POSIXct
. Вибір методів роботи з таким типом даних за принципом аналогії може привести до великого розчарування і переконання про крайню повільності R. Хоча якщо поглянути на цю трохи пильніше, то виявляється, що справа не зовсім в R, а в руках і голові.
Нижче торкнуся пару кейсів, які зустрілися в цьому місяці і можливі варіанти їх вирішення. В ході вирішення з'являються дуже цікаві питання. Заодно згадаю інструменти, які виявляються дуже корисними для вирішення подібних завдань. Практика показала, що про їхнє існування знають небагато.

Читати далі →

Незважаючи на те, що завдання рядового бізнесу дуже часто далекі від популярної теми великих даних і машинного навчання і часто пов'язані з обробкою щодо малих обсягів інформації [десятки мегабайт — десятки гігабайт], розмазаний в довільних уявленнях з різних видів джерел, застосування R в якості основного інструменту дозволяє легко і елегантно автоматизувати і прискорити ці завдання.
І, природно, після проведення аналізу необхідно все це презентувати, для чого можна з успіхом використовувати Shiny. Далі я наведу ряд трюків і підходів, які можуть допомогти в цій завданнях. Упевнений, що будь-який практикуючий аналітик зможе легко додати свої хитрощі, все залежить від розв'язуваного класу завдань.

Читати далі →

«До чого дійшов прогRесс». Заміна «розумового» праці механічним процесом на базі R

Кожен новий день часто підкидає нові задачки. Не в сенсі їх радикальної новизни, а в сенсі «ще одного типу завдань», які зазвичай зустрічаються в бізнес-оточенні.
На цей раз завдання виявилася гранично проста і прагматична, але її рішення дає далекосяжні наслідки.
Кейс
Суть завдання в наступному:
Читати далі →

Ще приклади використання R для вирішення практичних бізнес-задач

З моменту минулій публікації довелося примірятися до ряду різних завдань, пов'язаних тим чи іншим чином з обробкою даних. Завдання абсолютно різні, але у всіх випадках інструменти R дозволили елегантно і ефективно їх вирішити. Нижче, власне, кейси (картинок немає).
Читати далі →

Застосування R для підготовки і передачі «живий» аналітики іншим бізнес-підрозділам

В цій короткій замітці хочу поділитися ще одним варіантом використання R в повсякденні бізнес-завдання. Цей «use-case» актуальне майже для всіх компаній, незалежно від їх розміру. Мова йде про підготовку різних оперативних звітів та аналітичних зрізів.

Читати далі →

Запрягаємо R на службу бізнесу на «1-2-3»

Справжній піст є, фактично, резюме, підіб'є підсумки попередніх «технологічних» публікацій [1, 2, 3, 4, 5] і виникли дискусій і обговорень. Останні показали, що завдань у яких застосування R могло б надати вагому допомогу бізнесу дуже і дуже багато. Однак, навіть у тих випадках, коли R використовується, далеко не завжди для цього застосовуються сучасні можливості R.
Читати далі →

Вам не вистачає швидкості R? Шукаємо приховані резерви

Іноді доводиться стикатися з переконанням, що R, будучи інтерпретатором, занадто повільний для аналізу завдань «швидкого» бізнесу. У більшості випадків такі тези надходять від аналітиків, не володіють досвідом розробки серйозного, в т. ч. високопродуктивних або вбудованих систем, дуже вимогливих до обмеженим апаратних ресурсів. Це абсолютно нормально, ніхто не може знати все на світі. однак, в 95% випадків виявляється, що R абсолютно ні при чому, проблема полягає в неефективному управлінні пам'яттю і процесом обчислення.
Читати далі →

Застосування R для роботи з твердженням «Хто винен? Звичайно ІТ!»

Продовження попередніх публікацій «Інструменти DataScience як альтернатива класичної інтеграції ІТ систем»
«Екосистема R як інструмент для автоматизації бізнес-завдань» і Джентельменський набір пакетів R для автоматизації бізнес-задач. Дана публікація переслідує 2 цілі:
  1. Поглянути на типові задачі, які зустрічаються в бізнесі, під трохи іншим кутом.
  2. Спробувати їх вирішити, частково або повністю, з використанням коштів, що надаються R.

Читати далі →

Джентельменський набір пакетів R для автоматизації бізнес-завдань

Продовження попередніх публікацій «Інструменти DataScience як альтернатива класичної інтеграції»
«Екосистема R як інструмент для автоматизації бізнес-завдань».
Ця стаття є відповіддю на питання, що виникли по пакетах R, які корисні для реалізації описаних підходів. Я її розглядаю виключно як довідкову інформацію, і відправну точку для подальшого детального вивчення зацікавилися, оскільки за кожним пакетом ховається величезний простір зі своєю філософією та ідеологією, математикою і шляхами розвитку.
Як правило, всі пакети (9109 штук на 07.09.2016) знаходяться в репозиторії CRAN. Ті, що по тим або іншим причинам, поки не опубліковані в репозиторій, можуть бути знайдені на GitHub. Отже, коротким списком:
Читати далі →

Екосистема R як інструмент для автоматизації бізнес-завдань

ця стаття є продовженням попередньої публікації «Інструменти DataScience як альтернатива класичної інтеграції». Основна мета — привернути увагу як розробників, так і керівників середньої ланки, на широкому спектрі можливостей, які надають сучасні інструменти зі сфери Data Science за рамками класичних завдань статистичних обчислень і модної нині теми машинного навчання. Зокрема, можливості екосистеми R станом на серпень 2016 року і застосування цих можливостей на прикладі двох завдань: однією з прикладної науки, інший – з середнього бізнесу.

Читати далі →