Доброго часу доби всім читачам і авторам habrahabr.ru. Мова в цій статті йтиме про візуалізації найпростіших алгоритмів сортування.



На виконання цієї роботи мене надихнув Timo Bingmann – аспірант Інституту теоретичної інформатики і алгоритмів при Технологічному інституті Карлсруе (Німеччина) [1]. Тімом була написана чудова стаття, де можна почитати трохи про історію візуалізацій і аудификаций алгоритмів [2]. Програмісти, як ніхто знають, як важко йде процес розуміння абстрактних сутностей, і як сильно в цьому допомагають метафори та методи візуалізації. Коли якого-небудь об'єкту з реального життя аналогічно присвоюються властивості і методи віртуальних об'єктів.
Читати далі →

Огляд Knime Analytics Platform — open source системи для аналізу даних

ПРО KNIME
Вашій увазі пропонується огляд Knime Analytics Platform – open source фреймворку для аналізу даних. Даний фреймворк дозволяє реалізовувати повний цикл аналізу даних включає читання даних з різних джерел, перетворення і фільтрацію, власне аналіз, візуалізацію і експорт.

Скачати KNIME (eclipse-based десктоп додаток) можна звідси: www.knime.org

Кому може бути цікава ця платформа:

  • Тим, хто хоче аналізувати дані
  • Тим, хто хоче аналізувати дані і не володіє навичками програмування
  • Тим, хто хоче покопатися в непоганий бібліотеці реалізованих алгоритмів і, можливо, дізнатися щось нове

Читати далі →

Середнє арифметичне: фізичний сенс і візуалізація

Змінна величина – атрибут (властивість) системи, який змінює своє числове значення. Безліч значень змінної величини може мати вигляд:
65, 59, 62, 63, ...

Людина аналізує числові дані такого роду і приймає рішення. Знання температури повітря допомагає правильно одягнутися. Курс валюти говорить купувати її чи продавати.
Коли одне або кілька значень, то ніяких труднощів не виникає. Але коли значень десятки або сотні, то людині складно відразу зрозуміти, що означають отримані дані. На допомогу приходять інтегральні характеристики множин значень і візуалізація.
Одна з інтегральних характеристик безлічі значень змінної величини – середнє арифметичне. Подивимося на нього з точки зору статистики, фізики (механіки) і естетики.
Три точки зору на числові дані

Читати далі →

8 бібліотек JavaScript для візуалізації даних у вигляді інтерактивних карт

Візуалізація даних стала невід'ємною частиною життя практично кожного веб-розробника. Якщо побудова графіків, діаграм, карт і дашбордов досі ніколи не були вашої головним болем, просто трохи зачекайте: напевно і ви вступите в наш «клуб».

Дана стаття дає загальне, але залучене уявлення про восьми найбільш цікавих, на мій погляд, JavaScript-бібліотеки для побудови інтерактивних геовизуализаций. В цілому, таких рішень зараз багато, і вибрати оптимальне під той чи інший конкретний проект – завдання деколи непроста як мінімум по часу. Цією публікацією я спробую хоча б трохи полегшити життя тим, хто тільки починає розбиратися в даній темі. До речі, це дещо модифікований переклад моєї недавньої статті на Onextrapixel (оригінал англійською).

Заголовна картинка: візуалізація даних за допомогою інтерактивних карт
Читати далі →

Дослідження датасета з IMDB



Проблематика
Фільми — це круто, фільми надихають нас, наповнюють упевненістю, загалом дають нам багато чого. І тому у цій статті я б хотів розповісти вам про дослідження тенденцій сучасного кінематографа з допомогою інструментів аналізу даних, який вже був презентований у фіналі Science Slam ITMO University 2.0. Повний випуск доступний тут.

Читати далі →

Відстеження ходу виконання в R

Неважливо, чи віддаємо ми собі в цьому звіт, але коли потрібно почекати, ми хвилюємося і згорає від нетерпіння. Особливо це стосується очікування «наосліп», тобто коли невідомо, скільки ще доведеться мучитися. Як з'ясував Бред Аллан Майерс, який вважається винахідником індикатора стану в 1980-х, можливість відстежувати хід виконання під час очікування може значно поліпшити механізм взаємодії користувача з додатком (Майерс, 1985).


Типовий індикатор стану від Simeon87 [GPL], Wikimedia Commons

Оскільки я програмують на R для досліджень в біоінформатики, мій код зазвичай не для широкої публіки, але все ж важливо, щоб мої користувачі, тобто колеги і дослідники, були щасливі, наскільки це можливо. Але відстеження ходу виконання в R — не найпростіше завдання. У цій статті представлено кілька можливих рішень, у тому числі і моє власне (pbmcapply).

Читати далі →

Intersystems DeepSee. Проста і швидка візуалізація даних

BI системи нашою організацією було обрано DeepSee входить в комплект поставки СУБД InterSystems Cache. Частково цей вибір був зумовлений тим фактом, що для зберігання даних ми використовуємо цю СУБД, тому використовувати інтегровану BI є кращим рішенням.

DeepSee являє собою куби OLAP які «дивляться» на вибрану таблицю вибраної області, такі куби можна фільтрувати за всіх полів вихідної таблиці, що дозволяє переглядати дані з будь-якої точки. Наприклад, однією з поставлених завдань було виведення інформації про народжених, DeepSee дозволив на основі кубів створити таблиці відображають скільки дітей народилося за останній рік, розділити їх на групи за статтю, вагою, довжиною тіла, віком матерів і місцем народження. Так само для кожного параметра можна задати умови DrillDown – провалювання в параметр, так замість року ми можемо подивитися скільки всього народилося в конкретний місяць, день, годину.

Звучить непогано, чи не так? Так воно і є!

Читати далі →

Трохи про кіно або як робити інтерактивні візуалізації в python


Введення
У цій замітці я хочу розповісти про те, як можна досить легко будувати інтерактивні графіки в Jupyter Notebook'e з допомогою бібліотеки
plotly
. Більше того, для їх побудови не потрібно піднімати свій сервер і писати код на javascript. Ще один великий плюс пропонованого підходу — візуалізації будуть працювати і в NBViewer'e, тобто можна буде легко поділитися своїми результатами з колегами. Ось, наприклад, мій код для цієї замітки.
Для прикладів я взяла скачали в квітні дані про фільми (рік випуску, оцінки на Кинопоиск і IMDb, жанри тощо). Я вивантажила дані по всім фільмам, в яких було хоча б 100 оцінок — всього 36417 фільмів. Про те, як завантажити і розпарсити дані Кинопоиск, я розповідала в попередньому пості.

Читати далі →

Візуалізація статистики ЄВРО-2016 за допомогою Python і Inkscape


Привіт, Хабр!

Минуло трохи більше тижня до закінчення Чемпіонату Європи 2016 у Франції. Цей чемпіонат запам'ятається нам невдалим виступом збірної Росії, виявленої волею збірної Ісландії, приголомшливою грою збірних Франції і Португалії. У цій статті ми попрацюємо з даними, побудуємо декілька графіків і відредагуємо їх у векторному редакторі Inkscape. Кому цікаво — прошу під кат.

Читати далі →

D3.js. Візуалізація графів

D3.js — це бібліотека JavaScript для управління документами, в основі яких лежать дані. D3 допомагає втілити дані в життя, використовуючи HTML, SVG і CSS. D3 дозволяє прив'язувати довільні дані до DOM, і потім застосовувати результати маніпуляцій з ними до документа.
Для розуміння статті стане в нагоді знання основ D3, і в ній ми розглянемо реалізацію алгоритмів візуалізації графа на основі сил (Force-directed graph drawing algorithms), яка D3 (version 3) має назву Force Layout. Це клас алгоритмів візуалізації графів, які обчислюють позицію кожного вузла, моделюючи силу тяжіння між кожною парою пов'язаних вузлів, а також відразливу силу між вузлами.

image

Читати далі →