Пульс Хабра

    
callidus77: Помніца в нашій сітці монтажники підключали абонента. Прийшли, встромили сетевухи, а у нього ФРЯ і дров нема. Почухали голови і пішли. Чел через три тижні нарешті коннектітся.
Грят: «Довго ж ти шукав дрова.»
Він: «Я не шукав. Я їх сам написав. »Баш
 
Напевно, кожен автор трепетно ​​стежить за долею своїх статей, такому автору на Хабре завжди чогось не вистачає. Мені завжди не вистачало інструментів спостереження за статтями — тому я і вирішив їх написати.
 
 
Під катом ми розберемося з основними інструментами ресурсу і потенційною можливістю застосування. Весь інструментарій доступний за адресою http://www.habr-analytics.com , вихідний код (основні функції) на github . За прикладами і деталями — ласкаво просимо під кат!
 
Структура статті
 
     
  1. Пульс Хабра
  2.  
  3. Монітор статей
  4.  
  5. Аналіз користувачів
  6.  
  7. Перетин хабів — діаграми Венна
  8.  
  9. Аудиторія хабів
  10.  
  11. Вихідний код та структура проекту
  12.  
  13. Висновок
  14.  
 
 * Обережно трафік *
 
 
 

Пульс Хабра


Пульс — один з найбільш цікавих індикаторів, він показує динаміку читання Хабра (точніше статей в «Новому»). Між точками фіксований інтервал у сім хвилин (плюс-мінус хвилина). На графіку нижче можемо спостерігати рівень активності в ніч з неділі на понеділок. Добре видно, що статті в понеділок вранці читають в чотири рази активніше, ніж в ніч з неділі на понеділок (чого і слід було очікувати, але ми заздалегідь не знаємо «наскільки» більше читають у понеділок вранці)
 
 
У чому сенс?
Потенційне застосування: вибір часу для відправлення статті. Чим активніше люди читають Хабре, тим більше шансів, що статтю побачать. Відповідно, якщо індикатор в даний момент низький, то можливо варто переглянути час відправлення статті.
 
Доступний за адресою:
 www.habr-analytics.com/pulse
 
 

Монітор статей


Мабуть, це одна з функцій, якої мені настільки не вистачало, що окремо б ще написав у вигляді standalone додатки (якщо ви теж вважаєте, що це чудова ідея — напишіть в саппорт нехай повернуть стіну видадуть мені вже токен для API — ідеально б інтегрувати цю функцію в Хабр).
 
Коротенько, стежимо за зміною переглядів, обраного і репости в соц мережах (ВК, FB, Twitter) у часі. Інтерфейс простейщій: вибираємо статтю зі списку, тип даних і тиснемо кнопку «Побудувати Графік».
 
У репертуарі статті за останні два дні (насправді за останні 52 години).
 
Доступно за адресою:
 www.habr-analytics.com/monitor
 
Як приклад, графіки для Хабра-статті «З Днем Народження, Елон Маск» :
 Перегляди : З Днем Народження, Елон Маск " :
 
 Вибране : З Днем Народження, Елон Маск " :
 
 репости в соц мережах : З Днем Народження, Елон Маск " :
 
Для свіжих статей число вимірювань меншу (так як вимірювання відбуваються кожні сім хвилин), тому графіки зовні виглядають трохи по-іншому:
 
Стаття: " Чи не лей мені сіль в реактор або-імпульсні ядерні ракетні двигуни " через 5-6 годин після появи.
 
 Перегляди : Чи не лей мені сіль в реактор або-імпульсні ядерні ракетні двигуни
 
 Вибране : Чи не лей мені сіль в реактор або-імпульсні ядерні ракетні двигуни
 
 репости в соц мережах: Чи не лей мені сіль в реактор або-імпульсні ядерні ракетні двигуни
 
  
Для порівняння графік переглядів цієї ж статті через 27 годин
 
 
 
У чому сенс
Спостерігати за динамікою читання статті: перестали читати статтю, після того як вона пішла з «краще за добу»? (Найчастіше ми бачимо, що перегляди виходять на константу після 24-х годин.) В якій мережі стаття поширюється швидше і активніше? Як змінюється динаміка після виходу на головну?
 
В цілому, монітор дає інтегральний зліпок поширення статті в мережі.
 
 

Аналіз користувачів


Кому не цікаво подивитися свою «історію» на Хабре? Ну або ще чию-небудь; зазвичай, відкриваєш профіль і бачиш всього лише суху пару рядків: стільки-то написав, зареєструвався тоді-то і все. Мені завжди це здавалося чимось не надто цікавим і прийшла ідея — візуалізувати історію користувача.
 
Інтерфейс гранично простий — ім'я користувача, тип даних і велика кнопка.
 
 
Наведемо для прикладу графіки для користувача lozga — просто тому, що виходить досить красиво: одні «злети» і «падіння».
 
«Аналіз користувачів» доступний за адресою:
 www.habr-analytics.com/user
 
Розглянемо графіки трохи детальніше:
 Перегляди
 
 Рейтинг
 
 Вибране
 
 
Бонус: графік переглядів для PapaBubaDiop (великий пік — це той самий пост про «Поле Чудес» )
 
 
 
Навіщо це потрібно?
З одного боку дозволяє поглянути на історію своїх статей на Хабре; з іншого, це набагато більш інформативна подача профілю в часі, ніж пара фінальних чисел.
 
 

Перетин хабів — діаграми Венна


Чи не замислювалися, що вибираючи другий чи третій хаб для статті, ви цілком можете не покривати нової аудиторії? Для того, що переконатися в тому, що хаби не перетинаються і зроблена ця функція. Необхідно вибрати два або три хаба і клікнути на велику кнопку.
 
 
Доступно за адресою:
 www.habr-analytics.com/venn
 
Для даної функції так само є standalone версія з розширеним функціоналом (наприклад, з роботою з хабами компаній) і Хабра-стаття із описом: исходники (python) і виконувані файли для Windows, Linux і MacOS (всі бібліотеки включені).
 
     
  • python скрипт venn.py і папка src / ; необхідно встановити бібліотеки:
     
    pip install beautifulsoup4 progress urllib3 matplotlib_venn
    

     
  •  
  • venn.exe для Windows
  •  
  • venn.elf для Linux
  •  
  • venn.osx для Mac OS
  •  
 
 

Аудиторія хабів


Ця функція дає уявлення про уподобання читачів певного хаба по відношенню відразу до всіх інших хабам.
Необхідно вибрати хаб і результат — гістограма переваг читачів, тобто, що ще читають читачі даного хаба, у відсотках від числа передплатників вихідного хаба.
 
 
Доступно за адресою:
 www.habr-analytics.com/audience
 
Для даної функції є так само standalone версія з розширеним функціоналом (наприклад, з роботою з хабами компаній) і Хабра-стаття із описом:
Вихідні дані під назвою hubs доступні на github , там же доступні виконувані файли для
  
 

Вихідний код та структура проекту


Основний (збір даних, запис в бази даних, генерація графіків і т.д.) код проекту доступний на github .
 
(Вище приведений код функції monitor).
 
Оскільки швидше за все сайт ляже від Хабра-ефекту заздалегідь Ванг жарти в дусі: у Хабра не прощупується пульс або у пульсу не прощупується Хабр .
 
Але насправді це не страшно, якщо ми розглянемо схему проекту, то зауважимо, що збір даних, зберігання і представлення даних рознесені і користувач тільки взаємодіє з інтерфейсом відображає графіки, але це ніяк не впливає на збір, зберігання і представлення даних.
 
Тобто після того як Хабра-хвиля пройде всі дані будуть в порядку.
 
Технічні деталі: все працює на PaaS Heroku, у вигляді двох додатків; обидва на Flask; інтерфейс: Flask + Bootstrap3; зберігання даних mongoHQ і memcached. Складальник даних парсит Хабре, тому як доступ до API чомусь не дають (принаймні поки що).
 
 

Висновок


Проект, безумовно, не ідеальний і йому потрібно тисяча і одна правка. І, можливо, ви розбираєтеся у верстці, обробці даних або веб-розробці і хочете допомогти? Поради, ідеї і допомогу в розробці тільки вітаються.
 
Є ідеї, що ще потрібно реалізувати? Чекаємо-с в коментарях і \ або через будь-який інший канал зв'язку.
    
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.