Порівняння продуктивності аналітичних СУБД HPE Vertica і Exasol з використанням TPC-H Benchmark

У цій статті я хочу продовжити тему порівняння баз даних, які можна використовувати для побудови сховища даних (DWH) та аналітики. Раніше я описав результати тестів для Oracle In-Memory Option In-Memory RDBMS Exasol. У цій статті основну увагу буде приділено СУБД Vertica. Для всіх описаних тестів використовувалися tpc-h benchmark на невеликому обсязі вихідних даних (2 Гб) і конфігурація БД на одному вузлі. Ці обмеження дозволили мені багаторазово повторити бенчмарк в різних варіаціях і з різними налаштуваннями. Для вибору аналітичної СУБД під конкретний проект закликаю читачів проводити випробування на своїх кейсах (дані, запити, обладнання та інші особливості).

Читати далі →

Масштабування ClickHouse, управління міграціями та надсилання запитів з PHP в кластер

У попередньої статті ми поділилися своїм досвідом впровадження та використання СУБД ClickHouse у компанії СМИ2. У поточній статті ми торкнемося питання масштабування, які виникають із збільшенням обсягу аналізованих даних і зростанням навантаження, коли дані вже не можуть зберігатися і оброблятися в рамках одного фізичного сервера. Також ми розповімо про розробленому нами інструменті для міграції DDL-запитів в ClickHouse-кластер.
Два шарда по дві репліки

Читати далі →

Як запустити ClickHouse своїми силами і виграти джекпот

Ми вирішили описати простий і перевірений шлях для тих, хто хоче впровадити аналітичну СУБД ClickHouse своїми силами або просто випробувати ClickHouse на власних даних. Саме цей шлях пройшли ми самі в новинному агрегаторі СМИ2 і добилися вражаючих результатів.
Clickhouse-client
У передмові статті — невеликий розповідь про наших спробах запровадити Druid та InfluxDB. Чому після успішного запуску ClickHouse ми змогли відмовитися від використання InfiniDB і Cassandra.

Читати далі →

Яндекс відкриває ClickHouse

Сьогодні внутрішня розробка компанії Яндекс — аналітична СУБД ClickHouse, стала доступна кожному. Вихідні матеріали опубліковані на GitHub під ліцензією Apache 2.0.



ClickHouse дозволяє виконувати аналітичні запити в інтерактивному режимі за даними, оновлюється в реальному часі. Система здатна масштабуватися до десятків трильйонів записів і петабайт збережених даних. Використання ClickHouse відкриває можливості, які раніше було навіть важко уявити: ви можете зберігати весь потік даних без попередньої агрегації і швидко одержувати звіти в будь-яких розрізах. ClickHouse розроблений в Яндексі для завдань Яндекс.Метрики — другий за величиною системи веб-аналітики в світі.

У цій статті ми розповімо, як і для чого ClickHouse з'явився в Яндексі і що він вміє; порівняємо його з іншими системами і покажемо, як його підняти у себе з мінімальними зусиллями.


Читати далі →