Хранилище данных (Data Warehouse)
Аналитический репозиторий компании.
A Data Warehouse (DWH) is the foundation of institutional decision-making. It functions by aggregating data from various sources—such as CRM, ERP, and internal databases—into a single, unified environment. Unlike operational databases that handle high-speed 'Online Transactional Processing' (OLTP), a DWH is optimized for 'Online Analytical Processing' (OLAP), using multi-dimensional modeling (Star and Snowflake schemas) to enable fast, complex queries over historical timeframes.
graph LR
Center["Хранилище данных (Data Warehouse)"]:::main
Pre_sql["sql"]:::pre --> Center
click Pre_sql "/terms/sql"
Pre_data_modeling["data-modeling"]:::pre --> Center
click Pre_data_modeling "/terms/data-modeling"
Center --> Child_etl_extract_transform_load["etl-extract-transform-load"]:::child
click Child_etl_extract_transform_load "/terms/etl-extract-transform-load"
Rel_big_data["big-data"]:::related -.-> Center
click Rel_big_data "/terms/big-data"
Rel_data_lake["data-lake"]:::related -.-> Center
click Rel_data_lake "/terms/data-lake"
Rel_siem["siem"]:::related -.-> Center
click Rel_siem "/terms/siem"
classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
linkStyle default stroke:#4b5563,stroke-width:2px;
🧒 Простыми словами
🏢 Хранилище данных — это как гигантская 'книга истории' компании. Если обычная база данных следит за тем, что происходит 'прямо сейчас' (как касса в магазине), то Хранилище сохраняет всё, что произошло за годы. Это позволяет руководителям увидеть закономерности и спланировать будущее.
🤓 Expert Deep Dive
DWH базируется на процессах ETL (Extract, Transform, Load). Данные хранятся в колоночном формате, что ускоряет агрегационные запросы. Ключевым элементом является моделирование данных, в частности использование схем 'Звезда' и 'Снежинка'. Современные облачные решения (Snowflake, BigQuery) позволяют отделять расчеты от хранения, обеспечивая масштабируемость до петабайтов.