Хранилище данных (Data Warehouse)

Аналитический репозиторий компании.

🌐 Термины на других языках:

A Data Warehouse (DWH) is the foundation of institutional decision-making. It functions by aggregating data from various sources—such as CRM, ERP, and internal databases—into a single, unified environment. Unlike operational databases that handle high-speed 'Online Transactional Processing' (OLTP), a DWH is optimized for 'Online Analytical Processing' (OLAP), using multi-dimensional modeling (Star and Snowflake schemas) to enable fast, complex queries over historical timeframes.

        graph LR
  Center["Хранилище данных (Data Warehouse)"]:::main
  Pre_sql["sql"]:::pre --> Center
  click Pre_sql "/terms/sql"
  Pre_data_modeling["data-modeling"]:::pre --> Center
  click Pre_data_modeling "/terms/data-modeling"
  Center --> Child_etl_extract_transform_load["etl-extract-transform-load"]:::child
  click Child_etl_extract_transform_load "/terms/etl-extract-transform-load"
  Rel_big_data["big-data"]:::related -.-> Center
  click Rel_big_data "/terms/big-data"
  Rel_data_lake["data-lake"]:::related -.-> Center
  click Rel_data_lake "/terms/data-lake"
  Rel_siem["siem"]:::related -.-> Center
  click Rel_siem "/terms/siem"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

      

🧒 Простыми словами

🏢 Хранилище данных — это как гигантская 'книга истории' компании. Если обычная база данных следит за тем, что происходит 'прямо сейчас' (как касса в магазине), то Хранилище сохраняет всё, что произошло за годы. Это позволяет руководителям увидеть закономерности и спланировать будущее.

🤓 Expert Deep Dive

DWH базируется на процессах ETL (Extract, Transform, Load). Данные хранятся в колоночном формате, что ускоряет агрегационные запросы. Ключевым элементом является моделирование данных, в частности использование схем 'Звезда' и 'Снежинка'. Современные облачные решения (Snowflake, BigQuery) позволяют отделять расчеты от хранения, обеспечивая масштабируемость до петабайтов.

🔗 Связанные термины

Предварительные знания:
Чтобы узнать больше:

📚 Источники