Надмірність даних (Data Redundancy)

Надмірність даних — це дублювання однієї і тієї ж інформації в декількох місцях сховища або бази даних.

Positive Uses: 1. Backups. 2. RAID configurations. 3. Erasure coding. Negative Consequences: 1. Increased costs. 2. Data corruption (unsynced copies). 3. Slower updates. Concepts: Mirroring, Duplication, Checksums, Parity.

        graph LR
  Center["Надмірність даних (Data Redundancy)"]:::main
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

      

🧒 Простими словами

Корисна надмірність — це як мати два однакових ключі від квартири на випадок, якщо один загубиться. Шкідлива надмірність — це коли ви записали номер телефону друга в десяти різних блокнотах, і тепер не знаєте, в якому з них номер правильний, бо ви його нещодавно змінили.

🤓 Expert Deep Dive

На технічному рівні для боротьби зі шкідливою надмірністю використовують 'Нормалізацію БД'. Проте в системах Big Data часто використовують 'Денормалізацію' (навмисне дублювання), щоб пришвидшити пошук. Головне правило сучасної архітектури: надмірність має бути керованою. Якщо ви копіюєте дані, ваша система має гарантувати, що всі копії оновлюються одночасно.

📚 Джерела