Надмірність даних (Data Redundancy)
Надмірність даних — це дублювання однієї і тієї ж інформації в декількох місцях сховища або бази даних.
Positive Uses: 1. Backups. 2. RAID configurations. 3. Erasure coding. Negative Consequences: 1. Increased costs. 2. Data corruption (unsynced copies). 3. Slower updates. Concepts: Mirroring, Duplication, Checksums, Parity.
graph LR
Center["Надмірність даних (Data Redundancy)"]:::main
classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
linkStyle default stroke:#4b5563,stroke-width:2px;
🧒 Простими словами
Корисна надмірність — це як мати два однакових ключі від квартири на випадок, якщо один загубиться. Шкідлива надмірність — це коли ви записали номер телефону друга в десяти різних блокнотах, і тепер не знаєте, в якому з них номер правильний, бо ви його нещодавно змінили.
🤓 Expert Deep Dive
На технічному рівні для боротьби зі шкідливою надмірністю використовують 'Нормалізацію БД'. Проте в системах Big Data часто використовують 'Денормалізацію' (навмисне дублювання), щоб пришвидшити пошук. Головне правило сучасної архітектури: надмірність має бути керованою. Якщо ви копіюєте дані, ваша система має гарантувати, що всі копії оновлюються одночасно.