Избыточность данных (Data Redundancy)

Избыточность данных — это наличие дубликатов информации, которое может быть как преимуществом для надежности, так и проблемой для чистоты данных.

Positive Uses: 1. Backups. 2. RAID configurations. 3. Erasure coding. Negative Consequences: 1. Increased costs. 2. Data corruption (unsynced copies). 3. Slower updates. Concepts: Mirroring, Duplication, Checksums, Parity.

        graph LR
  Center["Избыточность данных (Data Redundancy)"]:::main
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

      

🧒 Простыми словами

Представь, что ты сохраняешь важное фото и в облаке, и на флешке — это хорошая избыточность. Но если ты распечатал это фото 100 раз и разбросал по комнате, ты просто потратил бумагу и краску, а через неделю не будешь знать, где самое новое фото с твоей лучшей обработкой. Это плохая избыточность.

🤓 Expert Deep Dive

Современным методом снижения избыточности при сохранении безопасности является 'Erasure Coding'. Вместо того чтобы хранить 3 полные копии данных (300% объема), данные делятся на фрагменты с добавлением математических кодов коррекции, что позволяет восстановить информацию при потере части дисков, используя лишь 120-150% объема. Это основа архитектур облачных гигантов вроде AWS S3.

📚 Источники