Затримка (Latency)
Час, необхідний моделі машинного навчання для обробки вхідних даних та видачі результату (передбачення).
Є критичним показником для систем реального часу (автопілоти, голосові асистенти, алготрейдинг). На затримку впливають розмір моделі, апаратне забезпечення (CPU vs GPU), оптимізація коду та мережеві затримки. Для зменшення latency використовують квантування, прунінг та спеціалізовані прискорювачі (TensorRT, ONNX Runtime).
graph LR
Center["Затримка (Latency)"]:::main
Rel_network_latency["network-latency"]:::related -.-> Center
click Rel_network_latency "/terms/network-latency"
classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
linkStyle default stroke:#4b5563,stroke-width:2px;
🧠 Перевірка знань
🧒 Простими словами
Затримка — це той час, який ти чекаєш, поки сайт відкриється після натискання кнопки. Це як коли ти гукаєш друга і чекаєш, поки він відгукнеться. Чим далі він стоїть — тим більша затримка.
🤓 Expert Deep Dive
Складається з затримок у чергах, затримок обробки на роутерах та фізичної затримки поширення сигналу по кабелю (обмежена швидкістю світла).