Retrieval-Augmented Generation (RAG)
Retrieval-Augmented Generation (RAG) — це фреймворк штучного інтелекту, який покращує точність і надійність великих мовних моделей (LLMs), інтегруючи зовнішні джерела знань під час процесу генерації.
Системи RAG поєднують сильні сторони пошуку інформації та генерації тексту. Спочатку вони отримують відповідні документи або дані з зовнішньої бази знань на основі запиту користувача. Потім вони доповнюють вхідні дані LLM цією отриманою інформацією, дозволяючи моделі генерувати більш обґрунтовані та контекстно точні відповіді. Цей підхід зменшує залежність від внутрішніх знань LLM, які можуть бути застарілими або неповними, та покращує загальну якість і надійність згенерованого виводу. RAG особливо корисний для завдань, що вимагають актуальної інформації або спеціалізованих знань.
graph LR
Center["Retrieval-Augmented Generation (RAG)"]:::main
Pre_large_language_model["large-language-model"]:::pre --> Center
click Pre_large_language_model "/terms/large-language-model"
Pre_vector_database["vector-database"]:::pre --> Center
click Pre_vector_database "/terms/vector-database"
Pre_semantic_search["semantic-search"]:::pre --> Center
click Pre_semantic_search "/terms/semantic-search"
Center --> Child_rag_pipeline["rag-pipeline"]:::child
click Child_rag_pipeline "/terms/rag-pipeline"
Center --> Child_context_window["context-window"]:::child
click Child_context_window "/terms/context-window"
Rel_prompt_engineering["prompt-engineering"]:::related -.-> Center
click Rel_prompt_engineering "/terms/prompt-engineering"
Rel_generative_ai_agents["generative-ai-agents"]:::related -.-> Center
click Rel_generative_ai_agents "/terms/generative-ai-agents"
Rel_rlhf["rlhf"]:::related -.-> Center
click Rel_rlhf "/terms/rlhf"
classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
linkStyle default stroke:#4b5563,stroke-width:2px;
🧒 Простими словами
Уявіть, що ви складаєте іспит. Звичайна [LLM](/uk/terms/llm) намагається відповісти по пам'яті (яка може підвести). [RAG](/uk/terms/rag) — це як дозволити студенту відкрити підручник на потрібній сторінці перед тим, як відповісти. Він набагато рідше вигадуватиме нісенітниці.
🤓 Expert Deep Dive
Використовує векторні вкладення (embeddings) для пошуку семантично схожого контенту. Це значно зменшує галюцинації ШІ та дозволяє працювати з приватними даними компаній.