Retrieval-Augmented Generation (RAG)

Retrieval-Augmented Generation (RAG) — це фреймворк штучного інтелекту, який покращує точність і надійність великих мовних моделей (LLMs), інтегруючи зовнішні джерела знань під час процесу генерації.

🌐 Терміни іншими мовами:

English Deutsch Español Français 日本語 한국어 Polski Português Русский Türkçe Українська

Системи RAG поєднують сильні сторони пошуку інформації та генерації тексту. Спочатку вони отримують відповідні документи або дані з зовнішньої бази знань на основі запиту користувача. Потім вони доповнюють вхідні дані LLM цією отриманою інформацією, дозволяючи моделі генерувати більш обґрунтовані та контекстно точні відповіді. Цей підхід зменшує залежність від внутрішніх знань LLM, які можуть бути застарілими або неповними, та покращує загальну якість і надійність згенерованого виводу. RAG особливо корисний для завдань, що вимагають актуальної інформації або спеціалізованих знань.

        graph LR
  Center["Retrieval-Augmented Generation (RAG)"]:::main
  Pre_large_language_model["large-language-model"]:::pre --> Center
  click Pre_large_language_model "/terms/large-language-model"
  Pre_vector_database["vector-database"]:::pre --> Center
  click Pre_vector_database "/terms/vector-database"
  Pre_semantic_search["semantic-search"]:::pre --> Center
  click Pre_semantic_search "/terms/semantic-search"
  Center --> Child_rag_pipeline["rag-pipeline"]:::child
  click Child_rag_pipeline "/terms/rag-pipeline"
  Center --> Child_context_window["context-window"]:::child
  click Child_context_window "/terms/context-window"
  Rel_prompt_engineering["prompt-engineering"]:::related -.-> Center
  click Rel_prompt_engineering "/terms/prompt-engineering"
  Rel_generative_ai_agents["generative-ai-agents"]:::related -.-> Center
  click Rel_generative_ai_agents "/terms/generative-ai-agents"
  Rel_rlhf["rlhf"]:::related -.-> Center
  click Rel_rlhf "/terms/rlhf"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

🕸️ Open in Universe

🧒 Простими словами

Уявіть, що ви складаєте іспит. Звичайна [LLM](/uk/terms/llm) намагається відповісти по пам'яті (яка може підвести). [RAG](/uk/terms/rag) — це як дозволити студенту відкрити підручник на потрібній сторінці перед тим, як відповісти. Він набагато рідше вигадуватиме нісенітниці.

🤓 Expert Deep Dive

Використовує векторні вкладення (embeddings) для пошуку семантично схожого контенту. Це значно зменшує галюцинації ШІ та дозволяє працювати з приватними даними компаній.