Retrieval-Augmented Generation (RAG)

Retrieval-Augmented Generation (RAG) — это фреймворк искусственного интеллекта, который повышает точность и надежность больших языковых моделей (LLMs), интегрируя внешние источники знаний в процессе генерации.

🌐 Термины на других языках:

English Deutsch Español Français 日本語 한국어 Polski Português Русский Türkçe Українська

Системы RAG сочетают в себе сильные стороны извлечения информации и генерации текста. Сначала они извлекают соответствующие документы или данные из внешней базы знаний на основе запроса пользователя. Затем они дополняют входные данные LLM этой извлеченной информацией, позволяя модели генерировать более обоснованные и контекстно точные ответы. Этот подход снижает зависимость от внутренних знаний LLM, которые могут быть устаревшими или неполными, и улучшает общее качество и надежность сгенерированного вывода. RAG особенно полезен для задач, требующих актуальной информации или специализированных знаний.

        graph LR
  Center["Retrieval-Augmented Generation (RAG)"]:::main
  Pre_large_language_model["large-language-model"]:::pre --> Center
  click Pre_large_language_model "/terms/large-language-model"
  Pre_vector_database["vector-database"]:::pre --> Center
  click Pre_vector_database "/terms/vector-database"
  Pre_semantic_search["semantic-search"]:::pre --> Center
  click Pre_semantic_search "/terms/semantic-search"
  Center --> Child_rag_pipeline["rag-pipeline"]:::child
  click Child_rag_pipeline "/terms/rag-pipeline"
  Center --> Child_context_window["context-window"]:::child
  click Child_context_window "/terms/context-window"
  Rel_prompt_engineering["prompt-engineering"]:::related -.-> Center
  click Rel_prompt_engineering "/terms/prompt-engineering"
  Rel_generative_ai_agents["generative-ai-agents"]:::related -.-> Center
  click Rel_generative_ai_agents "/terms/generative-ai-agents"
  Rel_rlhf["rlhf"]:::related -.-> Center
  click Rel_rlhf "/terms/rlhf"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

🕸️ Open in Universe

🧒 Простыми словами

Представьте, что вы сдаете экзамен. Обычная [LLM](/ru/terms/llm) пытается ответить по памяти (которая может подвести). [RAG](/ru/terms/rag) — это как разрешить студенту открыть учебник на нужной странице перед тем, как ответить. Он гораздо реже будет выдумывать чепуху.

🤓 Expert Deep Dive

Пайплайн RAG состоит из: Ingestion (разбиение документов -> эмбеддинг -> векторная БД), Retrieval (поиск векторов/гибридный поиск) и Generation (промпт LLM с найденным контекстом).