Retrieval-Augmented Generation (RAG)
Retrieval-Augmented Generation (RAG) — это фреймворк искусственного интеллекта, который повышает точность и надежность больших языковых моделей (LLMs), интегрируя внешние источники знаний в процессе генерации.
Системы RAG сочетают в себе сильные стороны извлечения информации и генерации текста. Сначала они извлекают соответствующие документы или данные из внешней базы знаний на основе запроса пользователя. Затем они дополняют входные данные LLM этой извлеченной информацией, позволяя модели генерировать более обоснованные и контекстно точные ответы. Этот подход снижает зависимость от внутренних знаний LLM, которые могут быть устаревшими или неполными, и улучшает общее качество и надежность сгенерированного вывода. RAG особенно полезен для задач, требующих актуальной информации или специализированных знаний.
graph LR
Center["Retrieval-Augmented Generation (RAG)"]:::main
Pre_large_language_model["large-language-model"]:::pre --> Center
click Pre_large_language_model "/terms/large-language-model"
Pre_vector_database["vector-database"]:::pre --> Center
click Pre_vector_database "/terms/vector-database"
Pre_semantic_search["semantic-search"]:::pre --> Center
click Pre_semantic_search "/terms/semantic-search"
Center --> Child_rag_pipeline["rag-pipeline"]:::child
click Child_rag_pipeline "/terms/rag-pipeline"
Center --> Child_context_window["context-window"]:::child
click Child_context_window "/terms/context-window"
Rel_prompt_engineering["prompt-engineering"]:::related -.-> Center
click Rel_prompt_engineering "/terms/prompt-engineering"
Rel_generative_ai_agents["generative-ai-agents"]:::related -.-> Center
click Rel_generative_ai_agents "/terms/generative-ai-agents"
Rel_rlhf["rlhf"]:::related -.-> Center
click Rel_rlhf "/terms/rlhf"
classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
linkStyle default stroke:#4b5563,stroke-width:2px;
🧒 Простыми словами
Представьте, что вы сдаете экзамен. Обычная [LLM](/ru/terms/llm) пытается ответить по памяти (которая может подвести). [RAG](/ru/terms/rag) — это как разрешить студенту открыть учебник на нужной странице перед тем, как ответить. Он гораздо реже будет выдумывать чепуху.