Большая языковая модель (LLM)

Вероятностные текстовые движки.

Мощная система ИИ, обученная на колоссальных объемах текста для общения и генерации контента.

        graph LR
  Center["Большая языковая модель (LLM)"]:::main
  Pre_transformer["transformer"]:::pre --> Center
  click Pre_transformer "/terms/transformer"
  Pre_deep_learning["deep-learning"]:::pre --> Center
  click Pre_deep_learning "/terms/deep-learning"
  Pre_natural_language_processing["natural-language-processing"]:::pre --> Center
  click Pre_natural_language_processing "/terms/natural-language-processing"
  Center --> Child_context_window["context-window"]:::child
  click Child_context_window "/terms/context-window"
  Center --> Child_hallucination_ai["hallucination-ai"]:::child
  click Child_hallucination_ai "/terms/hallucination-ai"
  Rel_prompt_engineering["prompt-engineering"]:::related -.-> Center
  click Rel_prompt_engineering "/terms/prompt-engineering"
  Rel_model_distillation["model-distillation"]:::related -.-> Center
  click Rel_model_distillation "/terms/model-distillation"
  Rel_multimodal_ai["multimodal-ai"]:::related -.-> Center
  click Rel_multimodal_ai "/terms/multimodal-ai"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

      

🧒 Простыми словами

📚 Представьте супер-умную книгу, которая прочитала почти весь интернет. Так как она видела миллиарды примеров того, как люди общаются, она может разговаривать с вами на любую тему, писать сочинения или даже решать задачи, просто угадывая наиболее подходящие слова.

🤓 Expert Deep Dive

Обучение LLM состоит из двух этапов: Pre-training (изучение языка на основе интернета) и Alignment (например, через RLHF — обучение с человеческим фидбеком для безопасности). Главной проблемой остаются галлюцинации — когда модель уверенно генерирует ложную информацию. Для их устранения используют RAG (генерацию с поиском во внешних источниках).

🔗 Связанные термины

Предварительные знания:
Чтобы узнать больше:

📚 Источники