галюцинації

У контексті штучного інтелекту галюцинація відноситься до моделі, яка генерує результати, які здаються правдоподібними, але фактично неправильними або безглуздими, часто представлені з високою впевненістю.

🌐 Терміни іншими мовами:

English Deutsch Español Français 日本語 한국어 Polski Português Русский Türkçe Українська

Галюцинації є значною проблемою в розробці та розгортанні моделей ШІ, зокрема великих мовних моделей (LLMs). Вони виникають, коли модель генерує інформацію, яка не ґрунтується на її навчальних даних або наданому контексті. Це може проявлятися як вигадані факти, спотворена інформація або вихідні дані, які внутрішньо суперечливі. Схильність до галюцинацій варіюється залежно від архітектури моделі, навчальних даних та конкретного завдання, яке вона виконує.

Ці помилки можуть варіюватися від незначних неточностей до повністю вигаданих деталей. Серйозність галюцинацій може мати серйозні наслідки, особливо в додатках, де точність є критичною, таких як медична діагностика, юридичні дослідження або фінансовий аналіз. Дослідники активно працюють над методами пом'якшення галюцинацій, включаючи вдосконалені методи навчання, кращу курацію даних та механізми перевірки фактів.

        graph LR
  Center["галюцинації"]:::main
  Pre_physics["physics"]:::pre --> Center
  click Pre_physics "/terms/physics"
  Rel_hallucination_ai["hallucination-ai"]:::related -.-> Center
  click Rel_hallucination_ai "/terms/hallucination-ai"
  Rel_artificial_intelligence["artificial-intelligence"]:::related -.-> Center
  click Rel_artificial_intelligence "/terms/artificial-intelligence"
  Rel_inference["inference"]:::related -.-> Center
  click Rel_inference "/terms/inference"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

🕸️ Open in Universe

🧠 Перевірка знань

1 / 3

🧒 Простими словами

Уявіть собі надзвичайно розумного папугу, який може говорити про будь-що, але іноді вигадує факти, бо він просто повторює почуті шаблони, а не насправді їх розуміє.

🤓 Expert Deep Dive

Галюцинації у генеративному ШІ виникають через властиві обмеження ймовірнісних моделей генерації послідовностей. Ці моделі оптимізують ймовірність, а не правдивість. У разі неоднозначних запитів, даних поза розподілом або прогалин у знаннях, вони можуть інтерполювати або екстраполювати на основі вивчених статистичних зв'язків, що призводить до правдоподібних, але помилкових результатів. Архітектурно, LLM на основі трансформерів, з їхніми механізмами уваги, іноді можуть надмірно зосереджуватися на хибних кореляціях у навчальних даних. Вразливості включають зловмисні запити, розроблені для виклику специфічних галюцинацій, або використання показників впевненості моделі, які часто погано відкалібровані. Такі техніки, як RAG, спрямовані на зменшення цього шляхом обумовлення генерації на основі отриманих фактичних документів, але інтеграція та достовірність отриманої інформації залишаються викликами. RLHF може допомогти узгодити поведінку моделі з людськими уподобаннями щодо точності, але визначення та послідовне забезпечення "правди" в різних доменах є складним завданням.

🔗 Пов'язані терміни

Попередні знання:

physics

📚 Джерела

1. Training Language Models to Follow Instructions with Reinforcement Learning

2. Hallucinations in Large Language Models

3. A Survey on Hallucination in Large Language Models

4. Evaluating the Factual Accuracy of Summarization

5. How to Reduce Hallucination in Large Language Models: A Survey

6. Factuality Enhanced Language Models for Open-Domain Question Answering

7. A Survey on Hallucination in Large Language Models

8. Improving Factuality in Large Language Models