галюцинації

У контексті штучного інтелекту галюцинація відноситься до моделі, яка генерує результати, які здаються правдоподібними, але фактично неправильними або безглуздими, часто представлені з високою впевненістю.

🌐 Терміни іншими мовами:

English Deutsch Español Français 日本語 한국어 Polski Português Русский Türkçe Українська

Галюцинації є значною проблемою в розробці та розгортанні моделей ШІ, зокрема великих мовних моделей (LLMs). Вони виникають, коли модель генерує інформацію, яка не ґрунтується на її навчальних даних або наданому контексті. Це може проявлятися як вигадані факти, спотворена інформація або вихідні дані, які внутрішньо суперечливі. Схильність до галюцинацій варіюється залежно від архітектури моделі, навчальних даних та конкретного завдання, яке вона виконує.

Ці помилки можуть варіюватися від незначних неточностей до повністю вигаданих деталей. Серйозність галюцинацій може мати серйозні наслідки, особливо в додатках, де точність є критичною, таких як медична діагностика, юридичні дослідження або фінансовий аналіз. Дослідники активно працюють над методами пом'якшення галюцинацій, включаючи вдосконалені методи навчання, кращу курацію даних та механізми перевірки фактів.

        graph LR
  Center["галюцинації"]:::main
  Pre_computer_science["computer-science"]:::pre --> Center
  click Pre_computer_science "/terms/computer-science"
  Rel_hallucination["hallucination"]:::related -.-> Center
  click Rel_hallucination "/terms/hallucination"
  Rel_artificial_intelligence["artificial-intelligence"]:::related -.-> Center
  click Rel_artificial_intelligence "/terms/artificial-intelligence"
  Rel_large_language_model["large-language-model"]:::related -.-> Center
  click Rel_large_language_model "/terms/large-language-model"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

🕸️ Open in Universe

🧠 Перевірка знань

1 / 3

🧒 Простими словами

Штучний інтелект "галюцинує" — це коли робот впевнено каже вам щось, що звучить правдоподібно, але насправді вигадане або неправильне. Наприклад, він може сказати, що собаки вміють літати, бо переплутав історії, які чув.

🤓 Expert Deep Dive

Галюцинації ШІ є режимом збою в генеративних моделях, що виникає через розбіжність між засвоєним внутрішнім представленням моделі та об'єктивною реальністю чи фактичною точністю. Архітектурно, великі мовні моделі (LLM), навчені виключно на передбаченні наступного токена, можуть перенавчатися на хибних кореляціях у навчальних даних або екстраполювати за межі своїх знань. Це може проявлятися у вигляді генерації правдоподібних, але неправдивих фактичних тверджень, вигадування неіснуючих сутностей чи подій, або неправильного приписування інформації. Методи зменшення галюцинацій включають: 1) Покращення якості та різноманітності даних для зменшення шуму та упередженості. 2) Застосування генерації з доповненим пошуком (RAG), де модель витягує релевантну інформацію із зовнішньої бази знань перед генерацією відповіді, тим самим обґрунтовуючи вивід. 3) Використання методів квантифікації невизначеності для оцінки впевненості згенерованих тверджень. 4) Тонке налаштування з людським зворотним зв'язком (RLHF), яке спеціально штрафує фактичні неточності. 5) Обмеження процесу генерації логічними правилами або графами знань. Складність полягає у балансуванні зменшення галюцинацій зі збереженням плавності, креативності моделі та її здатності обробляти нові або недостатньо специфіковані запити.

🔗 Пов'язані терміни

Попередні знання:

computer-science

📚 Джерела

1. Training Language Models to Follow Instructions with Reinforcement Learning

2. Hallucinations in Large Language Models

3. A Survey on Hallucination in Large Language Models

4. Evaluating the Factual Accuracy of Summarization

5. How to Reduce Hallucination in Large Language Models: A Survey

6. Factuality Enhanced Language Models for Open-Domain Question Answering

7. Self-Consistency Improves the Reliability of Language Models