hallucinations

Dans le contexte de l’IA, une hallucination se réfère à un modèle générant des résultats qui semblent plausibles mais qui sont factuellement incorrects ou insensés, souvent présentés avec une grande confiance.

🌐 Termes dans d'autres langues:

English Deutsch Español Français 日本語 한국어 Polski Português Русский Türkçe Українська

Les hallucinations sont un défi important dans le développement et le déploiement des modèles d'IA, en particulier les grands modèles de langage (LLM). Elles se produisent lorsqu'un modèle génère des informations qui ne sont pas basées sur ses données d'entraînement ou le contexte fourni. Cela peut se manifester par des faits inventés, des informations déformées ou des sorties qui sont incohérentes en interne. La propension à l'hallucination varie en fonction de l'architecture du modèle, des données d'entraînement et de la tâche spécifique qu'il effectue.

Ces erreurs peuvent aller d'inexactitudes mineures à des détails complètement inventés. La gravité des hallucinations peut avoir de graves conséquences, en particulier dans les applications où la précision est essentielle, telles que le diagnostic médical, la recherche juridique ou l'analyse financière. Les chercheurs travaillent activement sur des techniques pour atténuer les hallucinations, notamment des méthodes d'entraînement améliorées, une meilleure curation des données et des mécanismes de vérification des faits.

        graph LR
  Center["hallucinations"]:::main
  Pre_computer_science["computer-science"]:::pre --> Center
  click Pre_computer_science "/terms/computer-science"
  Rel_hallucination["hallucination"]:::related -.-> Center
  click Rel_hallucination "/terms/hallucination"
  Rel_artificial_intelligence["artificial-intelligence"]:::related -.-> Center
  click Rel_artificial_intelligence "/terms/artificial-intelligence"
  Rel_large_language_model["large-language-model"]:::related -.-> Center
  click Rel_large_language_model "/terms/large-language-model"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

🕸️ Open in Universe

🧠 Test de connaissances

1 / 3

🧒 Explique-moi comme si j'avais 5 ans

Les hallucinations de l'IA, c'est un peu comme quand un robot te dit avec assurance quelque chose qui a l'air vrai, mais qui est en fait inventé ou faux, par exemple s'il dit que les chiens peuvent voler parce qu'il a mélangé des histoires qu'il a entendues.

🤓 Expert Deep Dive

Les hallucinations de l'IA représentent un mode de défaillance des modèles génératifs, résultant d'un écart entre la représentation interne apprise par le modèle et la réalité objective ou l'exactitude factuelle. Sur le plan architectural, les LLM entraînés uniquement sur la prédiction du prochain token peuvent sur-apprendre des corrélations fallacieuses dans les données d'entraînement ou extrapoler au-delà de leurs limites de connaissances. Cela peut se manifester par la génération d'affirmations factuelles plausibles mais fausses, l'invention d'entités ou d'événements inexistants, ou l'attribution erronée d'informations. Les techniques visant à atténuer les hallucinations comprennent : 1) l'amélioration de la qualité et de la diversité des données pour réduire le bruit et les biais. 2) l'utilisation de la génération augmentée par récupération (RAG), où le modèle récupère des informations pertinentes d'une base de connaissances externe avant de générer une réponse, ancrant ainsi la sortie. 3) l'application de méthodes de quantification de l'incertitude pour estimer la confiance des énoncés générés. 4) le réglage fin avec retour humain (RLHF) pénalisant spécifiquement les inexactitudes factuelles. 5) la contrainte du processus de génération par des règles logiques ou des graphes de connaissances. Le défi réside dans l'équilibre entre la réduction des hallucinations et le maintien de la fluidité, de la créativité et de la capacité du modèle à gérer des invites nouvelles ou sous-spécifiées.

🔗 Termes associés

Prérequis:

computer-science

📚 Sources

1. Training Language Models to Follow Instructions with Reinforcement Learning

2. Hallucinations in Large Language Models

3. A Survey on Hallucination in Large Language Models

4. Evaluating the Factual Accuracy of Summarization

5. How to Reduce Hallucination in Large Language Models: A Survey

6. Factuality Enhanced Language Models for Open-Domain Question Answering

7. Self-Consistency Improves the Reliability of Language Models