幻覚

AIの文脈では、幻覚は、信頼性の高い結果を生成するモデルを指しますが、事実上不正確または無意味であり、しばしば高い自信を持って提示されます。

Hallucinationは、AIモデル、特に大規模言語モデル(LLM)の開発と展開における大きな課題です。これは、モデルがトレーニングデータや提供されたコンテキストに根拠のない情報を生成する際に発生します。これは、捏造された事実、歪んだ情報、または内部的に矛盾する出力として現れる可能性があります。Hallucinationの傾向は、モデルのアーキテクチャ、トレーニングデータ、および実行している特定のタスクによって異なります。

これらのエラーは、軽微な不正確さから完全に捏造された詳細まで多岐にわたります。Hallucinationの深刻さは、特に医療診断、法的調査、または財務分析など、精度が重要なアプリケーションにおいて深刻な結果をもたらす可能性があります。研究者は、改善されたトレーニング方法、より良いデータキュレーション、および事実確認と検証のためのメカニズムなど、Hallucinationを軽減するための技術を積極的に研究しています。

        graph LR
  Center["幻覚"]:::main
  Pre_computer_science["computer-science"]:::pre --> Center
  click Pre_computer_science "/terms/computer-science"
  Rel_hallucination["hallucination"]:::related -.-> Center
  click Rel_hallucination "/terms/hallucination"
  Rel_artificial_intelligence["artificial-intelligence"]:::related -.-> Center
  click Rel_artificial_intelligence "/terms/artificial-intelligence"
  Rel_large_language_model["large-language-model"]:::related -.-> Center
  click Rel_large_language_model "/terms/large-language-model"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

      

🧠 理解度チェック

1 / 3

🧒 5歳でもわかるように説明

AIのハルシネーションというのは、ロボットが自信満々に、本当らしく聞こえるけど実はでっち上げだったり間違っていたりすることを話すようなものです。例えば、聞いた話を混同して「犬は空を飛べるよ」と言ってしまうような感じです。

🤓 Expert Deep Dive

AIのハルシネーション(幻覚)は、生成モデルにおける一種の失敗モードであり、モデルが学習した内部表現と客観的な現実や事実との不一致に起因します。アーキテクチャ的には、次のトークン予測のみで学習されたLLMは、学習データ中の偽の相関に過学習したり、知識の境界を超えて外挿したりする可能性があります。これは、もっともらしく聞こえるが誤った事実主張の生成、存在しないエンティティやイベントの捏造、情報の誤った帰属といった形で現れることがあります。ハルシネーションを軽減するための技術には、以下のようなものがあります。1) ノイズやバイアスを減らすためのデータ品質と多様性の向上。2) 外部知識ベースから関連情報を検索してから応答を生成することで、出力を根拠づける、検索拡張生成(RAG)の採用。3) 生成されたステートメントの信頼度を推定するための不確実性定量化手法の使用。4) 事実の不正確さを特に罰する人間からのフィードバック(RLHF)によるファインチューニング。5) 論理規則や知識グラフによる生成プロセスの制約。課題は、ハルシネーションの低減と、モデルの流暢さ、創造性、そして新規または不明確なプロンプトを処理する能力の維持とのバランスを取ることです。

🔗 関連用語

前提知識:

📚 出典