論文の概要: Analyzing the Correlation Between Hallucinations and Knowledge Conflicts in Large Language Models
- arxiv url: http://arxiv.org/abs/2606.08705v1
- Date: Sun, 07 Jun 2026 16:03:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.402372
- Title: Analyzing the Correlation Between Hallucinations and Knowledge Conflicts in Large Language Models
- Title(参考訳): 大規模言語モデルにおける幻覚と知識衝突の相関分析
- Authors: Lucrezia Laraspata, Giovanna Castellano, Gennaro Vessio,
- Abstract要約: 幻覚は、Large Language Models(LLM)の最も難しい制限の1つです。
本稿では,LLMにおける知識衝突に関連する内部表現と幻覚行動との関連性について検討する。
- 参考スコア(独自算出の注目度): 9.132493644404445
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hallucinations -- factually incorrect or unverifiable outputs -- remain one of the most challenging limitations of Large Language Models (LLMs), especially in knowledge-intensive tasks. One proposed explanation is internal knowledge conflicts arising from fixed, outdated training data. This paper investigates whether internal representations linked to knowledge conflicts correlate with hallucination behaviors in LLMs. Using probing techniques inspired by two prior works, we analyzed activations from hidden, attention, and MLP layers, as well as output logits, across predefined tasks. We probed LLaMA-3-8B on hallucination detection benchmarks and Falcon-7B on a knowledge conflict dataset. Our findings show that, although conceptually related, hallucination activation patterns cannot be fully reduced to or explained by knowledge conflict representations. Nonetheless, probing proves a robust tool across multiple languages and activation types, supporting its role in improving LLM interpretability. This work advances the broader understanding of hallucinations in LLMs and underscores the value of fine-grained analysis of their internal behavior.
- Abstract(参考訳): 幻覚は、特に知識集約的なタスクにおいて、LLM(Large Language Models)の最も困難な制限の1つとして残っています。
提案されている1つの説明は、固定された時代遅れのトレーニングデータから生じる内部知識の衝突である。
本稿では,LLMにおける知識衝突に関連する内部表現と幻覚行動との関連性について検討する。
従来の2つの作業にインスパイアされた探索手法を用いて、事前に定義されたタスク間での、隠れ層、注意層、MLP層、および出力ロジットからのアクティベーションを分析した。
我々はLLaMA-3-8Bを幻覚検出ベンチマークで、Falcon-7Bを知識衝突データセットで調査した。
以上の結果から,幻覚活性化パターンは,概念上は関連しているものの,知識衝突表現によって完全には説明できないことが示唆された。
それでも、探索は複数の言語やアクティベーションタイプにまたがる堅牢なツールであり、LLMの解釈可能性を改善する役割を担っている。
この研究は、LLMにおける幻覚のより広範な理解を促進し、その内部挙動のきめ細かい分析の価値を浮き彫りにする。
関連論文リスト
- HalluShift++: Bridging Language and Vision through Internal Representation Shifts for Hierarchical Hallucinations in MLLMs [17.130698952440316]
大規模言語モデル(MLLM)における幻覚は、モデル開発プロセスにおいてますます重要になっている。
本稿では,幻覚がMLLMの内部層力学における測定可能な不規則性として現れるという仮説を提案する。
このような修正を導入することで、textsctextscHalluShift++は、テキストベースの大規模言語モデルからの幻覚検出の有効性を広げる。
論文 参考訳(メタデータ) (2025-12-08T16:24:46Z) - Large Language Models Hallucination: A Comprehensive Survey [3.8100688074986095]
大規模言語モデル(LLM)は自然言語処理を変革し、様々なタスクで優れたパフォーマンスを実現している。
派手な派手さは、しばしば幻覚(幻覚)として知られる偽情報や偽情報を生み出すコストが伴う。
この調査は、LSMにおける幻覚の研究を包括的にレビューし、原因、検出、緩和に焦点を当てている。
論文 参考訳(メタデータ) (2025-10-05T20:26:38Z) - Loki's Dance of Illusions: A Comprehensive Survey of Hallucination in Large Language Models [46.71180299830997]
大型言語モデル(LLM)は、実際に正確に見えるが実際に作られた情報を生成することがある。
これらの幻覚の頻度は、ユーザを誤解させ、判断や判断に影響を及ぼす可能性がある。
金融、法律、医療などの分野では、このような誤報が重大な経済的損失、法的紛争、健康リスクを引き起こしている。
論文 参考訳(メタデータ) (2025-06-06T10:50:08Z) - Combating Multimodal LLM Hallucination via Bottom-Up Holistic Reasoning [151.4060202671114]
マルチモーダル大規模言語モデル(MLLM)は、視覚言語タスクを前進させる前例のない能力を示した。
本稿では,MLLMにおける幻覚に対処するためのボトムアップ推論フレームワークを提案する。
本フレームワークは、認識レベル情報と認知レベルコモンセンス知識を検証・統合することにより、視覚とテキストの両方の入力における潜在的な問題に体系的に対処する。
論文 参考訳(メタデータ) (2024-12-15T09:10:46Z) - Rowen: Adaptive Retrieval-Augmented Generation for Hallucination Mitigation in LLMs [88.75700174889538]
幻覚は大きな言語モデル(LLM)にとって大きな課題となる。
実物生成におけるパラメトリック知識の利用は, LLMの限られた知識によって制限される。
本稿では,幻覚出力に対応する適応的検索拡張プロセスによりLLMを強化する新しいフレームワークであるRowenについて述べる。
論文 参考訳(メタデータ) (2024-02-16T11:55:40Z) - Knowledge Verification to Nip Hallucination in the Bud [69.79051730580014]
本研究では、アライメントデータに存在する外部知識と基礎LPM内に埋め込まれた固有の知識との矛盾を検証し、最小化することにより、幻覚を緩和する可能性を示す。
本稿では,知識一貫性アライメント(KCA, Knowledge Consistent Alignment)と呼ばれる新しい手法を提案する。
6つのベンチマークで幻覚を減らし, バックボーンとスケールの異なる基礎的LCMを利用することで, KCAの優れた効果を実証した。
論文 参考訳(メタデータ) (2024-01-19T15:39:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。