論文の概要: Hallucination Cascade: Analyzing Error Propagation in Multi-Agent LLM Systems
- arxiv url: http://arxiv.org/abs/2606.07937v1
- Date: Sat, 06 Jun 2026 01:56:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.54844
- Title: Hallucination Cascade: Analyzing Error Propagation in Multi-Agent LLM Systems
- Title(参考訳): 幻覚カスケード:マルチエージェントLDMシステムにおけるエラー伝播の解析
- Authors: Saeid Jamshidi, Arghavan Moradi Dakhel, Kawser Wazed Nafi, Foutse Khomh,
- Abstract要約: GPT-5.3, DeepSeek-V3, LLaMA-3-70B-Instruct を用いて, 知識領域10のカスケード実験を行った。
より深いカスケードは, 正常化幻覚スコアを第1剤で0.422から最終薬で0.272まで下げることを示した。
この減少は、実際の精度が0.789から0.769に低下し、幻覚抑制と事実保存のトレードオフが明らかになる。
- 参考スコア(独自算出の注目度): 6.047611029478951
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) generate fluent text but remain vulnerable to hallucinations, producing unsupported, inconsistent, and factually incorrect claims. Most prior work treats hallucination as a static property of isolated outputs. In multi-agent LLM systems, however, responses are exchanged across agents, revised through sequential stages, and reused as context for later reasoning. Hallucination, therefore, becomes a dynamic process shaped by interaction history, cascade depth, and model heterogeneity. This paper analyzes hallucination dynamics in multi-agent LLM cascades by tracking claim-level factual inconsistencies across sequential agent interactions. We conduct 500 cascade experiments across 10 knowledge domains using GPT-5.3, DeepSeek-V3, and LLaMA-3-70B-Instruct, yielding 1,250 evaluated responses. Results show that deeper cascades reduce the normalized hallucination score from 0.422 at the first agent to 0.272 at the final agent in 3-agent chains, with an amplification factor of 0.644, indicating net attenuation. This reduction is accompanied by a decline in factual accuracy from 0.789 to 0.769, revealing a trade-off between hallucination suppression and factual preservation. Transition-level analysis shows that each agent-to-agent refinement reduces hallucination by an average of 0.072, with small but consistent losses in factual consistency and response quality. Model-level results reveal reliability-efficiency trade-offs: LLaMA-3-70B-Instruct achieves the lowest hallucination score, whereas GPT-5.3 provides faster generation with a higher hallucination rate. Domain-level analysis shows that hallucination varies with topic complexity, with lower scores in well-grounded scientific domains and higher scores in more abstract domains.
- Abstract(参考訳): 大型言語モデル(LLMs)は、流動的なテキストを生成するが、幻覚、サポートされない、一貫性のない、事実的に間違っているクレームに弱いままである。
ほとんどの先行研究は、幻覚を孤立した出力の静的な性質として扱う。
しかし、マルチエージェントLLMシステムでは、応答はエージェント間で交換され、逐次的に更新され、後続の推論のためにコンテキストとして再利用される。
したがって、幻覚は相互作用の歴史、カスケードの深さ、モデルの不均一性によって形成される動的な過程となる。
本稿では,複数のエージェント間相互作用におけるクレームレベルの事実整合性を追跡することで,マルチエージェントLPMカスケードの幻覚ダイナミクスを解析する。
GPT-5.3, DeepSeek-V3, LLaMA-3-70B-Instruct を用いて, 知識領域10のカスケード実験を行った。
その結果, より深いカスケードは, 正常化幻覚スコアを第1剤で0.422から最終薬で0.272に減少させ, 増幅係数は0.644となり, 純減衰を示した。
この減少は、実際の精度が0.789から0.769に低下し、幻覚抑制と事実保存のトレードオフが明らかになる。
遷移レベルの分析では、各エージェントとエージェントの精製によって幻覚が平均0.072減少し、現実の一貫性と応答品質は小さいが一貫した損失が生じる。
LLaMA-3-70B-Instructは幻覚スコアが最も低く、GPT-5.3は高い幻覚率でより高速な生成を提供する。
領域レベルの分析では、幻覚はトピックの複雑さによって変化し、基礎的な科学領域では低いスコア、より抽象的な領域では高いスコアが変化する。
関連論文リスト
- Collective Hallucination in Multi-Agent LLMs:Modeling and Defense [0.5076419064097734]
大型言語モデル(LLM)における幻覚は、マルチエージェント設定におけるリスクを高める。
本稿では, 相互作用するLLMエージェントのネットワークにまたがるシステムレベルの時間進化過程として幻覚をモデル化する。
本稿では,信頼度重み付けアグリゲーション,適応的影響規制,外部クレーム検証,信頼できないエージェントの選択的分離を組み合わせたインタラクション対応制御手法を提案する。
論文 参考訳(メタデータ) (2026-06-06T02:04:03Z) - HalluScan: A Systematic Benchmark for Detecting and Mitigating Hallucinations in Instruction-Following LLMs [0.0]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにまたがる顕著な機能を示している。
しかし、それらは幻覚に影響を受けやすい - 事実的に不正確で、提供されたコンテキストに反するコンテンツを生成したり、ユーザ指示に反する。
本稿では,72構成の幻覚検出と緩和を体系的に評価する総合ベンチマークフレームワークであるHaluScanを紹介する。
論文 参考訳(メタデータ) (2026-05-04T10:43:27Z) - Detecting AI Hallucinations in Finance: An Information-Theoretic Method Cuts Hallucination Rate by 92% [4.693270291878929]
大規模言語モデル(LLMs)は、流動的だがサポートされていない答え、幻覚を生み出す。
ECLIPSEは,モデルの意味エントロピーと利用可能な証拠の容量とのミスマッチとして幻覚を扱うフレームワークである。
論文 参考訳(メタデータ) (2025-12-02T05:25:48Z) - The Geometry of Truth: Layer-wise Semantic Dynamics for Hallucination Detection in Large Language Models [0.0]
本稿では,幻覚検出のための幾何学的枠組みであるLayer-wise Semantic Dynamicsを提案する。
LSDは本質的にモデルの表現空間内で機能する。
The TruthfulQA and synthetic factual-hallucination datasets。
論文 参考訳(メタデータ) (2025-10-06T15:41:22Z) - MIRAGE-Bench: LLM Agent is Hallucinating and Where to Find Them [52.764019220214344]
幻覚は、大きな言語モデル(LLM)ベースのエージェントに重大なリスクをもたらす。
MIRAGE-Benchは対話型環境における幻覚の抽出と評価のための最初の統一ベンチマークである。
論文 参考訳(メタデータ) (2025-07-28T17:38:29Z) - HalluLens: LLM Hallucination Benchmark [49.170128733508335]
大規模言語モデル(LLM)は、しばしばユーザ入力やトレーニングデータから逸脱する応答を生成する。
本稿では,新たな内因性評価タスクと既存内因性評価タスクを併用した総合幻覚ベンチマークを提案する。
論文 参考訳(メタデータ) (2025-04-24T13:40:27Z) - SelfCheckAgent: Zero-Resource Hallucination Detection in Generative Large Language Models [0.16385815610837165]
SelfCheckAgentは、3つの異なるエージェントを統合する新しいフレームワークである。
これらのエージェントは幻覚検出に対する堅牢な多次元アプローチを提供する。
このフレームワークには三角形戦略も組み込まれており、SelfCheckAgentの強みを高めている。
論文 参考訳(メタデータ) (2025-02-03T20:42:32Z) - ANAH-v2: Scaling Analytical Hallucination Annotation of Large Language Models [65.12177400764506]
大規模言語モデル (LLM) は、様々な領域や広範囲のアプリケーションにまたがる、長い形式の質問応答タスクにおいて幻覚を示す。
現在の幻覚検出と緩和データセットはドメインやサイズによって制限されている。
本稿では,幻覚アノテーションデータセットを同時に,段階的にスケールアップする反復的自己学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-05T17:56:38Z) - Fine-grained Hallucination Detection and Editing for Language Models [109.56911670376932]
大規模言語モデル(LM)は、しばしば幻覚と呼ばれる事実的誤りを引き起こす傾向にある。
我々は,幻覚の包括的分類を導入し,幻覚が多様な形態で現れることを議論する。
本稿では, 幻覚自動検出のための新しいタスクを提案し, 新たな評価ベンチマークであるFavaBenchを構築した。
論文 参考訳(メタデータ) (2024-01-12T19:02:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。