論文の概要: HIVE: Hidden-Evidence Verification for Hallucination Detection in Diffusion Large Language Models
- arxiv url: http://arxiv.org/abs/2604.26139v1
- Date: Tue, 28 Apr 2026 21:57:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.180975
- Title: HIVE: Hidden-Evidence Verification for Hallucination Detection in Diffusion Large Language Models
- Title(参考訳): HIVE:拡散大言語モデルにおける幻覚検出のための隠れ証拠検証
- Authors: Guoshenghui Zhao, Weijie Zhao, Tan Yu,
- Abstract要約: HIVEは、隠された証拠を隠された軌跡から抽出する、隠された証拠検証フレームワークである。
一貫して8つの強いベースラインを上回り、最大0.9236 AUROCと0.9537 AUPRCに達する。
これらの結果から, 軌跡から抽出された隠れた証拠は, 出力のみの不確実性や粗いトレース統計よりも, より強く, より有用な幻覚信号をもたらすことが示唆された。
- 参考スコア(独自算出の注目度): 10.134323514272955
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion large language models generate text through multi-step denoising, where hallucination signals may emerge throughout the trajectory rather than only in the final output. Existing detectors mainly rely on output uncertainty or coarse trace statistics, which often fail to capture the richer hidden dynamics of D-LLMs. We propose HIVE, a hidden-evidence verification framework that extracts compressed hidden evidence from denoising trajectories, selects informative step-layer evidence, and conditions a verifier language model on the selected evidence through prefix embeddings. HIVE produces both a continuous hallucination score from verifier decision logits and structured verification outputs, including hallucination types, evidence pairs, and short rationales. Across two D-LLMs and three QA benchmarks, HIVE consistently outperforms eight strong baselines and achieves up to 0.9236 AUROC and 0.9537 AUPRC. Ablation studies further confirm the importance of hidden-evidence conditioning, learned evidence selection, two-stream evidence representation, and step-layer embeddings. These results suggest that selected hidden evidence from denoising trajectories provides a stronger and more usable hallucination signal than output-only uncertainty or coarse trace statistics.
- Abstract(参考訳): 拡散大言語モデルは、最終出力のみでなく、軌道全体を通して幻覚信号が現れる多段階の認知を通じてテキストを生成する。
既存の検出器は主に出力の不確実性や粗いトレース統計に依存しており、D-LLMのよりリッチな隠れたダイナミクスを捉えることができないことが多い。
提案する隠れ証拠検証フレームワークであるHIVEは,圧縮された隠された証拠を聴覚的軌跡から抽出し,情報的段階的な証拠を選択するとともに,プレフィックス埋め込みによって選択された証拠に対する検証言語モデルを条件とする。
HIVEは、検証者決定ロジットから連続した幻覚スコアと、幻覚タイプ、エビデンスペア、短い合理性を含む構造化された検証出力の両方を生成する。
2つのD-LLMと3つのQAベンチマークで、HIVEは一貫して8つの強いベースラインを上回り、最大0.9236 AUROCと0.9537 AUPRCを達成している。
アブレーション研究は、隠蔽証拠条件付け、学習証拠選択、二流証拠表現、ステップ層埋め込みの重要性をさらに確認する。
これらの結果から, 軌跡から抽出された隠れた証拠は, 出力のみの不確実性や粗いトレース統計よりも, より強く, より有用な幻覚信号をもたらすことが示唆された。
関連論文リスト
- Trust but Verify: Introducing DAVinCI -- A Framework for Dual Attribution and Verification in Claim Inference for Language Models [53.279391576560755]
大規模言語モデル(LLM)は、広範囲のNLPタスクにおいて顕著な流速と汎用性を示してきたが、実際的な不正確さと制限が伴う傾向にある。
これは、信頼と妥当性が最優先される医療、法律、科学コミュニケーションといった、高リスク領域に重大なリスクをもたらす。
LLM出力の事実的信頼性と解釈可能性を高めるために設計されたDAVinCI - Dual Attribution and Verificationフレームワークを紹介する。
論文 参考訳(メタデータ) (2026-04-23T01:37:50Z) - DynHD: Hallucination Detection for Diffusion Large Language Models via Denoising Dynamics Deviation Learning [48.77865928715759]
拡散大言語モデル (D-LLM) は自己回帰モデルに代わる有望な代替品として登場した。
幻覚は 信頼性を損なう重要な問題です
本研究では,これらのギャップを空間的(トケンシーケンス)と時間的(デノナイジングダイナミクス)の両方の観点から橋渡しするDynHDを提案する。
論文 参考訳(メタデータ) (2026-03-17T12:40:29Z) - HAD: HAllucination Detection Language Models Based on a Comprehensive Hallucination Taxonomy [48.68088917291552]
NLGタスクにまたがる11のカテゴリからなる総合的な幻覚分類を導入する。
本稿では,幻覚検出,スパンレベル同定,修正を単一の推論プロセスに統合するHAllucination Detection (HAD)モデルを提案する。
論文 参考訳(メタデータ) (2025-10-22T07:28:37Z) - TraceDet: Hallucination Detection from the Decoding Trace of Diffusion Large Language Models [49.83690850047884]
D-LLMの幻覚問題は未解決のままであり、現実世界のアプリケーションでは信頼性が制限されている。
既存の幻覚検出法はAR-LLM向けに設計されており、単一ステップ生成からの信号に依存している。
本稿では,幻覚検出のためのD-LLMの中間段階を明示的に活用する新しいフレームワークであるTraceDetを提案する。
論文 参考訳(メタデータ) (2025-09-30T02:01:10Z) - ICR Probe: Tracking Hidden State Dynamics for Reliable Hallucination Detection in LLMs [50.18087419133284]
隠れた状態を活用する幻覚検出法は、主に静的および孤立した表現に焦点を当てている。
隠れ状態の更新に対するモジュールの寄与を定量化する新しいメトリック ICR Score を導入する。
本稿では,隠れ状態の層間進化を捉えた幻覚検出手法 ICR Probe を提案する。
論文 参考訳(メタデータ) (2025-07-22T11:44:26Z) - RePPL: Recalibrating Perplexity by Uncertainty in Semantic Propagation and Language Generation for Explainable QA Hallucination Detection [26.186204911845866]
幻覚は大きな言語モデルにとって 重要な障害です
これら2つの側面により不確実性の測定を補正するRePPLを提案する。
提案手法は,様々なQAデータセットにまたがる最高の包括的検出性能を実現する。
論文 参考訳(メタデータ) (2025-05-21T11:23:05Z) - Don't Say What You Don't Know: Improving the Consistency of Abstractive
Summarization by Constraining Beam Search [54.286450484332505]
本研究は,幻覚とトレーニングデータの関連性を解析し,学習対象の要約を学習した結果,モデルが幻覚を呈する証拠を見出した。
本稿では,ビーム探索を制約して幻覚を回避し,変換器をベースとした抽象要約器の整合性を向上させる新しい復号法であるPINOCCHIOを提案する。
論文 参考訳(メタデータ) (2022-03-16T07:13:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。