論文の概要: Evidence Graph Consistency in Retrieval-Augmented Generation: A Model-Dependent Analysis of Hallucination Detection
- arxiv url: http://arxiv.org/abs/2606.06748v1
- Date: Thu, 04 Jun 2026 22:19:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.467461
- Title: Evidence Graph Consistency in Retrieval-Augmented Generation: A Model-Dependent Analysis of Hallucination Detection
- Title(参考訳): 検索拡張生成におけるエビデンスグラフの整合性:幻覚検出のモデル依存解析
- Authors: Jianru Shen,
- Abstract要約: Retrieval-Augmented Generation (RAG) は減少するが、大きな言語モデルでは幻覚を排除しない。
既存の検出方法は、生成された回答と検索されたパスとの平坦な類似性に依存している。
Evidence Graph Consistency (EGC) は,応答毎に局所的なエビデンスグラフを構築するフレームワークである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-Augmented Generation (RAG) reduces but does not eliminate hallucination in large language models. Existing detection methods rely on flat similarity between generated answers and retrieved passages, ignoring structural relationships among evidence pieces and answer claims. We propose Evidence Graph Consistency (EGC), a framework that constructs a local evidence graph per response and computes five structural consistency measures as hallucination indicators. Evaluated on the full question answering split of RAGTruth across six LLMs (5,767 responses), EGC reveals a consistent model-family split: graph consistency features show the expected diagnostic direction for hallucinations in Llama-2 models but exhibit systematic reversal in GPT-4, GPT-3.5, and Mistral-7B. This reversal suggests qualitatively different hallucination patterns across model families and indicates that embedding-based graph consistency cannot serve as a model-independent hallucination detection signal.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) は減少するが、大きな言語モデルでは幻覚を排除しない。
既存の検出方法は、生成された回答と検索されたパスの平坦な類似性に依存しており、証拠の断片と答えのクレームの間の構造的関係を無視している。
Evidence Graph Consistency (EGC) は,応答毎に局所的なエビデンスグラフを構築し,幻覚指標として5つの構造的整合性尺度を算出するフレームワークである。
グラフ整合性は, Llama-2モデルにおける幻覚の診断方向を示すが, GPT-4, GPT-3.5, Mistral-7Bでは体系的逆転を示す。
この逆転は、モデルファミリ間で定性的に異なる幻覚パターンを示し、埋め込みベースのグラフ一貫性がモデル非依存の幻覚検出信号として機能しないことを示す。
関連論文リスト
- HART: Data-Driven Hallucination Attribution and Evidence-Based Tracing for Large Language Models [4.211691393530721]
我々は,大規模言語モデルに対する微細な幻覚の帰属とエビデンス検索の枠組みであるHARTを提案する。
HARTは幻覚追跡を、局所化、メカニズム帰属、エビデンス検索、因果トレースの4段階からなる構造化モデリングタスクとして定式化する。
この定式化に基づいて,幻覚追跡に適した最初の構造化データセットを開発した。
論文 参考訳(メタデータ) (2026-03-06T02:23:55Z) - From Detection to Diagnosis: Advancing Hallucination Analysis with Automated Data Synthesis [7.3390265169910665]
LLM(Large Language Models)における幻覚は、重要なドメインへの信頼性の高いデプロイにおける中核的な障害である。
この限界に対処するため、新たな研究パラダイムが提案され、"検出"から"診断"へと移行した。
論文 参考訳(メタデータ) (2025-12-31T05:06:35Z) - A Graph Signal Processing Framework for Hallucination Detection in Large Language Models [0.0]
事実記述は低周波収束と一貫した「エネルギー山」の挙動を示すが,幻覚型は異なる特徴を示す。
スペクトルシグネチャを用いた単純な検出器は、パープレキシティベースのベースラインに対して 88.75% の精度を達成する。
これらの結果は、スペクトル幾何学が推論パターンや誤りの振る舞いを捉え、大きな言語モデルで検出するためのフレームワークを提供する可能性があることを示唆している。
論文 参考訳(メタデータ) (2025-10-21T22:35:48Z) - Hallucination Detection in LLMs with Topological Divergence on Attention Graphs [60.83579255387347]
幻覚(Halucination)、すなわち、事実的に誤ったコンテンツを生成することは、大きな言語モデルにとって重要な課題である。
本稿では,TOHA (Topology-based HAllucination detector) をRAG設定に導入する。
論文 参考訳(メタデータ) (2025-04-14T10:06:27Z) - Prescribing the Right Remedy: Mitigating Hallucinations in Large Vision-Language Models via Targeted Instruction Tuning [13.805780090705252]
そこで本研究では,異なるモデルの幻覚特異性に合わせたDFTGという命令データ生成フレームワークを提案する。
幻覚ベンチマークによる実験結果から,本手法で生成した目標命令データの方が,従来よりも幻覚の緩和に有効であることが示唆された。
論文 参考訳(メタデータ) (2024-04-16T07:14:32Z) - Demystifying Structural Disparity in Graph Neural Networks: Can One Size
Fit All? [61.35457647107439]
ほとんどの実世界のホモフィルグラフとヘテロフィルグラフは、ホモフィルグラフとヘテロフィルグラフの両方の構造パターンの混合ノードから構成される。
ノード分類におけるグラフニューラルネットワーク (GNN) は, 一般にホモ親和性ノード上で良好に機能することを示す。
次に、GNNに対する厳密で非I.d PAC-Bayesian一般化を提案し、性能格差の理由を明らかにした。
論文 参考訳(メタデータ) (2023-06-02T07:46:20Z) - Counterfactual Intervention Feature Transfer for Visible-Infrared Person
Re-identification [69.45543438974963]
視覚赤外人物再識別タスク(VI-ReID)におけるグラフベースの手法は,2つの問題により,悪い一般化に悩まされている。
十分に訓練された入力特徴は、グラフトポロジーの学習を弱め、推論過程において十分に一般化されない。
本稿では,これらの問題に対処するためのCIFT法を提案する。
論文 参考訳(メタデータ) (2022-08-01T16:15:31Z) - Heterogeneous Graph Neural Networks using Self-supervised Reciprocally
Contrastive Learning [102.9138736545956]
不均一グラフニューラルネットワーク(HGNN)は異種グラフのモデリングと解析において非常に一般的な手法である。
我々は,ノード属性とグラフトポロジの各ガイダンスに関する2つの視点を取り入れた,新規で頑健なヘテロジニアスグラフコントラスト学習手法であるHGCLを初めて開発する。
この新しいアプローチでは,属性とトポロジに関連情報を別々にマイニングする手法として,異なるが最も適した属性とトポロジの融合機構を2つの視点に適用する。
論文 参考訳(メタデータ) (2022-04-30T12:57:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。