論文の概要: SPAD: Seven-Source Token Probability Attribution with Syntactic Aggregation for Detecting Hallucinations in RAG
- arxiv url: http://arxiv.org/abs/2512.07515v1
- Date: Mon, 08 Dec 2025 12:50:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.891898
- Title: SPAD: Seven-Source Token Probability Attribution with Syntactic Aggregation for Detecting Hallucinations in RAG
- Title(参考訳): SPAD:RAGの幻覚検出のための構文アグリゲーションによる7ソーストークン確率の寄与
- Authors: Pengqian Lu, Jie Lu, Anjin Liu, Guangquan Zhang,
- Abstract要約: 本研究では,検索した文脈における幻覚検出システムであるSPADを紹介する。
我々は、各トークンの確率を7つの異なる情報源に数学的に分類する。
この属性は、各ソースが現在のトークンの生成にどのように貢献するかを定量化する。
POSタグでこれらのスコアを集約し、異なるコンポーネントが特定の言語カテゴリをどう駆動するかを定量化します。
- 参考スコア(独自算出の注目度): 22.728635614354612
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting hallucinations in Retrieval-Augmented Generation (RAG) remains a challenge. Prior approaches attribute hallucinations to a binary conflict between internal knowledge (stored in FFNs) and retrieved context. However, this perspective is incomplete, failing to account for the impact of other components in the generative process, such as the user query, previously generated tokens, the current token itself, and the final LayerNorm adjustment. To address this, we introduce SPAD. First, we mathematically attribute each token's probability into seven distinct sources: Query, RAG, Past, Current Token, FFN, Final LayerNorm, and Initial Embedding. This attribution quantifies how each source contributes to the generation of the current token. Then, we aggregate these scores by POS tags to quantify how different components drive specific linguistic categories. By identifying anomalies, such as Nouns relying on Final LayerNorm, SPAD effectively detects hallucinations. Extensive experiments demonstrate that SPAD achieves state-of-the-art performance
- Abstract(参考訳): Retrieval-Augmented Generation (RAG)における幻覚の検出は依然として課題である。
以前のアプローチでは、幻覚は内部知識(FFNに格納された)と検索された文脈の間の二項衝突に起因している。
しかし、この観点は不完全であり、ユーザクエリ、以前に生成されたトークン、現在のトークン自体、最終的なLayerNorm調整など、生成プロセスにおける他のコンポーネントの影響を考慮できない。
この問題に対処するため、SPADを紹介します。
まず、各トークンの確率を、Query、RAG、Path、Current Token、FFN、Final LayerNorm、Initial Embeddingの7つの異なるソースに数学的に分類する。
この属性は、各ソースが現在のトークンの生成にどのように貢献するかを定量化する。
そして、これらのスコアをPOSタグで集約し、異なるコンポーネントが特定の言語カテゴリーをどう駆動するかを定量化する。
ファイナルレイヤNormに依存する名詞などの異常を識別することで、SPADは幻覚を効果的に検出する。
SPADによる最先端性能の実証実験
関連論文リスト
- Causality $\neq$ Decodability, and Vice Versa: Lessons from Interpreting Counting ViTs [6.622603488436762]
物体計数のために微調整された視覚変換器(ViT)の関係について検討する。
アクティベーションパッチを用いて,空間トークンとCLSトークンの因果的役割を検証した。
我々は、異なる深さでカウント情報の復調性を評価するために線形プローブを訓練する。
論文 参考訳(メタデータ) (2025-10-10T18:59:03Z) - OPERA: Alleviating Hallucination in Multi-Modal Large Language Models
via Over-Trust Penalty and Retrospection-Allocation [124.9008419182485]
OPERA(Over-trust PenaltyとRetrospection-Allocation戦略に基づく新しいMLLM復号法)を提案する。
私たちのアプローチは、ほとんどの幻覚は自己注意行列の知識集約パターンと密接に結びついているという興味深い観察から始まります。
この観察に基づいて、OPERAは、ビーム探索復号時にモデルロジットにペナルティ項を導入し、オーバートラスト問題を緩和する。
論文 参考訳(メタデータ) (2023-11-29T18:57:07Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - Latent-OFER: Detect, Mask, and Reconstruct with Latent Vectors for
Occluded Facial Expression Recognition [0.0]
提案手法は, 顔の隠蔽部分を, 隠蔽されていないかのように検出し, 認識し, FER精度を向上する。
まず、視覚変換器(ViT)ベースのオクルージョンパッチ検出器は、隠蔽されたパッチから潜在ベクトルのみを訓練することで、隠蔽された位置をマスクする。
第2に、ハイブリッド再構成ネットワークは、ViTと畳み込みニューラルネットワーク(CNN)を用いて、完全な画像としてマスキング位置を生成する。
最後に、式関連潜時ベクトル抽出器は、CNNに基づくクラスアクティベーションマップを適用して、すべての潜時ベクトルから式関連情報を検索し、使用する。
論文 参考訳(メタデータ) (2023-07-21T07:56:32Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - Discriminator-Free Generative Adversarial Attack [87.71852388383242]
生成的ベースの敵攻撃は、この制限を取り除くことができる。
ASymmetric Saliency-based Auto-Encoder (SSAE) は摂動を生成する。
SSAEが生成した敵の例は、広く使われているモデルを崩壊させるだけでなく、優れた視覚的品質を実現する。
論文 参考訳(メタデータ) (2021-07-20T01:55:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。