論文の概要: FIDES: Faithful Inference via Deep Evidence Signals for Retrieval-Memory Conflict in RAG
- arxiv url: http://arxiv.org/abs/2606.05644v1
- Date: Thu, 04 Jun 2026 03:16:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.51634
- Title: FIDES: Faithful Inference via Deep Evidence Signals for Retrieval-Memory Conflict in RAG
- Title(参考訳): FIDES:RAGにおける検索記憶競合に対する深い証拠信号による忠実な推論
- Authors: Zhe Yu, Wenpeng Xing, Tiancheng Zhao, Mohan Li, Changting Lin, Meng Han,
- Abstract要約: コントラストデコーディングは、パラメトリックバイアスを抑制するために文脈条件付き出力を増幅する。
単一のグローバルな対照的な重みは、真に矛盾したトークンを不十分に修正しながら、安全なトークンを過払いする。
本研究では,学習不要なデコーダであるFIDESを提案する。
- 参考スコア(独自算出の注目度): 28.69005193011498
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When retrieved evidence contradicts parametric memory, language models frequently ignore context and default to memorized priors -- a failure that undermines the core purpose of retrieval augmentation. Contrastive decoding amplifies the context-conditioned output to suppress parametric bias, but existing methods rest on an implicit assumption that this bias is uniform across tokens. A single global contrastive weight over-penalizes safe tokens while leaving genuinely conflicted ones insufficiently corrected. We identify token-level conflict concentration: retrieval-memory tension is sharply heterogeneous, concentrated on a small fraction of answer-critical decoding steps. This reframes contrastive decoding from how much contrast to apply to where to apply it. We propose FIDES (Faithful Inference via Deep Evidence Signals), a training-free decoder that reads three internal signals probing retrieval-memory conflict at complementary depths -- output surface, hidden representations, and prediction trajectory -- and fuses them to govern intervention strength at each decoding step. Across three benchmarks and six backbones -- four primary 7B/8B models and two scaling backbones up to 70B -- FIDES achieves the best context fidelity in all 18 settings, outperforming the strongest training-free baseline by +3 to +13 points. On the 70B scale, fidelity reaches 92-94% while F1 surges to 62-63%, demonstrating that token-level selectivity unlocks generation capability that coarse contrastive rules suppress.
- Abstract(参考訳): 検索されたエビデンスがパラメトリックメモリと矛盾する場合、言語モデルは、しばしばコンテキストを無視し、記憶された事前をデフォルトにします。
対照的な復号法は、パラメトリックバイアスを抑制するために文脈条件付き出力を増幅するが、既存の手法はこのバイアスがトークン全体にわたって均一であるという暗黙の仮定に基づいている。
単一のグローバルな対照的な重みは、真に矛盾したトークンを不十分に修正しながら、安全なトークンを過払いする。
我々はトークンレベルのコンフリクト濃度を同定する: 検索メモリのテンションは急激に均一であり、少数の応答クリティカルデコードステップに集中する。
これは、どの程度のコントラストを適用するかから、コントラスト的にデコーディングされる。
提案するFIDES(Faithful Inference via Deep Evidence Signals)は,検索メモリ競合を補完する3つの内部信号(出力面,隠れ表現,予測軌道)を読み取る学習自由復号器であり,各復号ステップにおける干渉強度を制御するために融合する。
3つのベンチマークと6つのバックボーン -- 4つの主要7B/8Bモデルと2つのスケーリングバックボーン - FIDESは18設定すべてで最高のコンテキスト忠実性を実現し、+3から+13ポイントのトレーニングなしベースラインを上回っている。
70Bスケールでは、F1は62-63%まで上昇する一方、F1は92-94%に達する。
関連論文リスト
- MemReranker: Reasoning-Aware Reranking for Agent Memory Retrieval [37.54115468116941]
本報告では,Qwen3-Reranker を用いた多段 LLM 知識蒸留によるリグレードモデルファミリ MemReranker (0.6B/4B) について紹介する。
メモリ検索ベンチマークでは、MemReranker-0.6BはBGE-Rerankerを大きく上回り、オープンソースの4B/8BモデルとGPT-4o-miniをキーメトリクスでマッチングする。
MemReranker-4B はさらに 0.737 MAP を達成し、Gemini-3-Flash と同等のメトリクスを持つ一方で、推論遅延を10-20%の大型モデルで維持している。
論文 参考訳(メタデータ) (2026-05-07T12:33:57Z) - Hit-RAG: Learning to Reason with Long Contexts via Preference Alignment [97.55382322103986]
Hit-RAGは認知的ボトルネックを解決するために設計された多段階の優先順位調整フレームワークである。
本手法は,3つの異なる段階を通じて外部証拠の利用を体系的に改善する。
論文 参考訳(メタデータ) (2026-03-07T04:05:27Z) - CORE: Context-Robust Remasking for Diffusion Language Models [51.59514489363897]
我々は、推論時リビジョンのためのトレーニング不要フレームワークであるContext-Robust Remasking (CORE)を提案する。
静的トークンの確率を信頼するのではなく、COREは、ターゲットとなるマスク付きコンテキストの摂動に対する感受性を示すことによって、コンテキスト不安定なトークンを識別する。
LLaDA-8B-Baseでは、COREは推論とコードベンチマークの間で一貫した改善を行い、計算に適合したベースラインを上回り、MBPPを最大9.2%改善した。
論文 参考訳(メタデータ) (2026-02-04T00:12:30Z) - Seeing through the Conflict: Transparent Knowledge Conflict Handling in Retrieval-Augmented Generation [12.469991196570106]
TCR (Transparent Conflict Resolution) は、二重コントラストエンコーダを介して意味マッチングと事実整合性を切り離す。
知識ギャップリカバリを+21.4ppで増加させ、誤解を招くコンテキストオーバーライドを-29.3ppで削減し、パラメータは0.3%に留まる。
信号は人間の判断と一致し、時間的決定パターンを明らかにする。
論文 参考訳(メタデータ) (2026-01-11T10:08:49Z) - MARS-Sep: Multimodal-Aligned Reinforced Sound Separation [72.85468563236005]
MARS-Sepは音分離のための強化学習フレームワークである。
クリッピングされた信頼領域サロゲートによって最適化された、ファクタライズされたベータマスクポリシを学ぶ。
複数のベンチマークの実験は、テキスト、オーディオ、イメージ-キュード分離において一貫した利得を示している。
論文 参考訳(メタデータ) (2025-10-12T09:05:28Z) - CLUE: Non-parametric Verification from Experience via Hidden-State Clustering [64.50919789875233]
隠れアクティベーションの軌跡内の幾何的に分離可能なシグネチャとして解の正しさが符号化されていることを示す。
ClUE は LLM-as-a-judge ベースラインを一貫して上回り、候補者の再選において近代的な信頼に基づく手法に適合または超えている。
論文 参考訳(メタデータ) (2025-10-02T02:14:33Z) - VOGUE: Guiding Exploration with Visual Uncertainty Improves Multimodal Reasoning [62.09195763860549]
検証可能な報酬(RLVR)による強化学習は、大きな言語モデル(LLM)の推論を改善するが、探索に苦労する。
出力(テキスト)から入力(視覚)空間へ探索をシフトする新しい手法である$textbfVOGUE(Visual Uncertainty Guided Exploration)を紹介した。
本研究は,視覚入力の本質的不確実性における基盤探索が,マルチモーダル推論を改善するための効果的な戦略であることを示す。
論文 参考訳(メタデータ) (2025-10-01T20:32:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。