論文の概要: Modeling Uncertainty Trends for Timely Retrieval in Dynamic RAG
- arxiv url: http://arxiv.org/abs/2511.09980v1
- Date: Fri, 14 Nov 2025 01:23:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.618475
- Title: Modeling Uncertainty Trends for Timely Retrieval in Dynamic RAG
- Title(参考訳): 動的RAGにおける時間検索の不確かさのモデリング
- Authors: Bo Li, Tian Tian, Zhenghua Xu, Hao Cheng, Shikun Zhang, Wei Ye,
- Abstract要約: 本稿では,トークンレベルの不確実性のダイナミクスをモデル化し,最適検索タイミングを決定するトレーニングフリーな手法であるEntropy-Trend Constraint(ETC)を紹介する。
ETCは、検索周波数を減少させながら、強いベースラインを一貫して上回る。
プラグアンドプレイで、モデルに依存しず、既存のデコードパイプラインに簡単に統合できる。
- 参考スコア(独自算出の注目度): 35.96258615258145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dynamic retrieval-augmented generation (RAG) allows large language models (LLMs) to fetch external knowledge on demand, offering greater adaptability than static RAG. A central challenge in this setting lies in determining the optimal timing for retrieval. Existing methods often trigger retrieval based on low token-level confidence, which may lead to delayed intervention after errors have already propagated. We introduce Entropy-Trend Constraint (ETC), a training-free method that determines optimal retrieval timing by modeling the dynamics of token-level uncertainty. Specifically, ETC utilizes first- and second-order differences of the entropy sequence to detect emerging uncertainty trends, enabling earlier and more precise retrieval. Experiments on six QA benchmarks with three LLM backbones demonstrate that ETC consistently outperforms strong baselines while reducing retrieval frequency. ETC is particularly effective in domain-specific scenarios, exhibiting robust generalization capabilities. Ablation studies and qualitative analyses further confirm that trend-aware uncertainty modeling yields more effective retrieval timing. The method is plug-and-play, model-agnostic, and readily integrable into existing decoding pipelines. Implementation code is included in the supplementary materials.
- Abstract(参考訳): 動的検索拡張生成(RAG)により、大規模言語モデル(LLM)はオンデマンドで外部の知識を引き出すことができ、静的RAGよりも適応性が高い。
この設定における中心的な課題は、検索の最適なタイミングを決定することである。
既存の方法では、トークンレベルの信頼性の低い検索をトリガーすることが多く、エラーが既に伝播した後に介入が遅れる可能性がある。
本稿では,トークンレベルの不確実性のダイナミクスをモデル化し,最適検索タイミングを決定するトレーニングフリーな手法であるEntropy-Trend Constraint(ETC)を紹介する。
具体的には、ETCはエントロピーシーケンスの1次と2次の違いを利用して、出現する不確実性トレンドを検出し、より早くより正確な検索を可能にする。
3つのLCMバックボーンを持つ6つのQAベンチマークの実験では、ETCは検索周波数を減少させながら、強いベースラインを一貫して上回ることを示した。
ETCは特にドメイン固有のシナリオで有効であり、堅牢な一般化能力を示す。
アブレーション研究と定性的分析により、トレンド認識の不確実性モデリングがより効果的な検索タイミングをもたらすことがさらに確認される。
この方法はプラグアンドプレイであり、モデルに依存しず、既存のデコードパイプラインに容易に統合可能である。
追加資料には実装コードが含まれている。
関連論文リスト
- A Weak Penalty Neural ODE for Learning Chaotic Dynamics from Noisy Time Series [7.01848433242846]
本稿では,データ駆動時系列予測モデルの古典的強い定式化を補完する手法として弱い定式化を提案する。
Weak-Penalty NODE (WP-NODE) と呼ばれるこのトレーニング戦略は,ベンチマークカオス力学系における最先端予測精度と例外的ロバスト性を実現する。
論文 参考訳(メタデータ) (2025-11-10T01:40:35Z) - Abstain Mask Retain Core: Time Series Prediction by Adaptive Masking Loss with Representation Consistency [4.047219770183742]
時系列予測はエネルギー管理や金融市場といった重要な領域において重要な役割を担っている。
本研究は, 履歴データを適切に切り詰めることによって予測精度を向上させるという, 直感に反する現象を明らかにする。
本稿では,適応的マスキング・ロス(Adaptive Masking Loss)と表現整合性(Representation Consistency)を提案する。
論文 参考訳(メタデータ) (2025-10-22T19:23:53Z) - Dynamic Temporal Positional Encodings for Early Intrusion Detection in IoT [3.6686692131754834]
IoT(Internet of Things)の急速な拡張は、重大なセキュリティ上の課題をもたらしている。
従来の侵入検知システム(IDS)は、しばしばネットワークトラフィックの時間的特性を見落としている。
動的時間的位置エンコーディングを組み込んだトランスフォーマーを用いた早期侵入検知システム(EIDS)を提案する。
論文 参考訳(メタデータ) (2025-06-22T17:56:19Z) - Chain-of-Retrieval Augmented Generation [91.02950964802454]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z) - UncertaintyRAG: Span-Level Uncertainty Enhanced Long-Context Modeling for Retrieval-Augmented Generation [93.38604803625294]
IncertaintyRAG, a novel approach for long-context Retrieval-Augmented Generation (RAG)について紹介する。
我々は、SNR(Signal-to-Noise Ratio)ベースのスパン不確実性を用いて、テキストチャンク間の類似性を推定する。
不確かさRAGはLLaMA-2-7Bでベースラインを2.03%上回り、最先端の結果を得る。
論文 参考訳(メタデータ) (2024-10-03T17:39:38Z) - Selective Learning: Towards Robust Calibration with Dynamic Regularization [79.92633587914659]
ディープラーニングにおけるミススキャリブレーションとは、予測された信頼とパフォーマンスの間には相違がある、という意味である。
トレーニング中に何を学ぶべきかを学ぶことを目的とした動的正規化(DReg)を導入し、信頼度調整のトレードオフを回避する。
論文 参考訳(メタデータ) (2024-02-13T11:25:20Z) - A Conditioned Unsupervised Regression Framework Attuned to the Dynamic Nature of Data Streams [0.0]
本稿では,制限付きラベル付きデータを用いたストリーミング環境の最適戦略を提案し,教師なし回帰のための適応手法を提案する。
提案手法は,初期ラベルのスパースセットを活用し,革新的なドリフト検出機構を導入する。
適応性を高めるために,Adaptive WINdowingアルゴリズムとRoot Mean Square Error (RMSE)に基づく誤り一般化アルゴリズムを統合する。
論文 参考訳(メタデータ) (2023-12-12T19:23:54Z) - Stochastically forced ensemble dynamic mode decomposition for
forecasting and analysis of near-periodic systems [65.44033635330604]
本稿では,観測力学を強制線形系としてモデル化した新しい負荷予測手法を提案する。
固有線型力学の利用は、解釈可能性やパーシモニーの観点から、多くの望ましい性質を提供することを示す。
電力グリッドからの負荷データを用いたテストケースの結果が提示される。
論文 参考訳(メタデータ) (2020-10-08T20:25:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。