論文の概要: DeepResearch-Slice: Bridging the Retrieval-Utilization Gap via Explicit Text Slicing
- arxiv url: http://arxiv.org/abs/2601.03261v1
- Date: Tue, 16 Dec 2025 07:07:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-11 18:48:17.574227
- Title: DeepResearch-Slice: Bridging the Retrieval-Utilization Gap via Explicit Text Slicing
- Title(参考訳): DeepResearch-Slice: 明示的なテキストスライシングによる検索利用ギャップのブリッジ
- Authors: Shuo Lu, Yinuo Xu, Jianjie Cheng, Lingxiao He, Meng Wang, Jian Liang,
- Abstract要約: 本稿では,DeepResearch-Sliceを提案する。
暗黙の注意と異なり、本手法は推論の前に決定論的ハードフィルタを実行するために正確なスパン指標を予測する。
- 参考スコア(独自算出の注目度): 20.480828184335856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep Research agents predominantly optimize search policies to maximize retrieval probability. However, we identify a critical bottleneck: the retrieval-utilization gap, where models fail to use gold evidence even after it is retrieved, due to context blindness in noisy environments. To bridge this gap, we propose DeepResearch-Slice, a simple yet effective neuro-symbolic framework. Unlike implicit attention, our approach predicts precise span indices to perform a deterministic hard filter before reasoning. Extensive evaluations across six benchmarks show substantial robustness gains. Applying our method to frozen backbones yields a 73 percent relative improvement, from 19.1 percent to 33.0 percent, effectively mitigating noise without requiring parameter updates to the reasoning model. These results highlight the need for explicit grounding mechanisms in open-ended research.
- Abstract(参考訳): ディープリサーチエージェントは検索ポリシーを最適化し、検索確率を最大化する。
しかし, 検索・利用ギャップは, モデルが回収後も金の証拠を利用できないため, ノイズの多い環境下でのコンテキストの盲点が原因で, 重要なボトルネックとなっている。
このギャップを埋めるために,我々は,シンプルだが効果的なニューロシンボリック・フレームワークであるDeepResearch-Sliceを提案する。
暗黙の注意と異なり、本手法は推論の前に決定論的ハードフィルタを実行するために正確なスパン指標を予測する。
6つのベンチマークの大規模な評価は、かなりの堅牢性向上を示している。
この手法を冷凍骨に適用すると、19.1%から33.0%の相対的な改善が得られ、推論モデルへのパラメータ更新を必要とせず、効果的にノイズを軽減できる。
これらの結果は,オープンエンド研究における明確な接地機構の必要性を浮き彫りにした。
関連論文リスト
- BrowseComp-Plus: A More Fair and Transparent Evaluation Benchmark of Deep-Research Agent [74.10138164281618]
BrowseComp-Plus(BrowseComp-Plus)は、BrowseCompから派生したベンチマークである。
このベンチマークは、ディープリサーチエージェントと検索方法の総合的な評価とアンタングル解析を可能にする。
論文 参考訳(メタデータ) (2025-08-08T17:55:11Z) - Learning to Extract Rational Evidence via Reinforcement Learning for Retrieval-Augmented Generation [37.47571308389908]
Retrieval-Augmented Generation (RAG) はLarge Language Models (LLM) の精度を効果的に向上させる
それまでの手法では、明確な思考なしに証拠を直接抽出し、重要な手がかりをフィルタリングし、一般化に苦慮する危険性がある。
本稿では,(1)検索内容中の潜在的手がかりを明示的に推論し,(2)質問に答えるのに有用なキー手がかりを省略しないよう意識的に抽出することによる合理的証拠の抽出を学習するEvi Omniを提案する。
論文 参考訳(メタデータ) (2025-07-21T13:03:55Z) - Benchmarking Reasoning Robustness in Large Language Models [76.79744000300363]
新規データや不完全データでは,性能が著しく低下することがわかった。
これらの結果は、厳密な論理的推論に対するリコールへの依存を浮き彫りにした。
本稿では,情報不足によって引き起こされる幻覚を利用して推論ギャップを明らかにする,Math-RoBと呼ばれる新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-03-06T15:36:06Z) - DeepRAG: Thinking to Retrieve Step by Step for Large Language Models [92.87532210660456]
我々はマルコフ決定過程(MDP)として検索強化推論をモデル化するDeepRAGを提案する。
クエリを反復的に分解することで、DeepRAGは外部知識を取得するか、あるいは各ステップでパラメトリック推論に依存するかを動的に決定する。
実験の結果,DeepRAGは検索効率を向上し,回答精度を26.4%向上させ,検索強化推論の有効性を示した。
論文 参考訳(メタデータ) (2025-02-03T08:22:45Z) - Efficient and Robust Point Cloud Registration via Heuristics-guided Parameter Search [44.774302677330105]
配置された3次元対応セットに基づいて6自由度で剛性変換を推定することは、点雲登録において決定的な手順である。
本稿では,高ロバスト性を維持しつつ,探索を高速化するパラメータ探索戦略を提案する。
我々の戦略は検索スペースを大幅に減らし、少数のインサイレントサンプルで精度を保証できる。
論文 参考訳(メタデータ) (2024-04-09T09:28:05Z) - Self-Evaluation Guided Beam Search for Reasoning [61.523627290397556]
我々は,Large Language Model (LLM) の推論プロセスのガイドと校正を行うための段階的自己評価機構を導入する。
本稿では,ビームサーチによる自己評価ガイダンスを統合した復号アルゴリズムを提案する。
我々のアプローチは、GSM8K、AQuA、StrategyQAにおいて、対応するCodexバックボンドベースラインをわずかに精度6.34%、9.56%、および5.46%で上回る。
論文 参考訳(メタデータ) (2023-05-01T02:37:59Z) - Efficient First-Order Contextual Bandits: Prediction, Allocation, and
Triangular Discrimination [82.52105963476703]
統計的学習、オンライン学習、その他における繰り返しのテーマは、低騒音の問題に対してより速い収束率が可能であることである。
1次保証は統計的およびオンライン学習において比較的よく理解されている。
三角識別と呼ばれる対数損失と情報理論量が一階保証を得る上で基本的な役割を担っていることを示す。
論文 参考訳(メタデータ) (2021-07-05T19:20:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。