論文の概要: DualSpec: Accelerating Deep Research Agents via Dual-Process Action Speculation
- arxiv url: http://arxiv.org/abs/2603.07416v1
- Date: Sun, 08 Mar 2026 02:03:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.497683
- Title: DualSpec: Accelerating Deep Research Agents via Dual-Process Action Speculation
- Title(参考訳): DualSpec:Dual-Process Action Speculationによるディープリサーチエージェントの高速化
- Authors: Shuzhang Zhong, Baotong Lu, Qi Chen, Chuanjie Liu, Fan Yang, Meng Li,
- Abstract要約: 推論フレームワークは、推論でアクションの実行を重複させることでレイテンシを低減することを目的としている。
既存のアプローチは通常、一様投機戦略と厳密なアクションマッチングに依存している。
軽量な信頼性に基づくセマンティック検証機能を備えた異種投機フレームワークであるDualSpecを提案する。
- 参考スコア(独自算出の注目度): 10.076688905947103
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language model-based deep research agents have been increasingly popular for addressing long-horizon information-seeking tasks, but they often incur high end-to-end latency due to extensive reasoning and frequent tool use. Speculation frameworks aim to reduce latency by overlapping action execution with reasoning; however, existing approaches typically rely on uniform speculation strategies and strict action matching, which limits inference speedups and robustness. In this work, we revisit the speculate-verify paradigm for deep research agents through the lens of action heterogeneity. We show that \textit{Search} and \textit{Visit} actions exhibit fundamentally different reasoning and model capacity requirements: entropy-based analysis reveals that Search decisions have higher uncertainty and benefit significantly from explicit reasoning, whereas Visit decisions have lower entropy and depend primarily on model capacity. Motivated by this dual-process characteristic, we propose DualSpec, a heterogeneous speculation framework equipped with a lightweight, confidence-based semantic verifier. Experiments across multiple models and benchmarks demonstrate that DualSpec achieves up to 3.28$\times$ end-to-end speedup while maintaining accuracy comparable to fully reasoning agents.
- Abstract(参考訳): 大規模言語モデルに基づくディープリサーチエージェントは、長い水平情報探索タスクに対処するために人気が高まっているが、広範囲な推論と頻繁なツール使用のために、しばしばエンドツーエンドの遅延が発生する。
推論フレームワークは、推論と重なり合うアクション実行によってレイテンシを低減することを目的としているが、既存のアプローチでは、推論のスピードアップとロバスト性を制限する、一様の投機戦略と厳密なアクションマッチングに依存するのが一般的である。
本研究では, 深部研究エージェントに対する投機的検証パラダイムを, アクションの不均一性のレンズを通して再検討する。
エントロピーに基づく分析では、検索決定は明確な推論から高い不確実性を持ち、利点は大きいが、訪問決定はエントロピーが低く、主にモデルキャパシティに依存している。
このデュアルプロセス特性に触発されたDualSpecは、軽量な信頼性に基づくセマンティック検証機能を備えた異種投機フレームワークである。
複数のモデルやベンチマークでの実験では、DualSpecは最大3.28$\times$ end-to-endのスピードアップを実現し、完全推論エージェントに匹敵する精度を維持している。
関連論文リスト
- Think Longer to Explore Deeper: Learn to Explore In-Context via Length-Incentivized Reinforcement Learning [53.58654277639939]
文脈内探索(In-context Exploring)は、単一の連続した文脈内で仮説を生成、検証、洗練する本質的な能力である。
本稿では,モデルにさらなる探索を促すLongth-Incentivized Explorationを提案する。
提案手法は、ドメイン内タスクの平均4.4%改善と、ドメイン外ベンチマークの2.7%向上を実現している。
論文 参考訳(メタデータ) (2026-02-12T09:24:32Z) - ConfSpec: Efficient Step-Level Speculative Reasoning via Confidence-Gated Verification [0.2578242050187029]
ステップレベルの投機的推論はこのコストを軽減することを目的としていますが、既存のアプローチは長年のトレードオフに直面しています。
我々は、このトレードオフを解決する信頼性の高いケースケード検証フレームワークConfSpecを提案する。
論文 参考訳(メタデータ) (2026-01-28T05:58:05Z) - Adversarial Yet Cooperative: Multi-Perspective Reasoning in Retrieved-Augmented Language Models [72.4149653187766]
本稿ではAdrialversa Reasoning RAG(ARR)というReasoner-Verifierフレームワークを提案する。
ReasonerとVerifierは、回収された証拠を推論し、プロセス認識の利点によってガイドされながら、互いの論理を批判する。
複数のベンチマーク実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2026-01-08T06:57:03Z) - ParallelMuse: Agentic Parallel Thinking for Deep Information Seeking [59.65564262588308]
並列思考は探索範囲を広げ、情報探索(IS)エージェントの深い探索を補完する。
ディープISエージェント用に設計された2段階パラダイムであるParallelMuseを提案する。
複数のオープンソースエージェントとベンチマークの実験では、最大62%のパフォーマンス改善が示されている。
論文 参考訳(メタデータ) (2025-10-28T17:51:50Z) - Accelerating Large Language Model Reasoning via Speculative Search [59.48276891032373]
本稿では,大規模言語モデル(LLM)推論を著しく高速化する新しいSpec Searchフレームワークを提案する。
具体的には、SpecSearchは小さなモデルを使用して、思考とトークンのレベルで大きなモデルと戦略的に協力する。
SpecSearchの主要な柱は、大きなモデルの出力よりも品質が低い考えを効果的にフィルタリングする、新しい品質保存の拒絶メカニズムである。
論文 参考訳(メタデータ) (2025-05-03T12:14:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。