論文の概要: EigentSearch-Q+: Enhancing Deep Research Agents with Structured Reasoning Tools
- arxiv url: http://arxiv.org/abs/2604.07927v2
- Date: Fri, 10 Apr 2026 17:14:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 13:51:27.772604
- Title: EigentSearch-Q+: Enhancing Deep Research Agents with Structured Reasoning Tools
- Title(参考訳): EigentSearch-Q+:構造化推論ツールによるディープリサーチエージェントの強化
- Authors: Boer Zhang, Mingyan Wu, Dongzhuoran Zhou, Yuqicheng Zhu, Wendong Fan, Puzhen Zhang, Zifeng Ding, Guohao Li, Yuan He,
- Abstract要約: ウェブ検索をより意図的にするためのクエリおよびエビデンス処理ツールであるQ+を紹介する。
当社はQ+をオープンソースでプロダクション対応のマルチエージェントワーカーであるEigentのブラウザサブエージェントに統合しています。
4つのベンチマークで、Q+はEigentのベンチマークサイズ重み付け平均精度を3.0、3.8、0.6ポイント(pp)改善した。
- 参考スコア(独自算出の注目度): 12.61248869302151
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep research requires reasoning over web evidence to answer open-ended questions, and it is a core capability for AI agents. Yet many deep research agents still rely on implicit, unstructured search behavior that causes redundant exploration and brittle evidence aggregation. Motivated by Anthropic's "think" tool paradigm and insights from the information-retrieval literature, we introduce Q+, a set of query and evidence processing tools that make web search more deliberate by guiding query planning, monitoring search progress, and extracting evidence from long web snapshots. We integrate Q+ into the browser sub-agent of Eigent, an open-source, production-ready multi-agent workforce for computer use, yielding EigentSearch-Q+. Across four benchmarks (SimpleQA-Verified, FRAMES, WebWalkerQA, and X-Bench DeepSearch), Q+ improves Eigent's browser agent benchmark-size-weighted average accuracy by 3.0, 3.8, and 0.6 percentage points (pp) for GPT-4.1, GPT-5.1, and Minimax M2.5 model backends, respectively. Case studies further suggest that EigentSearch-Q+ produces more coherent tool-calling trajectories by making search progress and evidence handling explicit.
- Abstract(参考訳): ディープリサーチでは、オープンな質問に答えるために、Webエビデンスを推論する必要がある。
しかし、多くのディープ・リサーチ・エージェントはいまだに、無秩序な探索と脆弱な証拠収集を引き起こす暗黙の無構造な探索行動に依存している。
Anthropicの"シンク"ツールパラダイムと情報検索の文献からの洞察に触発されたQ+は、クエリ計画の指導、検索の進捗の監視、長いWebスナップショットからのエビデンス抽出によるWeb検索をより意図的にするためのクエリおよびエビデンス処理ツールである。
我々は、Q+をEigentのブラウザサブエージェントに統合する。
4つのベンチマーク(SimpleQA-Verified、FRAMES、WebWalkerQA、X-Bench DeepSearch)において、Q+は、それぞれGPT-4.1、GPT-5.1、Minimax M2.5モデルのバックエンドに対して、Eigentのベンチマークサイズ重み付き平均精度を3.0、3.8、0.6ポイント(pp)改善している。
事例研究により,EigentSearch-Q+は検索の進行と証拠処理を明確化することにより,より一貫性のあるツール呼び出しトラジェクトリを生成することが示唆された。
関連論文リスト
- AgentIR: Reasoning-Aware Retrieval for Deep Research Agents [76.29382561831105]
ディープリサーチエージェントは、各検索の前に明示的な自然言語推論を生成する。
Reasoning-Aware Retrievalは、クエリと一緒にエージェントの推論トレースを埋め込む。
DR-Synthは、標準的なQAデータセットからDeep Researchレトリバーのトレーニングデータを生成する。
AgentIR-4Bは、オープンウェイトエージェントであるTongyi-DeepResearchで68%の精度を達成する。
論文 参考訳(メタデータ) (2026-03-04T18:47:26Z) - MM-DeepResearch: A Simple and Effective Multimodal Agentic Search Baseline [26.19213349415094]
マルチモーダル・リサーチ・エージェントの開発を目標とし, 明示的な推論と計画, マルチツール・呼び出し, クロスモーダル・インフォメーション・シンセサイザーの実現を目指す。
1)検索集約型マルチモーダルQAデータの不足,(2)効果的な検索トラジェクトリの欠如,(3)オンライン検索APIによるトレーニングの禁止コストの3つの主な課題を考察する。
この3つの設計により,強力なマルチモーダルディープリサーチエージェントであるMM-DeepResearchを開発した。
論文 参考訳(メタデータ) (2026-03-01T11:13:22Z) - InfoAgent: Advancing Autonomous Information-Seeking Agents [143.15973604285304]
本稿では,革新的なデータ合成パイプラインとWeb検索ツールを駆使したディープリサーチエージェントInfoAgentを紹介する。
我々の方法では、InfoAgentはBrowseCompで15.3%、BrowseComp-ZHで29.2%、Xbench-DSで40.4%の精度を達成した。
論文 参考訳(メタデータ) (2025-09-29T17:59:57Z) - Fathom-DeepResearch: Unlocking Long Horizon Information Retrieval and Synthesis for SLMs [7.3517692707289415]
本稿では2つの特殊モデルからなるエージェントシステムであるFathom-DeepResearchを紹介する。
ひとつは、ライブWeb検索とターゲットWebページクエリによるエビデンスベースの調査に最適化された、DeepSearchモデルであるFathom-Search-4Bである。
2つ目は、Qwen3-4Bから訓練されたFathom-Synthesizer-4Bである。
論文 参考訳(メタデータ) (2025-09-28T22:58:11Z) - BrowseComp-Plus: A More Fair and Transparent Evaluation Benchmark of Deep-Research Agent [74.10138164281618]
BrowseComp-Plus(BrowseComp-Plus)は、BrowseCompから派生したベンチマークである。
このベンチマークは、ディープリサーチエージェントと検索方法の総合的な評価とアンタングル解析を可能にする。
論文 参考訳(メタデータ) (2025-08-08T17:55:11Z) - MMSearch-R1: Incentivizing LMMs to Search [49.889749277236376]
MMSearch-R1は,実世界のインターネット環境において,オンデマンドでマルチターン検索が可能な,初のエンドツーエンド強化学習フレームワークである。
本フレームワークは画像検索とテキスト検索の両方を統合し,検索ペナルティによる結果に基づく報酬によって,モデルがいつ,どのように呼び出すかの判断を可能にする。
論文 参考訳(メタデータ) (2025-06-25T17:59:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。