論文の概要: Explore to Evolve: Scaling Evolved Aggregation Logic via Proactive Online Exploration for Deep Research Agents
- arxiv url: http://arxiv.org/abs/2510.14438v1
- Date: Thu, 16 Oct 2025 08:37:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.781258
- Title: Explore to Evolve: Scaling Evolved Aggregation Logic via Proactive Online Exploration for Deep Research Agents
- Title(参考訳): Explore to Evolve: ディープリサーチエージェントのための積極的なオンライン探索による進化的集約論理のスケーリング
- Authors: Rui Wang, Ce Zhang, Jun-Yu Ma, Jianshu Zhang, Hongru Wang, Yi Chen, Boyang Xue, Tianqing Fang, Zhisong Zhang, Hongming Zhang, Haitao Mi, Dong Yu, Kam-Fai Wong,
- Abstract要約: 深層研究ウェブエージェントは、洞察に富んだ研究のための知識を厳格に分析し集約する必要がある。
本研究では,Webエージェントの検証可能なトレーニングデータを構築するためのExplore to Evolveパラダイムを提案する。
オープンソースのエージェントフレームワークであるSmolAgentsをベースとして,教師付き微調整トラジェクトリを収集し,一連の基礎モデルを構築する。
- 参考スコア(独自算出の注目度): 70.77400371166922
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep research web agents not only retrieve information from diverse sources such as web environments, files, and multimodal inputs, but more importantly, they need to rigorously analyze and aggregate knowledge for insightful research. However, existing open-source deep research agents predominantly focus on enhancing information-seeking capabilities of web agents to locate specific information, while overlooking the essential need for information aggregation, which would limit their ability to support in-depth research. We propose an Explore to Evolve paradigm to scalably construct verifiable training data for web agents. Begins with proactive online exploration, an agent sources grounded information by exploring the real web. Using the collected evidence, the agent then self-evolves an aggregation program by selecting, composing, and refining operations from 12 high-level logical types to synthesize a verifiable QA pair. This evolution from high-level guidance to concrete operations allowed us to scalably produce WebAggregatorQA, a dataset of 10K samples across 50K websites and 11 domains. Based on an open-source agent framework, SmolAgents, we collect supervised fine-tuning trajectories to develop a series of foundation models, WebAggregator. WebAggregator-8B matches the performance of GPT-4.1, while the 32B variant surpasses GPT-4.1 by more than 10% on GAIA-text and closely approaches Claude-3.7-sonnet. Moreover, given the limited availability of benchmarks that evaluate web agents' information aggregation abilities, we construct a human-annotated evaluation split of WebAggregatorQA as a challenging test set. On this benchmark, Claude-3.7-sonnet only achieves 28%, and GPT-4.1 scores 25.8%. Even when agents manage to retrieve all references, they still struggle on WebAggregatorQA, highlighting the need to strengthen the information aggregation capabilities of web agent foundations.
- Abstract(参考訳): ディープリサーチウェブエージェントは、Web環境、ファイル、マルチモーダル入力などの多様なソースから情報を取得するだけでなく、より重要なのは、洞察に富んだ研究のための知識を厳格に分析し集約する必要があることである。
しかし、既存のオープンソースのディープリサーチエージェントは主に、特定の情報を見つけるためのWebエージェントの情報検索能力の向上に重点を置いている。
本研究では,Webエージェントの検証可能なトレーニングデータを構築するためのExplore to Evolveパラダイムを提案する。
プロアクティブなオンライン探索を行うエージェントは、実際のウェブを探索することで情報を根拠にしている。
収集された証拠を用いて、エージェントは、検証可能なQAペアを合成するために、12の高レベルの論理型から操作を選択し、構成し、精製することにより、集約プログラムを自己進化させる。
ハイレベルなガイダンスから具体的な操作への進化により、50KのWebサイトと11のドメインにわたる10KサンプルのデータセットであるWebAggregatorQAを気軽に作成することができました。
オープンソースのエージェントフレームワークであるSmolAgentsに基づいて、教師付き微調整トラジェクトリを収集し、一連の基礎モデルであるWebAggregatorを開発する。
WebAggregator-8B は GPT-4.1 の性能と一致し、32B は GPT-4.1 を GAIA-text で10% 以上上回り、Claude-3.7-sonnet に近づいた。
さらに、Webエージェントの情報集約能力を評価するベンチマークの可用性が限られていることを踏まえ、WebAggregatorQAの人手による評価分割を挑戦的なテストセットとして構築する。
このベンチマークでは、Claude-3.7-sonnetは28%、GPT-4.1は25.8%である。
エージェントがすべての参照を取得できたとしても、WebAggregatorQAに苦戦し、Webエージェント基盤の情報集約機能を強化する必要性を強調している。
関連論文リスト
- WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents [57.203515352080295]
本稿では,モデルに基づく探索と反復的,長短のクエリ進化を用いた体系的データ生成手法であるWebExplorerを紹介する。
我々のモデルは、128Kのコンテキスト長と最大100のツール呼び出しスイッチをサポートし、長期の問題解決を可能にします。
8Bサイズのモデルとして、WebExplorer-8Bは、RLトレーニング後の平均16ターンを効果的に探索することができる。
論文 参考訳(メタデータ) (2025-09-08T10:07:03Z) - WebDancer: Towards Autonomous Information Seeking Agency [69.33360019344083]
エージェントシステムの最近の進歩は、自律的な多段階研究の可能性を強調している。
データ中心およびトレーニング段階の観点からエージェントを探索するエンドツーエンドのエージェント情報を構築するための凝集パラダイムを提案する。
我々はこのフレームワークを ReAct, WebDancer に基づいた Web エージェントでインスタンス化する。
論文 参考訳(メタデータ) (2025-05-28T17:57:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。