論文の概要: InfoAgent: Advancing Autonomous Information-Seeking Agents
- arxiv url: http://arxiv.org/abs/2509.25189v1
- Date: Mon, 29 Sep 2025 17:59:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.160024
- Title: InfoAgent: Advancing Autonomous Information-Seeking Agents
- Title(参考訳): InfoAgent: 自律的な情報検索エージェントの強化
- Authors: Gongrui Zhang, Jialiang Zhu, Ruiqi Yang, Kai Qiu, Miaosen Zhang, Zhirong Wu, Qi Dai, Bei Liu, Chong Luo, Zhengyuan Yang, Linjie Li, Lijuan Wang, Weizhu Chen, Yuan Zhang, Xin Li, Zhaoyi Liu, Xin Geng, Baining Guo,
- Abstract要約: 本稿では,革新的なデータ合成パイプラインとWeb検索ツールを駆使したディープリサーチエージェントInfoAgentを紹介する。
我々の方法では、InfoAgentはBrowseCompで15.3%、BrowseComp-ZHで29.2%、Xbench-DSで40.4%の精度を達成した。
- 参考スコア(独自算出の注目度): 143.15973604285304
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building Large Language Model agents that expand their capabilities by interacting with external tools represents a new frontier in AI research and applications. In this paper, we introduce InfoAgent, a deep research agent powered by an innovative data synthesis pipeline and orchestrated web search tools. To construct challenging, hard-to-find queries,we build entity trees and apply sub-tree sampling with entity fuzzification to systematically increase question difficulty. Unlike prior work that relies heavily on commercial search tools, we develop a dedicated self-hosted search infrastructure, enhancing transparency of agent environments and facilitating further advancement of agent capacity. We evaluate the effectiveness of our data pipeline by measuring the average number of tool calls required to correctly answer a question, and also show that our agent yields better performance when equipped with our tools. Our \mbox{InfoAgent} is post-trained from Qwen3-14B using a two-stage recipe: cold-start supervised finetuning to instill long-horizon search behaviors, followed by reinforcement learning which significantly improves reasoning-driven tool use. With our methods, InfoAgent achieves 15.3\% accuracy on BrowseComp, 29.2\% on BrowseComp-ZH, and 40.4\% on Xbench-DS, outperforming prior open-source deep research agents such as WebSailor-72B and DeepDive-32B.
- Abstract(参考訳): 外部ツールとのインタラクションによって機能を拡張する大規模言語モデルエージェントの構築は、AI研究とアプリケーションにおける新たなフロンティアである。
本稿では,革新的なデータ合成パイプラインとWeb検索ツールを用いたディープリサーチエージェントであるInfoAgentを紹介する。
難易度の高いクエリを構築するために、エンティティツリーを構築し、エンティティファジフィケーションによるサブツリーサンプリングを適用して、問題の難易度を体系的に増大させる。
商用検索ツールに大きく依存する以前の作業とは違って,我々は,エージェント環境の透明性を高め,エージェント能力のさらなる向上を促進する,専用の検索インフラを開発する。
我々は,質問に正しく答えるために必要な平均ツール呼び出し数を測定し,データパイプラインの有効性を評価するとともに,我々のエージェントが我々のツールを装着すると,より良い性能が得られることを示す。
筆者らはQwen3-14Bの2段階のレシピを用いてQwen3-14Bから学習を行った。
我々の方法では、InfoAgentはBrowseCompで15.3\%、BrowseComp-ZHで29.2\%、Xbench-DSで40.4\%に達し、WebSailor-72BやDeepDive-32Bといったオープンソースのディープリサーチエージェントよりも優れている。
関連論文リスト
- Scaling Agents via Continual Pre-training [80.97989245493326]
我々は,エージェント連続事前学習(Agentic CPT)を深層研究エージェント訓練パイプラインに組み込んで,強力なエージェント基礎モデルを構築することを提案する。
我々は,AgentFounder-30Bを10のベンチマークで評価し,強力なツール使用能力を保ちながら最先端のパフォーマンスを実現した。
論文 参考訳(メタデータ) (2025-09-16T17:57:19Z) - Beyond Ten Turns: Unlocking Long-Horizon Agentic Search with Large-Scale Asynchronous RL [22.8456317506762]
ASearcherは、検索エージェントの大規模RLトレーニングのためのオープンソースプロジェクトである。
ASearcher-Web-QwQは、xBenchで42.1、GAIAで52.8のAvg@4スコアを獲得し、既存のオープンソース32Bエージェントを上回っている。
論文 参考訳(メタデータ) (2025-08-11T13:36:57Z) - AgentSwift: Efficient LLM Agent Design via Value-guided Hierarchical Search [58.98450205734779]
大規模言語モデル(LLM)エージェントは、多様なドメインにまたがる強力な機能を示している。
既存のエージェントサーチ手法には3つの大きな制限がある。
これらの課題に対処するための包括的なフレームワークを導入します。
論文 参考訳(メタデータ) (2025-06-06T12:07:23Z) - Tree Search for Language Model Agents [73.97960454223164]
対話型Web環境での探索と多段階計画を行うために,LMエージェントの推論時探索アルゴリズムを提案する。
我々のアプローチは、実環境空間内で機能する最優先木探索の一形態である。
現実的なWebタスクにおいて有効性を示すLMエージェントのための最初の木探索アルゴリズムである。
論文 参考訳(メタデータ) (2024-07-01T17:07:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。