Fugu-MT 論文翻訳(概要): InfoAgent: Advancing Autonomous Information-Seeking Agents

論文の概要: InfoAgent: Advancing Autonomous Information-Seeking Agents

arxiv url: http://arxiv.org/abs/2509.25189v1
Date: Mon, 29 Sep 2025 17:59:57 GMT
ステータス: 翻訳完了
システム内更新日: 2025-10-01 17:09:04.160024
Title: InfoAgent: Advancing Autonomous Information-Seeking Agents
Title（参考訳）: InfoAgent: 自律的な情報検索エージェントの強化
Authors: Gongrui Zhang, Jialiang Zhu, Ruiqi Yang, Kai Qiu, Miaosen Zhang, Zhirong Wu, Qi Dai, Bei Liu, Chong Luo, Zhengyuan Yang, Linjie Li, Lijuan Wang, Weizhu Chen, Yuan Zhang, Xin Li, Zhaoyi Liu, Xin Geng, Baining Guo,
Abstract要約: 本稿では,革新的なデータ合成パイプラインとWeb検索ツールを駆使したディープリサーチエージェントInfoAgentを紹介する。我々の方法では、InfoAgentはBrowseCompで15.3%、BrowseComp-ZHで29.2%、Xbench-DSで40.4%の精度を達成した。
参考スコア（独自算出の注目度）: 143.15973604285304
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Building Large Language Model agents that expand their capabilities by interacting with external tools represents a new frontier in AI research and applications. In this paper, we introduce InfoAgent, a deep research agent powered by an innovative data synthesis pipeline and orchestrated web search tools. To construct challenging, hard-to-find queries,we build entity trees and apply sub-tree sampling with entity fuzzification to systematically increase question difficulty. Unlike prior work that relies heavily on commercial search tools, we develop a dedicated self-hosted search infrastructure, enhancing transparency of agent environments and facilitating further advancement of agent capacity. We evaluate the effectiveness of our data pipeline by measuring the average number of tool calls required to correctly answer a question, and also show that our agent yields better performance when equipped with our tools. Our \mbox{InfoAgent} is post-trained from Qwen3-14B using a two-stage recipe: cold-start supervised finetuning to instill long-horizon search behaviors, followed by reinforcement learning which significantly improves reasoning-driven tool use. With our methods, InfoAgent achieves 15.3\% accuracy on BrowseComp, 29.2\% on BrowseComp-ZH, and 40.4\% on Xbench-DS, outperforming prior open-source deep research agents such as WebSailor-72B and DeepDive-32B.
Abstract（参考訳）: 外部ツールとのインタラクションによって機能を拡張する大規模言語モデルエージェントの構築は、AI研究とアプリケーションにおける新たなフロンティアである。本稿では,革新的なデータ合成パイプラインとWeb検索ツールを用いたディープリサーチエージェントであるInfoAgentを紹介する。難易度の高いクエリを構築するために、エンティティツリーを構築し、エンティティファジフィケーションによるサブツリーサンプリングを適用して、問題の難易度を体系的に増大させる。商用検索ツールに大きく依存する以前の作業とは違って,我々は,エージェント環境の透明性を高め,エージェント能力のさらなる向上を促進する,専用の検索インフラを開発する。我々は,質問に正しく答えるために必要な平均ツール呼び出し数を測定し,データパイプラインの有効性を評価するとともに,我々のエージェントが我々のツールを装着すると,より良い性能が得られることを示す。筆者らはQwen3-14Bの2段階のレシピを用いてQwen3-14Bから学習を行った。我々の方法では、InfoAgentはBrowseCompで15.3\%、BrowseComp-ZHで29.2\%、Xbench-DSで40.4\%に達し、WebSailor-72BやDeepDive-32Bといったオープンソースのディープリサーチエージェントよりも優れている。

関連論文リスト

AgentIR: Reasoning-Aware Retrieval for Deep Research Agents [76.29382561831105]
ディープリサーチエージェントは、各検索の前に明示的な自然言語推論を生成する。 Reasoning-Aware Retrievalは、クエリと一緒にエージェントの推論トレースを埋め込む。 DR-Synthは、標準的なQAデータセットからDeep Researchレトリバーのトレーニングデータを生成する。 AgentIR-4Bは、オープンウェイトエージェントであるTongyi-DeepResearchで68%の精度を達成する。
論文参考訳（メタデータ） (2026-03-04T18:47:26Z)
Insight Agents: An LLM-Based Multi-Agent System for Data Insights [6.3353477880949045]
我々は、対話型マルチエージェントデータインサイトシステムであるInsight Agents(IA)を開発し、個人化されたデータとビジネスインサイトを提供する。 IAは米国でAmazonの販売者向けにローンチされており、人間の評価に基づいて90%の精度を達成しており、P90のレイテンシは15秒以下である。
論文参考訳（メタデータ） (2026-01-27T20:51:01Z)
SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback [68.60326181052658]
本稿では,高品質で難易度の高い探索問合せを自動生成するエージェントパイプラインを提案する。我々のパイプラインであるSAGEは、QAペアを提案するデータジェネレータと、生成された質問を解決するための検索エージェントで構成される。我々の本質的な評価は、SAGEが様々な推論戦略を必要とする質問を生成する一方で、生成したデータの正確性や難易度を著しく高めていることを示している。
論文参考訳（メタデータ） (2026-01-26T06:37:56Z)
Agent-as-a-Graph: Knowledge Graph-Based Tool and Agent Retrieval for LLM Multi-Agent Systems [1.2092584191043323]
本稿では,知識グラフにおいて,ツールと親エージェントをノードとして,エッジとして表現する知識グラフ検索拡張手法であるエージェント・アズ・ア・グラフ検索を紹介する。我々はLiveMCPBenchmark上でAgent-as-a-Graphを評価し、Recall@5とnDCG@5の14.9%と14.6%の改善を実現した。
論文参考訳（メタデータ） (2025-11-22T21:24:16Z)
Scaling Agents via Continual Pre-training [80.97989245493326]
我々は,エージェント連続事前学習(Agentic CPT)を深層研究エージェント訓練パイプラインに組み込んで,強力なエージェント基礎モデルを構築することを提案する。我々は,AgentFounder-30Bを10のベンチマークで評価し,強力なツール使用能力を保ちながら最先端のパフォーマンスを実現した。
論文参考訳（メタデータ） (2025-09-16T17:57:19Z)
Beyond Ten Turns: Unlocking Long-Horizon Agentic Search with Large-Scale Asynchronous RL [22.8456317506762]
ASearcherは、検索エージェントの大規模RLトレーニングのためのオープンソースプロジェクトである。 ASearcher-Web-QwQは、xBenchで42.1、GAIAで52.8のAvg@4スコアを獲得し、既存のオープンソース32Bエージェントを上回っている。
論文参考訳（メタデータ） (2025-08-11T13:36:57Z)
AgentSwift: Efficient LLM Agent Design via Value-guided Hierarchical Search [58.98450205734779]
大規模言語モデル(LLM)エージェントは、多様なドメインにまたがる強力な機能を示している。既存のエージェントサーチ手法には3つの大きな制限がある。これらの課題に対処するための包括的なフレームワークを導入します。
論文参考訳（メタデータ） (2025-06-06T12:07:23Z)
Tree Search for Language Model Agents [73.97960454223164]
対話型Web環境での探索と多段階計画を行うために,LMエージェントの推論時探索アルゴリズムを提案する。我々のアプローチは、実環境空間内で機能する最優先木探索の一形態である。現実的なWebタスクにおいて有効性を示すLMエージェントのための最初の木探索アルゴリズムである。
論文参考訳（メタデータ） (2024-07-01T17:07:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。