論文の概要: Towards General Agentic Intelligence via Environment Scaling
- arxiv url: http://arxiv.org/abs/2509.13311v1
- Date: Tue, 16 Sep 2025 17:57:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:53.220687
- Title: Towards General Agentic Intelligence via Environment Scaling
- Title(参考訳): 環境スケーリングによる汎用エージェントインテリジェンスを目指して
- Authors: Runnan Fang, Shihao Cai, Baixuan Li, Jialong Wu, Guangyu Li, Wenbiao Yin, Xinyu Wang, Xiaobin Wang, Liangcai Su, Zhen Zhang, Shibin Wu, Zhengwei Tao, Yong Jiang, Pengjun Xie, Fei Huang, Jingren Zhou,
- Abstract要約: 高度なエージェントインテリジェンスは、現実世界のアプリケーションに大規模言語モデルをデプロイするための前提条件である。
完全にシミュレートされた異種環境を自動的に構築するスケーラブルなフレームワークを設計する。
エージェントベンチマーク, tau-bench, tau2-Bench, ACEBenchの実験により, トレーニングモデルである AgentScaler が, モデルの関数呼び出し能力を大幅に向上することを示した。
- 参考スコア(独自算出の注目度): 78.66355092082253
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Advanced agentic intelligence is a prerequisite for deploying Large Language Models in practical, real-world applications. Diverse real-world APIs demand precise, robust function-calling intelligence, which needs agents to develop these capabilities through interaction in varied environments. The breadth of function-calling competence is closely tied to the diversity of environments in which agents are trained. In this work, we scale up environments as a step towards advancing general agentic intelligence. This gives rise to two central challenges: (i) how to scale environments in a principled manner, and (ii) how to effectively train agentic capabilities from experiences derived through interactions with these environments. To address these, we design a scalable framework that automatically constructs heterogeneous environments that are fully simulated, systematically broadening the space of function-calling scenarios. We further adapt a two-phase agent fine-tuning strategy: first endowing agents with fundamental agentic capabilities, then specializing them for domain-specific contexts. Extensive experiments on agentic benchmarks, tau-bench, tau2-Bench, and ACEBench, demonstrate that our trained model, AgentScaler, significantly enhances the function-calling capability of models.
- Abstract(参考訳): 高度なエージェントインテリジェンスは、実用的な実世界のアプリケーションに大規模言語モデルをデプロイするための前提条件である。
さまざまな現実世界のAPIは、正確で堅牢な関数呼び出しインテリジェンスを必要とします。
機能呼び出し能力の広さは、エージェントが訓練される環境の多様性と密接に結びついている。
本研究では,汎用エージェントインテリジェンスに向けたステップとして,環境をスケールアップする。
これは2つの中心的な課題を生み出します。
一 原則的に環境をスケールする方法、及び
(II)これらの環境との相互作用によって引き起こされた経験からエージェント能力を効果的に訓練する方法。
これらの問題に対処するため,我々は,関数呼び出しシナリオの空間を体系的に拡張し,完全にシミュレートされた異種環境を自動的に構築するスケーラブルなフレームワークを設計した。
我々はさらに2段階のエージェントの微調整戦略を適応し、まず基本的なエージェント能力を持つエージェントを育成し、ドメイン固有のコンテキストに特化させる。
エージェントベンチマーク, tau-bench, tau2-Bench, ACEBenchの大規模な実験により, トレーニングモデルである AgentScaler が, モデルの関数呼び出し能力を著しく向上することを示した。
関連論文リスト
- AgentScope 1.0: A Developer-Centric Framework for Building Agentic Applications [95.42093979627703]
AgentScopeは柔軟で効率的なツールベースのエージェント環境インタラクションをサポートする。
エージェントの動作をReActパラダイムに基盤として,エージェントレベルの高度なインフラストラクチャを提供します。
AgentScopeには、開発者フレンドリーなエクスペリエンスのための堅牢なエンジニアリングサポートも含まれている。
論文 参考訳(メタデータ) (2025-08-22T10:35:56Z) - A Survey on Agent Workflow -- Status and Future [2.817843718857682]
この調査は、エージェントワークフローシステムの包括的なレビューを提供する。
既存のシステムを機能機能機能とアーキテクチャの2つの重要な側面に沿って分類する。
共通パターン、潜在的な技術的課題、新たなトレンドを強調します。
論文 参考訳(メタデータ) (2025-08-02T04:15:30Z) - A Survey of Self-Evolving Agents: On Path to Artificial Super Intelligence [87.08051686357206]
大きな言語モデル(LLM)は強力な能力を示しているが、基本的に静的である。
LLMはますますオープンでインタラクティブな環境にデプロイされているため、この静的な性質は重要なボトルネックとなっている。
この調査は、自己進化エージェントの体系的で包括的なレビューを初めて提供する。
論文 参考訳(メタデータ) (2025-07-28T17:59:05Z) - Mind the Gap: Towards Generalizable Autonomous Penetration Testing via Domain Randomization and Meta-Reinforcement Learning [15.619925926862235]
GAPは汎用的な自律型ペンテスティングフレームワークである。
現実的な環境で効率的な政策トレーニングを実現することを目的としている。
また、あるインスタンスから他のケースについて推論できるエージェントを訓練する。
論文 参考訳(メタデータ) (2024-12-05T11:24:27Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。