論文の概要: Scaling Agentic Capabilities via Grounded Interaction Synthesis
- arxiv url: http://arxiv.org/abs/2606.02001v1
- Date: Mon, 01 Jun 2026 09:57:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.774276
- Title: Scaling Agentic Capabilities via Grounded Interaction Synthesis
- Title(参考訳): 接地相互作用合成によるエージェント能力のスケーリング
- Authors: Wenhang Shi, Jinhao Dong, Yiren Chen, Zhe Zhao, Shuqing Bian, Wei Lu, Xiaoyong Du,
- Abstract要約: 本稿では,多様な環境や複雑なタスクのスケーラブルな構築を自動化するフレームワークであるGarthed Agentic Interaction Synthesis (GAIS)を紹介する。
具体的には、機能的多様性と難易度を確保するために、実世界のモデルコンテキストプロトコル(MCP)サーバから派生したプロトコルアンコール環境を構築する。
BFCL、$2-Bench、ACEBenchの実験では、GAIS合成データが最先端のベースラインを大幅に上回ることを示した。
- 参考スコア(独自算出の注目度): 12.796216573698677
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: General agentic intelligence hinges on the ability to interact with diverse real-world tools to complete complex tasks, a capability fundamentally tied to the quality of interaction data. To bypass the prohibitive costs of human annotation, prevailing paradigms depend entirely on Large Language Models (LLMs) to scale the synthesis of agentic environments and tasks. However, such unconstrained generation often degenerates into biased random sampling of LLMs' internal priors, failing to capture the diversity and difficulty of real-world domains or construct high-fidelity, long-horizon tasks. In this work, we introduce Grounded Agentic Interaction Synthesis (GAIS), a framework that automates the scalable construction of diverse environments and complex tasks via a two-phase grounding mechanism. Specifically, we construct protocol-anchored environments derived from real-world Model Context Protocol (MCP) servers to ensure functional diversity and difficulty. Subsequently, we employ structure-guided planning to navigate these environments, actively enforcing logical dependencies and adversarial policies to generate complex tasks. Experiments on BFCL, $τ^2$-Bench, and ACEBench demonstrate that GAIS-synthesized data significantly outperforms state-of-the-art baselines, enabling base models to match or even surpass their official instruction-tuned counterparts. Furthermore, GAIS exhibits superior data efficiency and scalability, achieving exceptional capabilities with significantly less data while maintaining continuous growth where baselines stagnate. Our code and dataset are publicly available at https://github.com/Eric8932/GAIS.
- Abstract(参考訳): 汎用エージェントインテリジェンスは、さまざまな現実世界のツールと対話して複雑なタスクを完了させる能力に基づいている。
人間のアノテーションの禁止コストを回避するために、一般的なパラダイムはエージェント環境とタスクの合成をスケールするために、Large Language Models (LLMs) に依存している。
しかし、そのような制約のない生成はしばしば、LLMの内部先行のバイアス付きランダムサンプリングに分解され、現実世界の領域の多様性と難しさを捉えたり、高忠実で長い水平なタスクを構築するのに失敗する。
本研究では,二相接地機構を用いて,多様な環境や複雑なタスクのスケーラブルな構築を自動化するフレームワークであるグラウンドド・エージェント・インタラクション・シンセサイザー(GAIS)を紹介する。
具体的には、機能的多様性と難易度を確保するために、実世界のモデルコンテキストプロトコル(MCP)サーバから派生したプロトコルアンコール環境を構築する。
その後、これらの環境をナビゲートする構造誘導計画を採用し、複雑なタスクを生成するための論理的依存関係と敵ポリシーを積極的に実施する。
BFCL、$τ^2$-Bench、ACEBenchの実験では、GAIS合成されたデータは最先端のベースラインを大幅に上回っており、ベースモデルが公式のインストラクションチューニングされたモデルと一致したり、超えたりすることができる。
さらに、GAISは優れたデータ効率とスケーラビリティを示し、ベースラインが停滞している継続的成長を維持しながら、データを大幅に減らし、例外的な機能を達成する。
私たちのコードとデータセットはhttps://github.com/Eric8932/GAISで公開されています。
関連論文リスト
- Agent-World: Scaling Real-World Environment Synthesis for Evolving General Agent Intelligence [122.8626256816085]
textbfAgent-Worldは、スケーラブルな環境を通じて汎用エージェントインテリジェンスを前進させるための自己進化型トレーニングアリーナである。
Agent-World-8Bと14Bは、強力なプロプライエタリなモデルと環境スケーリングベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-04-20T14:01:10Z) - Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning [62.499592503950026]
大規模言語モデル(LLM)は、ツールや環境とのマルチターンインタラクションを必要とする複雑なタスクを実行するために、自律エージェントに権限を与えている。
完全合成環境生成パイプラインであるエージェント・ワールド・モデル(AWM)を提案する。
私たちは、エージェントがリッチなツールセットと対話できる、毎日のシナリオをカバーする1,000の環境にスケールします。
論文 参考訳(メタデータ) (2026-02-10T18:55:41Z) - AgentSkiller: Scaling Generalist Agent Intelligence through Semantically Integrated Cross-Domain Data Synthesis [30.512393568258105]
大規模言語モデルエージェントは、ツールを介して現実世界の問題を解決する可能性を実証するが、汎用的な知性は、質の低い長期データによってボトルネックとなる。
本稿では,現実的なセマンティックなドメイン間でのマルチターンインタラクションデータを合成する,完全に自動化されたフレームワークであるAgentSkillerを提案する。
論文 参考訳(メタデータ) (2026-02-10T03:21:42Z) - Mock Worlds, Real Skills: Building Small Agentic Language Models with Synthetic Tasks, Simulated Environments, and Rubric-Based Rewards [13.784988950752195]
既存のオープンソースエージェントトレーニングデータはタスクの多様性が狭く、容易に解決できる。
現実世界のAPIには多様性がなく、大規模な強化学習のロールアウトプロセスでは不安定である。
多様なツール使用トレーニングデータを共同で合成し,完全な環境をシミュレートするフレームワークであるSynTHAGENTで,これらの課題に対処する。
論文 参考訳(メタデータ) (2026-01-30T03:43:42Z) - Nex-N1: Agentic Models Trained via a Unified Ecosystem for Large-Scale Environment Construction [117.6380005194061]
本稿では,対話型環境の多様性と複雑さを体系的にスケールする手法を提案する。
本手法は,3次元に対処することで,このスケーリングを実現する。
Nex-N1は、インフラストラクチャによって確立された多様な複雑なインタラクティブ環境に基づいてトレーニングします。
論文 参考訳(メタデータ) (2025-12-04T16:57:02Z) - CuES: A Curiosity-driven and Environment-grounded Synthesis Framework for Agentic RL [35.086788669916594]
大規模言語モデルベースのエージェントは、複雑なツール拡張環境にますますデプロイされている。
既存のアプローチは通常、新しい環境で失敗する前提である事前定義されたタスクコレクションを仮定する。
そこで我々はCuESを提案する。CuESはキュリオシティ駆動環境基盤合成フレームワークで、多様で実行可能で有意義なタスクを自律的に生成する。
論文 参考訳(メタデータ) (2025-12-01T06:11:37Z) - Towards General Agentic Intelligence via Environment Scaling [78.66355092082253]
高度なエージェントインテリジェンスは、現実世界のアプリケーションに大規模言語モデルをデプロイするための前提条件である。
完全にシミュレートされた異種環境を自動的に構築するスケーラブルなフレームワークを設計する。
エージェントベンチマーク, tau-bench, tau2-Bench, ACEBenchの実験により, トレーニングモデルである AgentScaler が, モデルの関数呼び出し能力を大幅に向上することを示した。
論文 参考訳(メタデータ) (2025-09-16T17:57:20Z) - LEGENT: Open Platform for Embodied Agents [60.71847900126832]
LEGENTはLarge Language Models (LLM) とLarge Multimodal Models (LMM) を用いたエンボディエージェントを開発するためのオープンでスケーラブルなプラットフォームである。
LEGENTはリッチでインタラクティブな3D環境を提供し、コミュニケーション可能でアクション可能なエージェントをユーザフレンドリーなインターフェースと組み合わせている。
実験では、EGENT生成データに基づいて訓練された胚性視覚言語モデルが、エンボディタスクにおいてGPT-4Vを超える。
論文 参考訳(メタデータ) (2024-04-28T16:50:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。