論文の概要: MetaAgent-X : Breaking the Ceiling of Automatic Multi-Agent Systems via End-to-End Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2605.14212v1
- Date: Thu, 14 May 2026 00:11:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.547942
- Title: MetaAgent-X : Breaking the Ceiling of Automatic Multi-Agent Systems via End-to-End Reinforcement Learning
- Title(参考訳): MetaAgent-X : エンドツーエンド強化学習による自動マルチエージェントシステムのシーリング
- Authors: Yaolun Zhang, Yujie Zhao, Nan Wang, Yiran Wu, Jiayu Chang, Yizhao Chen, Qingyun Wu, Jishen Zhao, Huazheng Wang,
- Abstract要約: 自動MAS設計と実行を協調的に最適化する,エンドツーエンドの強化学習フレームワークであるMetaAgent-Xを紹介する。
MetaAgent-Xは既存のMASベースラインを一貫して上回り、最大21.7%のアップを達成した。
これらの結果は、自己設計および自己実行エージェントモデルを構築するための実践パラダイムとして、エンドツーエンドのトレーニング可能な自動MASを確立する。
- 参考スコア(独自算出の注目度): 26.35314976395182
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic multi-agent systems aim to instantiate agent workflows without relying on manually designed or fixed orchestration. However, existing automatic MAS approaches remain only partially adaptive: they either perform training-free test-time search or optimize the meta-level designer while keeping downstream execution agents frozen, which creating a frozen-executor ceiling and leaving the end-to-end training of self-designing and self-executing agentic models unexplored. To address this, we introduce MetaAgent-X, an end-to-end reinforcement learning framework that jointly optimizes automatic MAS design and execution. MetaAgent-X enables script-based MAS generation, execution rollout collection, and credit assignment for both designer and executor trajectories. To support stable and scalable optimization, we propose Executor Designer Hierarchical Rollout and Stagewise Co-evolution to improve training stability and expose the dynamics of designer-executor co-evolution. MetaAgent-X consistently outperforms existing automatic MAS baselines, achieving up to 21.7% gains. Comprehensive ablations show that both designer and executor improve throughout training, and that effective automatic MAS learning follows a stagewise co-evolution process. These results establish end-to-end trainable automatic MAS as a practical paradigm for building self-designing and self-executing agentic models.
- Abstract(参考訳): 自動マルチエージェントシステムは、手動で設計または固定されたオーケストレーションに頼ることなく、エージェントワークフローをインスタンス化する。
しかし、既存の自動MASアプローチは、トレーニング不要なテストタイムサーチを実行するか、下流の実行エージェントを凍結させながらメタレベルのデザイナを最適化する。
そこで本稿では,自動MAS設計と実行を協調的に最適化する,エンドツーエンドの強化学習フレームワークであるMetaAgent-Xを紹介する。
MetaAgent-Xは、スクリプトベースのMAS生成、実行ロールアウトコレクション、デザイナとエグゼクタの両方に対するクレジット割り当てを可能にする。
安定かつスケーラブルな最適化を支援するために,設計者/実行者共同進化のダイナミクスを明らかにするために,実行者設計者の階層的ロールアウトと段階的共進化を提案する。
MetaAgent-Xは既存のMASベースラインを一貫して上回り、21.7%のゲインを達成している。
総合的な説明は、デザイナーと実行担当者の両方がトレーニングを通して改善し、効果的な自動MAS学習は段階的に共進化プロセスに従うことを示している。
これらの結果は、自己設計および自己実行エージェントモデルを構築するための実践パラダイムとして、エンドツーエンドのトレーニング可能な自動MASを確立する。
関連論文リスト
- Self-Evolving Recommendation System: End-To-End Autonomous Model Optimization With LLM Agents [18.707716142982992]
複雑なモデル変更を自律的に生成し、訓練し、デプロイする自己進化システムを提案する。
私たちのエージェントは、機械学習エンジニア(MLE)として機能します。
このアプローチの有効性は、YouTubeで成功したいくつかのプロダクションローンチを通じて実証されている。
論文 参考訳(メタデータ) (2026-02-10T19:16:52Z) - ToolSelf: Unifying Task Execution and Self-Reconfiguration via Tool-Driven Intrinsic Adaptation [60.25542764389203]
LLM(Large Language Models)を利用したエージェントシステムは、複雑で長期のタスクに対処する上で、顕著な可能性を示している。
既存のアプローチでは、手動のオーケストレーションやランタイムベースのパッチを頼りにしており、一般化の貧弱さと最適化の断片化に悩まされることが多い。
ツール駆動の自己修正を可能にする新しいパラダイムであるToolSelfを提案する。
論文 参考訳(メタデータ) (2026-02-08T09:27:18Z) - Youtu-Agent: Scaling Agent Productivity with Automated Generation and Hybrid Policy Optimization [37.17893162265247]
Youtu-AgentはLarge Language Model (LLM)エージェントの自動生成と継続的進化のために設計されたフレームワークである。
Youtu-Agentは、実行環境、ツールキット、コンテキスト管理を分離する構造化構成システムを備えている。
実験により、Youtu-Agentはオープンウェイトモデルを用いてWebWalkerQA(71.47%)とGAIA72.8%)で最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2025-12-31T04:17:36Z) - $Agent^2$: An Agent-Generates-Agent Framework for Reinforcement Learning Automation [5.325886106098561]
強化学習(RL)エージェント開発は伝統的にかなりの専門知識と反復的な努力を必要とする。
本稿では,完全自動RLエージェント設計のための LLM 駆動型エージェント生成エージェントフレームワークである Agent$2$ を紹介する。
Agent$2$は、自然言語のタスク記述と環境コードを人間の介入なしに実行可能なRLソリューションに変換する。
論文 参考訳(メタデータ) (2025-09-16T02:14:39Z) - MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。
MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文 参考訳(メタデータ) (2025-05-21T00:56:09Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [112.04307762405669]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。