論文の概要: $Agent^2$: An Agent-Generates-Agent Framework for Reinforcement Learning Automation
- arxiv url: http://arxiv.org/abs/2509.13368v2
- Date: Tue, 30 Sep 2025 05:06:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.108813
- Title: $Agent^2$: An Agent-Generates-Agent Framework for Reinforcement Learning Automation
- Title(参考訳): $Agent^2$:強化学習自動化のためのエージェント生成エージェントフレームワーク
- Authors: Yuan Wei, Xiaohan Shan, Ran Miao, Jianmin Li,
- Abstract要約: 強化学習(RL)エージェント開発は伝統的にかなりの専門知識と反復的な努力を必要とする。
本稿では,完全自動RLエージェント設計のための LLM 駆動型エージェント生成エージェントフレームワークである Agent$2$ を紹介する。
Agent$2$は、自然言語のタスク記述と環境コードを人間の介入なしに実行可能なRLソリューションに変換する。
- 参考スコア(独自算出の注目度): 5.325886106098561
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning (RL) agent development traditionally requires substantial expertise and iterative effort, often leading to high failure rates and limited accessibility. This paper introduces Agent$^2$, an LLM-driven agent-generates-agent framework for fully automated RL agent design. Agent$^2$ autonomously translates natural language task descriptions and environment code into executable RL solutions without human intervention. The framework adopts a dual-agent architecture: a Generator Agent that analyzes tasks and designs agents, and a Target Agent that is automatically generated and executed. To better support automation, RL development is decomposed into two stages, MDP modeling and algorithmic optimization, facilitating targeted and effective agent generation. Built on the Model Context Protocol, Agent$^2$ provides a unified framework for standardized agent creation across diverse environments and algorithms, incorporating adaptive training management and intelligent feedback analysis for continuous refinement. Extensive experiments on benchmarks including MuJoCo, MetaDrive, MPE, and SMAC show that Agent$^2$ outperforms manually designed baselines across all tasks, achieving up to 55\% performance improvement with consistent average gains. By enabling a closed-loop, end-to-end automation pipeline, this work advances a new paradigm in which agents can design and optimize other agents, underscoring the potential of agent-generates-agent systems for automated AI development.
- Abstract(参考訳): 強化学習(RL)エージェント開発は伝統的にかなりの専門知識と反復的な努力を必要とし、しばしば高い失敗率と限られたアクセシビリティをもたらす。
本稿では,完全自動RLエージェント設計のための LLM 駆動エージェント生成エージェントフレームワークである Agent$2$ を紹介する。
Agent$2$は、自然言語のタスク記述と環境コードを人間の介入なしに実行可能なRLソリューションに変換する。
このフレームワークでは、タスクを分析してエージェントを設計するGenerator Agentと、自動生成して実行されるTarget Agentという、デュアルエージェントアーキテクチャを採用している。
自動化を向上するために、RL開発はMDPモデリングとアルゴリズム最適化という2つの段階に分けられ、ターゲットと効果的なエージェント生成を容易にする。
Model Context Protocolをベースに構築されたAgens$^2$は、さまざまな環境やアルゴリズムにわたる標準化されたエージェント作成のための統一されたフレームワークを提供し、適応的なトレーニング管理と、継続的改善のためのインテリジェントなフィードバック分析を取り入れている。
MuJoCo、MetaDrive、MPE、SMACなどのベンチマークに関する大規模な実験は、Agent$^2$がすべてのタスクで手動で設計されたベースラインより優れており、一貫した平均ゲインで最大55倍のパフォーマンス改善を実現していることを示している。
クローズドループでエンドツーエンドの自動化パイプラインを有効にすることで、エージェントが他のエージェントを設計、最適化できる新しいパラダイムを推進し、エージェント生成エージェントシステムのAI自動開発の可能性を強調します。
関連論文リスト
- AutoAgent: A Fully-Automated and Zero-Code Framework for LLM Agents [4.57755315319748]
大規模言語モデル (LLM) エージェントはタスクの自動化とインテリジェントな意思決定において顕著な能力を示した。
これらのフレームワークは、主に開発者に対して広範な技術的専門知識を提供する。
世界の人口の0.03%のみが必要なプログラミングスキルを持っている。
論文 参考訳(メタデータ) (2025-02-09T16:53:56Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [112.04307762405669]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z) - DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning [56.887047551101574]
大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。
開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。
デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文 参考訳(メタデータ) (2024-02-27T12:26:07Z) - A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.35849138235116]
本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-03T16:05:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。