論文の概要: Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning
- arxiv url: http://arxiv.org/abs/2511.16043v1
- Date: Thu, 20 Nov 2025 05:01:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.471741
- Title: Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning
- Title(参考訳): Agent0: ツール統合推論によるゼロデータからの自己進化エージェントの解放
- Authors: Peng Xia, Kaide Zeng, Jiaqi Liu, Can Qin, Fang Wu, Yiyang Zhou, Caiming Xiong, Huaxiu Yao,
- Abstract要約: 大規模言語モデル(LLM)エージェントは、人間の計算データへの依存によって制約される。
我々は,外部データを持たない高性能エージェントを進化させる完全自律型フレームワークであるAgent0を紹介する。
Agent0は推論能力を大幅に向上させ、Qwen3-8B-Baseモデルを数学的推論で18%改善し、一般的な推論ベンチマークで24%改善した。
- 参考スコア(独自算出の注目度): 84.70211451226835
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Model (LLM) Agents, often trained with Reinforcement Learning (RL), are constrained by a dependency on human-curated data, limiting scalability and tethering AI to human knowledge. Existing self-evolution frameworks offer an alternative but are typically restricted by the model's inherent capabilities and single-round interactions, hindering the development of complex curricula involving tool use or dynamic reasoning. We introduce Agent0, a fully autonomous framework that evolves high-performing agents without external data through multi-step co-evolution and seamless tool integration. Agent0 establishes a symbiotic competition between two agents initialized from the same base LLM: a curriculum agent that proposes increasingly challenging frontier tasks, and an executor agent that learns to solve them. We integrate external tools to enhance the executor's problem-solving capacity; this improvement, in turn, pressures the curriculum agent to construct more complex, tool-aware tasks. Through this iterative process, Agent0 establishes a self-reinforcing cycle that continuously produces high-quality curricula. Empirically, Agent0 substantially boosts reasoning capabilities, improving the Qwen3-8B-Base model by 18% on mathematical reasoning and 24% on general reasoning benchmarks. Code is available at https://github.com/aiming-lab/Agent0.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントは、強化学習(RL)で訓練されることが多いが、人間の計算データへの依存、スケーラビリティの制限、AIを人間の知識に結びつけることによる制約がある。
既存の自己進化フレームワークは代替手段を提供するが、典型的にはモデル固有の機能とシングルラウンドの相互作用によって制限され、ツールの使用や動的推論を含む複雑なカリキュラムの開発を妨げる。
我々は,マルチステップの共同進化とシームレスなツール統合を通じて,外部データなしでハイパフォーマンスエージェントを進化させる,完全に自律的なフレームワークであるAgent0を紹介した。
Agent0は、より困難なフロンティアタスクを提案するカリキュラムエージェントと、それらを解決することを学ぶエグゼクタエージェントの2つのエージェントの共生競争を確立する。
我々は、実行者の問題解決能力を高めるために外部ツールを統合する。この改善により、カリキュラムエージェントはより複雑なツール対応タスクを構築するよう圧力をかける。
この反復過程を通じて、Agent0は高品質なキュリキュラを連続的に生成する自己強化サイクルを確立する。
実証的には、Agent0は推論能力を大幅に向上し、Qwen3-8B-Baseモデルを数学的推論で18%改善し、一般的な推論ベンチマークで24%改善した。
コードはhttps://github.com/aiming-lab/Agent0.comで入手できる。
関連論文リスト
- $Agent^2$: An Agent-Generates-Agent Framework for Reinforcement Learning Automation [5.325886106098561]
強化学習(RL)エージェント開発は伝統的にかなりの専門知識と反復的な努力を必要とする。
本稿では,完全自動RLエージェント設計のための LLM 駆動型エージェント生成エージェントフレームワークである Agent$2$ を紹介する。
Agent$2$は、自然言語のタスク記述と環境コードを人間の介入なしに実行可能なRLソリューションに変換する。
論文 参考訳(メタデータ) (2025-09-16T02:14:39Z) - SEAgent: Self-Evolving Computer Use Agent with Autonomous Learning from Experience [71.82719117238307]
本稿では,コンピュータ利用エージェントが不慣れなソフトウェアとのインタラクションを通じて進化することを可能にするエージェント型自己進化フレームワークSEAgentを提案する。
我々は、OS-World内の5つの新しいソフトウェア環境におけるSEAgentの有効性を検証する。
当社のアプローチは,競合するオープンソースCUAに比べて,11.3%から34.5%という,23.2%の大幅な改善を実現している。
論文 参考訳(メタデータ) (2025-08-06T17:58:46Z) - Agent Lightning: Train ANY AI Agents with Reinforcement Learning [24.13422767414729]
我々は,任意のAIエージェントに対して,強化学習(RL)に基づくLarge Language Models(LLM)のトレーニングを可能にするフレームワークであるAgens Lightningを提案する。
エージェント実行をマルコフ決定プロセスとして定式化することにより、統一データインターフェースを定義し、クレジット代入モジュールを含む階層的RLアルゴリズムLightningRLを提案する。
システム設計のために、トレーニング・エージェント・デアグリゲーションアーキテクチャを導入し、エージェント・オブザーバビリティ・フレームワークをエージェント・ランタイムに導入する。
論文 参考訳(メタデータ) (2025-08-05T17:50:13Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [112.04307762405669]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。