Fugu-MT 論文翻訳(概要): Learning to Evolve: A Self-Improving Framework for Multi-Agent Systems via Textual Parameter Graph Optimization

論文の概要: Learning to Evolve: A Self-Improving Framework for Multi-Agent Systems via Textual Parameter Graph Optimization

arxiv url: http://arxiv.org/abs/2604.20714v1
Date: Wed, 22 Apr 2026 16:00:46 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-23 15:36:11.211199
Title: Learning to Evolve: A Self-Improving Framework for Multi-Agent Systems via Textual Parameter Graph Optimization
Title（参考訳）: Learning to Evolve: テキストパラメータグラフ最適化によるマルチエージェントシステムのための自己改善フレームワーク
Authors: Shan He, Runze Wang, Zhuoyun Du, Huiyu Bai, Zouying Cao, Yu Cheng, Bo Zheng,
Abstract要約: エージェントエンジニアリング(Agent Engineering)とは、マルチエージェントシステムの設計と最適化のプロセスである。 TPGOはマルチエージェントシステムの進化を可能にするフレームワークである。我々のフレームワークの中核は、新しいメタ学習戦略であるグループ相対エージェント最適化(GRAO)である。
参考スコア（独自算出の注目度）: 18.683909290649876
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Designing and optimizing multi-agent systems (MAS) is a complex, labor-intensive process of "Agent Engineering." Existing automatic optimization methods, primarily focused on flat prompt tuning, lack the structural awareness to debug the intricate web of interactions in MAS. More critically, these optimizers are static; they do not learn from experience to improve their own optimization strategies. To address these gaps, we introduce Textual Parameter Graph Optimization (TPGO), a framework that enables a multi-agent system to learn to evolve. TPGO first models the MAS as a Textual Parameter Graph (TPG), where agents, tools, and workflows are modular, optimizable nodes. To guide evolution, we derive "textual gradients," structured natural language feedback from execution traces, to pinpoint failures and suggest granular modifications. The core of our framework is Group Relative Agent Optimization (GRAO), a novel meta-learning strategy that learns from historical optimization experiences. By analyzing past successes and failures, GRAO becomes progressively better at proposing effective updates, allowing the system to learn how to optimize itself. Extensive experiments on complex benchmarks like GAIA and MCP-Universe show that TPGO significantly enhances the performance of state-of-the-art agent frameworks, achieving higher success rates through automated, self-improving optimization.
Abstract（参考訳）: マルチエージェントシステム(マルチエージェントシステム、MAS)の設計と最適化は、"エージェントエンジニアリング(Agent Engineering)"の複雑な、労働集約的なプロセスである。既存の自動最適化手法は、主にフラットなプロンプトチューニングに焦点を当てており、MASにおける複雑な相互作用のウェブをデバッグする構造的認識を欠いている。さらに重要なのは、これらのオプティマイザは静的であり、経験から学び、自身の最適化戦略を改善することはできない。テキストパラメータグラフ最適化(TPGO)は,マルチエージェントシステムの進化を学習するためのフレームワークである。 TPGOはまず、エージェント、ツール、ワークフローがモジュール化され、最適化可能なノードである、テキストパラメータグラフ(TPG)としてMASをモデル化する。進化を導くために、我々は「テクスチュアル・グラデーション」を導き、構造化された自然言語のフィードバックを実行トレースから導き、失敗をピンポイントし、きめ細かい修正を提案する。我々のフレームワークの中核は、歴史的な最適化経験から学ぶ新しいメタラーニング戦略であるグループ相対エージェント最適化(GRAO)である。過去の成功と失敗を分析することで、GRAOは効果的なアップデートの提案を徐々に改善し、システムが自身の最適化方法を学べるようにします。 GAIA や MCP-Universe のような複雑なベンチマークの広範な実験により、TPGO は最先端のエージェントフレームワークの性能を大幅に向上し、自動化された自己改善最適化によってより高い成功率を達成することが示されている。

論文の概要: Learning to Evolve: A Self-Improving Framework for Multi-Agent Systems via Textual Parameter Graph Optimization

関連論文リスト