論文の概要: Learning to Evolve: A Self-Improving Framework for Multi-Agent Systems via Textual Parameter Graph Optimization
- arxiv url: http://arxiv.org/abs/2604.20714v1
- Date: Wed, 22 Apr 2026 16:00:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.211199
- Title: Learning to Evolve: A Self-Improving Framework for Multi-Agent Systems via Textual Parameter Graph Optimization
- Title(参考訳): Learning to Evolve: テキストパラメータグラフ最適化によるマルチエージェントシステムのための自己改善フレームワーク
- Authors: Shan He, Runze Wang, Zhuoyun Du, Huiyu Bai, Zouying Cao, Yu Cheng, Bo Zheng,
- Abstract要約: エージェントエンジニアリング(Agent Engineering)とは、マルチエージェントシステムの設計と最適化のプロセスである。
TPGOはマルチエージェントシステムの進化を可能にするフレームワークである。
我々のフレームワークの中核は、新しいメタ学習戦略であるグループ相対エージェント最適化(GRAO)である。
- 参考スコア(独自算出の注目度): 18.683909290649876
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Designing and optimizing multi-agent systems (MAS) is a complex, labor-intensive process of "Agent Engineering." Existing automatic optimization methods, primarily focused on flat prompt tuning, lack the structural awareness to debug the intricate web of interactions in MAS. More critically, these optimizers are static; they do not learn from experience to improve their own optimization strategies. To address these gaps, we introduce Textual Parameter Graph Optimization (TPGO), a framework that enables a multi-agent system to learn to evolve. TPGO first models the MAS as a Textual Parameter Graph (TPG), where agents, tools, and workflows are modular, optimizable nodes. To guide evolution, we derive "textual gradients," structured natural language feedback from execution traces, to pinpoint failures and suggest granular modifications. The core of our framework is Group Relative Agent Optimization (GRAO), a novel meta-learning strategy that learns from historical optimization experiences. By analyzing past successes and failures, GRAO becomes progressively better at proposing effective updates, allowing the system to learn how to optimize itself. Extensive experiments on complex benchmarks like GAIA and MCP-Universe show that TPGO significantly enhances the performance of state-of-the-art agent frameworks, achieving higher success rates through automated, self-improving optimization.
- Abstract(参考訳): マルチエージェントシステム(マルチエージェントシステム、MAS)の設計と最適化は、"エージェントエンジニアリング(Agent Engineering)"の複雑な、労働集約的なプロセスである。
既存の自動最適化手法は、主にフラットなプロンプトチューニングに焦点を当てており、MASにおける複雑な相互作用のウェブをデバッグする構造的認識を欠いている。
さらに重要なのは、これらのオプティマイザは静的であり、経験から学び、自身の最適化戦略を改善することはできない。
テキストパラメータグラフ最適化(TPGO)は,マルチエージェントシステムの進化を学習するためのフレームワークである。
TPGOはまず、エージェント、ツール、ワークフローがモジュール化され、最適化可能なノードである、テキストパラメータグラフ(TPG)としてMASをモデル化する。
進化を導くために、我々は「テクスチュアル・グラデーション」を導き、構造化された自然言語のフィードバックを実行トレースから導き、失敗をピンポイントし、きめ細かい修正を提案する。
我々のフレームワークの中核は、歴史的な最適化経験から学ぶ新しいメタラーニング戦略であるグループ相対エージェント最適化(GRAO)である。
過去の成功と失敗を分析することで、GRAOは効果的なアップデートの提案を徐々に改善し、システムが自身の最適化方法を学べるようにします。
GAIA や MCP-Universe のような複雑なベンチマークの広範な実験により、TPGO は最先端のエージェントフレームワークの性能を大幅に向上し、自動化された自己改善最適化によってより高い成功率を達成することが示されている。
関連論文リスト
- VeriAgent: A Tool-Integrated Multi-Agent System with Evolving Memory for PPA-Aware RTL Code Generation [52.43796056267479]
高品質なベリログコード生成のためのPPA対応ツール統合マルチエージェントフレームワークを提案する。
当社のフレームワークでは,EDAツールをtextitProgrammer Agent, textitCorrectness Agent, textitPPA Agentで構成されるクローズドループワークフローに明示的に組み込んでいる。
モデル再トレーニングなしに継続的な改善をサポートするために,構造化メモリノードに最適化エクスペリエンスを外部化するtextitEvolved Memory Mechanismを導入する。
論文 参考訳(メタデータ) (2026-03-18T11:25:40Z) - Reflection-Enhanced Meta-Optimization Integrating TextGrad-style Prompt Optimization with Memory-Driven Self-Evolution [0.0]
本稿では,メモリ拡張リフレクションRetrievalRAGモジュールと自己適応型メタコントローラを統合するフレームワークを提案する。
REMOは、計算オーバーヘッドの増加にもかかわらず、より安定で堅牢なチューニングを実現する。
論文 参考訳(メタデータ) (2025-08-26T07:25:45Z) - Language-Guided Tuning: Enhancing Numeric Optimization with Textual Feedback [1.2106694524257837]
自然言語推論による設定をインテリジェントに最適化するために,多エージェント大規模言語モデルを用いた新しいフレームワークであるLanguage-Guided Tuning (LGT)を紹介した。
トレーニング力学と構成相互依存性のセマンティック理解を提供することにより,数値最適化を補完するテキスト質的なフィードバック信号を適用する。
LGTは従来の最適化手法よりも大幅に改善され、高い解釈可能性を維持しながら性能向上を実現している。
論文 参考訳(メタデータ) (2025-08-21T17:55:07Z) - A Survey on the Optimization of Large Language Model-based Agents [16.733092886211097]
大規模言語モデル(LLM)は様々な分野で広く採用されており、自律的な意思決定や対話的なタスクに欠かせないものとなっている。
しかしながら、現在の作業は通常、バニラLLMに適用された迅速な設計や微調整戦略に依存している。
LLMに基づくエージェント最適化手法の総合的なレビューを行い、パラメータ駆動型およびパラメータフリーな手法に分類する。
論文 参考訳(メタデータ) (2025-03-16T10:09:10Z) - LLM as a Complementary Optimizer to Gradient Descent: A Case Study in Prompt Tuning [69.95292905263393]
グラデーションベースとハイレベルなLLMは、協調最適化フレームワークを効果的に組み合わせることができることを示す。
本稿では,これらを相互に補完し,組み合わせた最適化フレームワークを効果的に連携させることができることを示す。
論文 参考訳(メタデータ) (2024-05-30T06:24:14Z) - Unleashing the Potential of Large Language Models as Prompt Optimizers: Analogical Analysis with Gradient-based Model Optimizers [108.72225067368592]
本稿では,大規模言語モデル(LLM)に基づくプロンプトの設計について検討する。
モデルパラメータ学習における2つの重要な要素を同定する。
グラディエントにインスパイアされた Prompt ベースの GPO を開発した。
論文 参考訳(メタデータ) (2024-02-27T15:05:32Z) - Optimization-Inspired Learning with Architecture Augmentations and
Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。
フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。
低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文 参考訳(メタデータ) (2020-12-10T03:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。