論文の概要: Maestro: Joint Graph & Config Optimization for Reliable AI Agents
- arxiv url: http://arxiv.org/abs/2509.04642v1
- Date: Thu, 04 Sep 2025 20:00:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.40116
- Title: Maestro: Joint Graph & Config Optimization for Reliable AI Agents
- Title(参考訳): Maestro: 信頼性の高いAIエージェントのための統合グラフと構成最適化
- Authors: Wenxiao Wang, Priyatham Kattakinda, Soheil Feizi,
- Abstract要約: Maestro は LLM エージェントのための全体論的に依存しないフレームワークであり、エージェントの品質を最大化するためにグラフや構成を共同で検索する。
IFBenchとHotpotQAのベンチマークでは、MIPROv2、GEPA、GEPA+といった主要なプロンプトを平均12%--4.9%、それぞれ4.86%上回っている。
- 参考スコア(独自算出の注目度): 53.71882250666667
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Building reliable LLM agents requires decisions at two levels: the graph (which modules exist and how information flows) and the configuration of each node (models, prompts, tools, control knobs). Most existing optimizers tune configurations while holding the graph fixed, leaving structural failure modes unaddressed. We introduce Maestro, a framework-agnostic holistic optimizer for LLM agents that jointly searches over graphs and configurations to maximize agent quality, subject to explicit rollout/token budgets. Beyond numeric metrics, Maestro leverages reflective textual feedback from traces to prioritize edits, improving sample efficiency and targeting specific failure modes. On the IFBench and HotpotQA benchmarks, Maestro consistently surpasses leading prompt optimizers--MIPROv2, GEPA, and GEPA+Merge--by an average of 12%, 4.9%, and 4.86%, respectively; even when restricted to prompt-only optimization, it still leads by 9.65%, 2.37%, and 2.41%. Maestro achieves these results with far fewer rollouts than GEPA. We further show large gains on two applications (interviewer & RAG agents), highlighting that joint graph & configuration search addresses structural failure modes that prompt tuning alone cannot fix.
- Abstract(参考訳): 信頼できるLCMエージェントを構築するには、グラフ(どのモジュールが存在し、どのように情報の流れが流れるか)と各ノードの設定(モデル、プロンプト、ツール、ノブを制御する)という2つのレベルで決定が必要である。
ほとんどの既存のオプティマイザは、グラフを固定しながら構成を調整する。
本稿では,LLMエージェントのフレームワークに依存しない全体最適化手法であるMaestroを紹介した。
Maestroは数値メトリクス以外にも、トレースからの反射的なテキストフィードバックを活用して編集を優先順位付けし、サンプル効率を改善し、特定の障害モードをターゲットにしている。
IFBenchとHotpotQAのベンチマークでは、MIPROv2、GEPA、GEPA+Mergeをそれぞれ平均12%、4.9%、および4.86%で上回っている。
Maestro はこれらの結果を GEPA よりもはるかに少ないロールアウトで達成している。
さらに2つのアプリケーション(インタビューアとRAGエージェント)に対して大きな利得を示し、共同グラフと構成検索は、チューニングの速さだけでは修正できない構造的障害モードに対処する。
関連論文リスト
- GraphCogent: Overcoming LLMs' Working Memory Constraints via Multi-Agent Collaboration in Complex Graph Understanding [8.297882768573427]
大規模言語モデル(LLM)は、小規模なグラフ推論タスクでは有望な性能を示すが、複雑なクエリで現実のグラフを扱うと失敗する。
グラフ推論を特殊な認知プロセス(センス、バッファ、実行)に分解する協調エージェントフレームワークであるGraphCogentを提案する。
論文 参考訳(メタデータ) (2025-08-17T14:28:38Z) - Graph Counselor: Adaptive Graph Exploration via Multi-Agent Synergy to Enhance LLM Reasoning [4.703280619961521]
GraphRAGは、知識関係を明示的にモデル化することで、外部知識統合機能を効果的に強化する。
既存の方法には2つの固有の制限がある。
マルチエージェント協調に基づくグラフRAG法であるGraph Counselorを提案する。
論文 参考訳(メタデータ) (2025-06-04T13:31:21Z) - MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。
MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文 参考訳(メタデータ) (2025-05-21T00:56:09Z) - Scalable and Accurate Graph Reasoning with LLM-based Multi-Agents [27.4884498301785]
GraphAgent-Reasonerは、明示的で正確なグラフ推論のための微調整不要なフレームワークである。
分散グラフ計算理論にインスパイアされた我々のフレームワークは、グラフ問題を複数のエージェント間で分散される小さなノード中心のタスクに分解する。
本フレームワークは,Webページ重要度分析などの実世界のグラフ推論アプリケーションを扱う能力を示す。
論文 参考訳(メタデータ) (2024-10-07T15:34:14Z) - Can Large Language Models Analyze Graphs like Professionals? A Benchmark, Datasets and Models [88.4320775961431]
グラフを処理するために,大規模言語モデル(LLM)のベンチマークであるProGraphを導入する。
その結果,現在のLCMの性能は不満足であり,最高のモデルでは36%の精度しか達成できないことがわかった。
本研究では,6つの広く使用されているグラフライブラリに基づいて,クローリングされたドキュメントと自動生成コードを含むLLM4Graphデータセットを提案する。
論文 参考訳(メタデータ) (2024-09-29T11:38:45Z) - Language Agents as Optimizable Graphs [31.220547147952278]
本稿では,Large Language Models (LLM) ベースのエージェントを計算グラフとして記述する。
我々のフレームワークは、様々なLSMエージェントを効率的に開発し、統合し、自動的に改善するために使用することができる。
論文 参考訳(メタデータ) (2024-02-26T18:48:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。