論文の概要: MASPOB: Bandit-Based Prompt Optimization for Multi-Agent Systems with Graph Neural Networks
- arxiv url: http://arxiv.org/abs/2603.02630v1
- Date: Tue, 03 Mar 2026 05:59:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.658293
- Title: MASPOB: Bandit-Based Prompt Optimization for Multi-Agent Systems with Graph Neural Networks
- Title(参考訳): MASPOB:グラフニューラルネットワークを用いたマルチエージェントシステムの帯域ベースプロンプト最適化
- Authors: Zhi Hong, Qian Zhang, Jiahang Sun, Zhiwei Shang, Mingze Kong, Xiangyi Wang, Yao Shu, Zhongxiang Dai,
- Abstract要約: MASPOB(Multi-Agent System Prompt Optimization via Bandits)は,バンディットに基づく新しいサンプル効率フレームワークである。
トポロジによる結合を処理するため、MASPOBはグラフニューラルネットワーク(GNN)を統合して、構造的事前をキャプチャし、プロンプトセマンティクスのトポロジ対応表現を学習する。
- 参考スコア(独自算出の注目度): 21.211097851224487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) have achieved great success in many real-world applications, especially the one serving as the cognitive backbone of Multi-Agent Systems (MAS) to orchestrate complex workflows in practice. Since many deployment scenarios preclude MAS workflow modifications and its performance is highly sensitive to the input prompts, prompt optimization emerges as a more natural approach to improve its performance. However, real-world prompt optimization for MAS is impeded by three key challenges: (1) the need of sample efficiency due to prohibitive evaluation costs, (2) topology-induced coupling among prompts, and (3) the combinatorial explosion of the search space. To address these challenges, we introduce MASPOB (Multi-Agent System Prompt Optimization via Bandits), a novel sample-efficient framework based on bandits. By leveraging Upper Confidence Bound (UCB) to quantify uncertainty, the bandit framework balances exploration and exploitation, maximizing gains within a strictly limited budget. To handle topology-induced coupling, MASPOB integrates Graph Neural Networks (GNNs) to capture structural priors, learning topology-aware representations of prompt semantics. Furthermore, it employs coordinate ascent to decompose the optimization into univariate sub-problems, reducing search complexity from exponential to linear. Extensive experiments across diverse benchmarks demonstrate that MASPOB achieves state-of-the-art performance, consistently outperforming existing baselines.
- Abstract(参考訳): 大規模言語モデル(LLM)は多くの現実世界のアプリケーションで大きな成功を収めており、特にマルチエージェントシステム(MAS)の認知的バックボーンとして機能し、複雑なワークフローを実際にオーケストレーションしている。
多くのデプロイメントシナリオは、MASワークフローの変更を妨げ、そのパフォーマンスは入力プロンプトに非常に敏感であるため、迅速な最適化は、パフォーマンスを改善するためのより自然なアプローチとして現れます。
しかし,MASにおける実世界のプロンプト最適化は,(1)禁止評価コストによるサンプル効率の必要性,(2)プロンプト間のトポロジ誘起結合,(3)探索空間の組合せ爆発の3つの主要な課題によって妨げられている。
これらの課題に対処するため,バンドによるMASPOB (Multi-Agent System Prompt Optimization via Bandits)を導入する。
アッパー・信頼境界(UCB)を活用して不確実性を定量化することで、ランディット・フレームワークは探究と搾取のバランスをとり、厳格に制限された予算内で利得を最大化する。
トポロジによる結合を処理するため、MASPOBはグラフニューラルネットワーク(GNN)を統合して、構造的事前をキャプチャし、プロンプトセマンティクスのトポロジ対応表現を学習する。
さらに、座標上昇を用いて最適化を単変量部分確率に分解し、指数関数から線形への探索複雑性を減少させる。
様々なベンチマークにわたる大規模な実験は、MASPOBが最先端のパフォーマンスを達成し、既存のベースラインを一貫して上回っていることを示している。
関連論文リスト
- MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks [86.05918381895555]
関数呼び出し強化学習問題としてMASオーケストレーションを定式化する訓練時間フレームワークとしてMASOrchestraを提案する。
MAS-Orchestraでは、複雑なゴール指向のサブエージェントは呼び出し可能な関数として抽象化され、システム構造に対する大域的推論を可能にする。
分析の結果,MASはタスク構造や検証プロトコル,オーケストレータとサブエージェントの両方の機能に大きく依存していることが判明した。
論文 参考訳(メタデータ) (2026-01-21T04:57:02Z) - M$^3$Prune: Hierarchical Communication Graph Pruning for Efficient Multi-Modal Multi-Agent Retrieval-Augmented Generation [18.091284320771006]
本稿では,M$3$Prune と呼ばれる新しいマルチモーダルマルチエージェント階層型通信グラフ PRUNing フレームワークを提案する。
当社のフレームワークは,タスクパフォーマンスとトークンオーバーヘッドの最適バランスを達成するために,さまざまなモダリティをまたいだ冗長なエッジを排除します。
本手法はシングルエージェントとロバストマルチエージェントのmRAGシステムにおいて一貫して性能を向上する。
論文 参考訳(メタデータ) (2025-11-25T06:29:13Z) - Benchmarking Generative AI Against Bayesian Optimization for Constrained Multi-Objective Inverse Design [0.15293427903448018]
本稿では,制約付き多目的回帰タスクを解くための生成可能な言語モデル(LLM)の性能について検討する。
最高の性能のLDM(Math-7B)は1.21の世代距離(GD)を達成した。
この知見は, 樹脂, レオロジー, 化学特性の定式化設計の最適化に, 直接工業的応用が期待できる。
論文 参考訳(メタデータ) (2025-10-29T10:37:09Z) - Dynamic Generation of Multi-LLM Agents Communication Topologies with Graph Diffusion Models [99.85131798240808]
我々はtextitGuided Topology Diffusion (GTD) と呼ばれる新しい生成フレームワークを導入する。
条件付き離散グラフ拡散モデルにインスパイアされたGTD式は、反復的な構成過程としてトポロジー合成を行う。
各ステップで生成は、多目的報酬を予測する軽量プロキシモデルによって制御される。
実験により、GTDは高いタスク適応性、スパース、効率的な通信トポロジを生成できることが示されている。
論文 参考訳(メタデータ) (2025-10-09T05:28:28Z) - FedPOB: Sample-Efficient Federated Prompt Optimization via Bandits [44.444223633730154]
マルチアームバンディット(MAB)に基づく,サンプル効率の高いフェデレーションプロンプト最適化のための新しいフレームワークを提案する。
MABフレームワークは,(1)ブラックボックス最適化法,(2)事実上のサンプリング効率,(3)理論的に保証されたエージェントの利益と協調学習を可能にするため,この問題に特化している。
論文 参考訳(メタデータ) (2025-09-29T12:32:21Z) - syftr: Pareto-Optimal Generative AI [40.80352098169579]
syftrはエージェントと非エージェントのRAG構成の広い領域で効率的な多目的探索を行うフレームワークである。
Syftrは、最も正確な流れの正確さを保ちながら、平均して9倍のコストで流れを見つける。
論文 参考訳(メタデータ) (2025-05-26T17:43:13Z) - Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System [75.25394449773052]
大規模言語モデル (LLM) に基づくマルチエージェントシステム (MAS) は協調的問題解決において顕著な可能性を示している。
通信効率の低下、スケーラビリティの低下、効果的なパラメータ更新方法の欠如などです。
本稿では,コミュニケーション効率とタスク効率を両立させ,これらの課題に対処する新しいフレームワークOptimaを提案する。
論文 参考訳(メタデータ) (2024-10-10T17:00:06Z) - LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning [56.273799410256075]
このフレームワークはMonte Carlo Tree Search (MCTS)と反復的なSelf-Refineを組み合わせて推論パスを最適化する。
このフレームワークは、一般的なベンチマークと高度なベンチマークでテストされており、探索効率と問題解決能力の点で優れた性能を示している。
論文 参考訳(メタデータ) (2024-10-03T18:12:29Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Iterative Algorithm Induced Deep-Unfolding Neural Networks: Precoding
Design for Multiuser MIMO Systems [59.804810122136345]
本稿では,AIIDNN(ディープ・アンフォールディング・ニューラルネット)を一般化した,ディープ・アンフォールディングのためのフレームワークを提案する。
古典的重み付き最小二乗誤差(WMMSE)反復アルゴリズムの構造に基づく効率的なIAIDNNを提案する。
提案したIAIDNNは,計算複雑性を低減した反復WMMSEアルゴリズムの性能を効率よく向上することを示す。
論文 参考訳(メタデータ) (2020-06-15T02:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。