論文の概要: MAPGD: Multi-Agent Prompt Gradient Descent for Collaborative Prompt Optimization
- arxiv url: http://arxiv.org/abs/2509.11361v2
- Date: Tue, 07 Oct 2025 09:25:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 15:38:21.478914
- Title: MAPGD: Multi-Agent Prompt Gradient Descent for Collaborative Prompt Optimization
- Title(参考訳): MAPGD:協調型プロンプト最適化のためのマルチエージェントプロンプト勾配
- Authors: Yichen Han, Yuhang Han, Bojun Liu, Zhengpeng Zhou, Guanyu Liu, Zeng Zhang, Yang Yang, Wenli Wang, Isaac N Shi, Yunyan Zhang, Lewei He, Tianyu Shi,
- Abstract要約: 本稿では,プロンプト最適化を特殊エージェント間の協調プロセスとして再認識する新しいフレームワークを提案する。
各エージェントは、指示明快さ、例選択、フォーマット構造、スタイル適応など、明確な精細化の次元に重点を置いている。
我々はMAPGDが精度と効率の両面で単一エージェントとランダムベースラインを一貫して上回っていることを示す。
- 参考スコア(独自算出の注目度): 11.108961365820136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Prompt engineering is crucial for fully leveraging large language models (LLMs), yet most existing optimization methods follow a single trajectory, resulting in limited adaptability, gradient conflicts, and high computational overhead. We propose MAPGD (Multi-Agent Prompt Gradient Descent), a novel framework that reconceptualizes prompt optimization as a collaborative process among specialized agents. Each agent focuses on a distinct refinement dimension, such as instruction clarity, example selection, format structure, or stylistic adaptation, and their contributions are coordinated through semantic gradient embedding, conflict detection, and fusion. To further enhance robustness and stability, MAPGD introduces two new mechanisms: Hypersphere Constrained Gradient Clustering (HCGC), which enforces angular margin constraints for compact and well-separated clusters, and Channel Adaptive Agent Weighting (CAAW), which dynamically reweights agent contributions based on validation performance. Experiments on classification and reasoning benchmarks show that MAPGD consistently surpasses single-agent and random baselines in both accuracy and efficiency. Ablation studies confirm the effectiveness of gradient fusion, agent specialization, and conflict resolution. Together, these components establish MAPGD as a unified, gradient-based, and interpretable framework for robust prompt optimization with theoretical convergence guarantees.
- Abstract(参考訳): プロンプトエンジニアリングは大規模言語モデル(LLM)の完全活用に不可欠であるが、既存の最適化手法の多くは単一の軌道を踏襲し、適応性、勾配の衝突、高い計算オーバーヘッドをもたらす。
我々は,プロンプト最適化を特殊エージェント間の協調プロセスとして再認識する新しいフレームワークであるMAPGD(Multi-Agent Prompt Gradient Descent)を提案する。
各エージェントは、指示の明確さ、例の選択、形式構造、スタイリスティックな適応など、明確な洗練次元に焦点を合わせ、それらの貢献はセマンティックグラデーションの埋め込み、コンフリクト検出、融合を通じて調整される。
堅牢性と安定性をさらに高めるために、MAPGDは、コンパクトで分離されたクラスタの角縁制限を強制するHypersphere Constrained Gradient Clustering (HCGC)と、検証パフォーマンスに基づいたエージェントコントリビューションを動的に強調するChannel Adaptive Agent Weighting (CAAW)の2つの新しいメカニズムを導入した。
分類と推論のベンチマーク実験により、MAPGDは精度と効率の両面で単一エージェントとランダムベースラインを一貫して上回っていることが示された。
アブレーション研究は、勾配融合、エージェント特殊化、競合解消の有効性を検証している。
これらのコンポーネントは、理論収束保証を伴う堅牢なプロンプト最適化のための統一的、勾配ベース、解釈可能なフレームワークとしてMAPGDを確立する。
関連論文リスト
- Collab: Controlled Decoding using Mixture of Agents for LLM Alignment [90.6117569025754]
人間のフィードバックからの強化学習は、大規模言語モデルを整合させる効果的な手法として現れてきた。
制御された復号化は、再訓練せずに推論時にモデルを整列するメカニズムを提供する。
本稿では,既存の既成のLCMポリシを活用するエージェントベースのデコーディング戦略の混合を提案する。
論文 参考訳(メタデータ) (2025-03-27T17:34:25Z) - Learning to Solve the Min-Max Mixed-Shelves Picker-Routing Problem via Hierarchical and Parallel Decoding [0.3867363075280544]
混合棚ピッカールーティング問題(MSPRP)はロジスティクスにおける基本的な課題であり、ピッカーはSKUを効率的に回収するために混合棚環境をナビゲートする必要がある。
マルチエージェント強化学習により,MSPRPのmin-max変異を解くための新しい階層的並列デコーディング手法を提案する。
実験では、特に大規模およびアウト・オブ・ディストリビューションインスタンスにおいて、ソリューションの品質と推論速度の両方で最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-02-14T15:42:30Z) - Near-Optimal Online Learning for Multi-Agent Submodular Coordination: Tight Approximation and Communication Efficiency [52.60557300927007]
離散部分モジュラー問題を連続的に最適化するために,$textbfMA-OSMA$アルゴリズムを提案する。
また、一様分布を混合することによりKLの発散を効果的に活用する、プロジェクションフリーな$textbfMA-OSEA$アルゴリズムも導入する。
我々のアルゴリズムは最先端OSGアルゴリズムによって提供される$(frac11+c)$-approximationを大幅に改善する。
論文 参考訳(メタデータ) (2025-02-07T15:57:56Z) - SPGD: Steepest Perturbed Gradient Descent Optimization [0.0]
本稿では,Steepest Perturbed Gradient Descent (SPGD)アルゴリズムを提案する。
一連の候補解を生成し、最も急な損失差を示すものを選択するように設計されている。
予備結果は4つの確立された方法よりも大幅に改善された。
論文 参考訳(メタデータ) (2024-11-07T18:23:30Z) - Conflict-Averse Gradient Optimization of Ensembles for Effective Offline
Model-Based Optimization [0.0]
我々は、多重勾配降下アルゴリズム(MGDA)と競合逆勾配降下アルゴリズム(CAGrad)の2つの勾配情報を組み合わせたアルゴリズムを評価する。
以上の結果から,MGDAとCAGradは保存性と最適性の間に望ましいバランスを保ち,設計の最適性を損なうことなく,データ駆動型オフラインMBOの堅牢化に寄与することが示唆された。
論文 参考訳(メタデータ) (2023-03-31T10:00:27Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z) - An Empirical Evaluation of Zeroth-Order Optimization Methods on
AI-driven Molecule Optimization [78.36413169647408]
分子目的を最適化するための様々なZO最適化手法の有効性について検討する。
ZO符号に基づく勾配降下(ZO-signGD)の利点を示す。
本稿では,Guurcamol スイートから広く使用されているベンチマークタスクに対して,ZO 最適化手法の有効性を示す。
論文 参考訳(メタデータ) (2022-10-27T01:58:10Z) - ECO-TR: Efficient Correspondences Finding Via Coarse-to-Fine Refinement [80.94378602238432]
粗大な処理で対応性を見出すことにより、ECO-TR(Correspondence Efficient Transformer)と呼ばれる効率的な構造を提案する。
これを実現するために、複数の変圧器ブロックは段階的に連結され、予測された座標を徐々に洗練する。
種々のスパースタスクと密マッチングタスクの実験は、既存の最先端技術に対する効率性と有効性の両方において、我々の手法の優位性を実証している。
論文 参考訳(メタデータ) (2022-09-25T13:05:33Z) - Domain Adaptive Person Re-Identification via Coupling Optimization [58.567492812339566]
ドメイン適応型人物再識別(ReID)は、ドメインのギャップとターゲットシナリオに対するアノテーションの不足のために困難である。
本稿では,ドメイン不変写像 (DIM) 法とグローバル局所距離最適化 (GLO) を含む結合最適化手法を提案する。
GLOはターゲットドメインの教師なし設定でReIDモデルをトレーニングするために設計されている。
論文 参考訳(メタデータ) (2020-11-06T14:01:03Z) - Optimizing Cooperative path-finding: A Scalable Multi-Agent RRT* with Dynamic Potential Fields [11.872579571976903]
本研究では,多エージェントRT*ポテンシャル場(MA-RRT*PF)を提案する。
実験による評価は,MA-RRT*PFの高密度環境における従来のマルチエージェントRT* (MA-RRT*) よりも有意な優位性を示した。
論文 参考訳(メタデータ) (2019-11-16T13:02:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。