論文の概要: MAS-PromptBench: When Does Prompt Optimization Improve Multi-Agent LLM Systems?
- arxiv url: http://arxiv.org/abs/2606.23664v1
- Date: Mon, 22 Jun 2026 17:48:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 17:23:57.852462
- Title: MAS-PromptBench: When Does Prompt Optimization Improve Multi-Agent LLM Systems?
- Title(参考訳): MAS-PromptBench: プロンプト最適化はマルチエージェントLLMシステムを改善するか?
- Authors: Juyang Bai, Laixi Shi,
- Abstract要約: マルチエージェントシステム(MAS)はエージェントAIのためのスケーラブルなパスを提供する。
システムプロンプトはエージェントの役割と振る舞いを指定し、モデル微調整なしでシステムレベルの改善を可能にする。
どの程度の迅速な最適化がMAS性能を改善するか、いつ、いつ、どのようにして、まだ不明である。
- 参考スコア(独自算出の注目度): 12.31270556465256
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent systems (MAS) offer a scalable path forward for agentic AI, comprising multiple LLM-based agents, each assigned a system prompt and a position within a workflow that governs inter-agent coordination and output aggregation. System prompts thus form a critical and accessible optimization surface: they specify agents' roles and behaviors, enabling system-level improvements without model finetuning. Although prompt optimization has shown substantial potential for single LLMs, extending it to MAS poses distinct challenges, notably an exponentially growing search space. It remains unclear whether, when, and by how much prompt optimization improves MAS performance, and how sensitive such gains are to system configuration. In this work, we systematically study system-prompt optimization across a broad range of MAS setups varying in task, workflow, communication protocol, and team size, benchmarking two prompt optimizers that naturally extend state-of-the-art single-agent methods. The results reveal its potential to unlock significant gains while exposing open challenges, characterizing when and how much prompt optimization helps across diverse MAS settings.
- Abstract(参考訳): マルチエージェントシステム(MAS)はエージェントAIのためのスケーラブルなパスを提供し、複数のLSMベースのエージェントで構成され、それぞれがエージェント間の調整と出力アグリゲーションを管理するワークフロー内のシステムプロンプトと位置を割り当てる。
エージェントの役割と振る舞いを指定し、モデルの微調整なしにシステムレベルの改善を可能にする。
迅速な最適化は単一の LLM に対して大きな可能性を示しているが、MAS に拡張することで、特に指数関数的に増加する検索空間において、異なる課題が生じる。
どの程度の迅速な最適化がMAS性能を改善するか、システム構成にどの程度敏感になるかは、まだ不明である。
本研究では,タスク,ワークフロー,通信プロトコル,チームサイズなど多種多様なMASセットアップに対して,システムプロンプト最適化を体系的に検討し,最先端の単一エージェントメソッドを自然に拡張する2つのプロンプトオプティマイザをベンチマークする。
結果は、オープンな課題を露呈し、様々なMAS設定でどの程度の迅速な最適化が役立つかを特徴づけながら、大きな利益を得る可能性を明らかにしている。
関連論文リスト
- Agent-GWO: Collaborative Agents for Dynamic Prompt Optimization in Large Language Models [69.55139736609367]
Agent-GWOは複雑な推論のための動的プロンプト最適化フレームワークである。
本稿では,Agent-GWOが既存のプロンプト最適化手法よりも精度と安定性を一貫して向上することを示す。
論文 参考訳(メタデータ) (2026-04-14T07:35:37Z) - MAPRO: Recasting Multi-Agent Prompt Optimization as Maximum a Posteriori Inference [40.87762929194057]
MAPRO (Multi-Agent PRompt Optimization) は、まずMASの最適化を、MAP(Maximum a Posteriori)推論問題として定式化するフレームワークである。
クレジットの割り当てに対処し、システムを反復的に更新するために、MAPROはトポロジ対応のリファインメント機構を採用している。
MAPROは様々なタスクのベンチマークで最先端のパフォーマンスを達成し、手作業によるベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2025-10-08T19:21:24Z) - Optimizing LLM-Based Multi-Agent System with Textual Feedback: A Case Study on Software Development [14.245155142689988]
自然言語フィードバックを利用したロールベースマルチエージェントシステムのグループ最適化に関する実証事例研究を行った。
本稿では,2段階のエージェントプロンプトの最適化パイプラインを提案し,性能の低いエージェントを同定し,特定エージェントのシステムプロンプトを最適化する。
本研究では,多様な評価次元で評価されたソフトウェア開発タスクに対処するロールベースマルチエージェントシステムに対する最適化手法の有効性を実証する。
論文 参考訳(メタデータ) (2025-05-22T00:00:27Z) - System Prompt Optimization with Meta-Learning [64.74765550805024]
本稿では,多様なユーザプロンプトに対して堅牢なシステムプロンプトを設計することを目的とした,バイレベルシステムプロンプト最適化の新たな課題を紹介する。
本稿では,複数のデータセットにまたがるさまざまなユーザプロンプトに対して最適化することで,システムプロンプトをメタラーニングするメタラーニングフレームワークを提案する。
5つの異なるドメインにまたがる14の未知のデータセットに対して実験を行い、このアプローチが多様なユーザプロンプトに効果的に一般化するシステムプロンプトを生成することを示す。
論文 参考訳(メタデータ) (2025-05-14T16:46:15Z) - Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies [41.21314691388456]
対話やコラボレーションを行う複数のエージェントとして使用される大規模な言語モデルは、複雑なタスクの解決に優れています。
マルチエージェントシステム(MAS)のプロンプトやトポロジーの設計は本質的に複雑である。
複雑なMAS設計空間を効率的に活用するMAS最適化フレームワークであるMulti-Agent System Search (MASS)を提案する。
論文 参考訳(メタデータ) (2025-02-04T17:56:44Z) - SPRIG: Improving Large Language Model Performance by System Prompt Optimization [45.96513122345295]
大きな言語モデル(LLM)は多くのシナリオで印象的な機能を示しているが、そのパフォーマンスはプロンプトの選択に依存している。
本研究では,モデルの性能を最大化するために,既定成分からのプロンプトを反復的に構築する編集に基づく遺伝的アルゴリズムであるSPRIGを提案する。
47種類のタスクの集合に対して,システムプロンプトの性能を評価し,一般化性を確保する。
論文 参考訳(メタデータ) (2024-10-18T18:51:44Z) - Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System [75.25394449773052]
大規模言語モデル (LLM) に基づくマルチエージェントシステム (MAS) は協調的問題解決において顕著な可能性を示している。
通信効率の低下、スケーラビリティの低下、効果的なパラメータ更新方法の欠如などです。
本稿では,コミュニケーション効率とタスク効率を両立させ,これらの課題に対処する新しいフレームワークOptimaを提案する。
論文 参考訳(メタデータ) (2024-10-10T17:00:06Z) - MAPO: Boosting Large Language Model Performance with Model-Adaptive Prompt Optimization [73.7779735046424]
異なるプロンプトを異なるLarge Language Models (LLM) に適応させることで,NLP の様々な下流タスクにまたがる機能の向上が期待できる。
次に、下流タスクにおける各LLMに対して、元のプロンプトを最適化するモデル適応プロンプト(MAPO)手法を提案する。
論文 参考訳(メタデータ) (2024-07-04T18:39:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。