論文の概要: MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks
- arxiv url: http://arxiv.org/abs/2601.14652v1
- Date: Wed, 21 Jan 2026 04:57:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.235919
- Title: MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks
- Title(参考訳): MAS-Orchestra: ホロスティックオーケストレーションと制御ベンチマークによるマルチエージェント推論の理解と改善
- Authors: Zixuan Ke, Yifei Ming, Austin Xu, Ryan Chin, Xuan-Phi Nguyen, Prathyusha Jwalapuram, Semih Yavuz, Caiming Xiong, Shafiq Joty,
- Abstract要約: 我々は,MASオーケストレーションを関数呼び出し強化学習問題として定式化する訓練時間フレームワークとしてMAS-Orchestraを提案する。
MAS-Orchestraでは、複雑なゴール指向のサブエージェントは呼び出し可能な関数として抽象化され、システム構造に対する大域的推論を可能にする。
分析の結果,MASはタスク構造や検証プロトコル,オーケストレータとサブエージェントの両方の機能に大きく依存していることが判明した。
- 参考スコア(独自算出の注目度): 84.33314368574602
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: While multi-agent systems (MAS) promise elevated intelligence through coordination of agents, current approaches to automatic MAS design under-deliver. Such shortcomings stem from two key factors: (1) methodological complexity - agent orchestration is performed using sequential, code-level execution that limits global system-level holistic reasoning and scales poorly with agent complexity - and (2) efficacy uncertainty - MAS are deployed without understanding if there are tangible benefits compared to single-agent systems (SAS). We propose MAS-Orchestra, a training-time framework that formulates MAS orchestration as a function-calling reinforcement learning problem with holistic orchestration, generating an entire MAS at once. In MAS-Orchestra, complex, goal-oriented sub-agents are abstracted as callable functions, enabling global reasoning over system structure while hiding internal execution details. To rigorously study when and why MAS are beneficial, we introduce MASBENCH, a controlled benchmark that characterizes tasks along five axes: Depth, Horizon, Breadth, Parallel, and Robustness. Our analysis reveals that MAS gains depend critically on task structure, verification protocols, and the capabilities of both orchestrator and sub-agents, rather than holding universally. Guided by these insights, MAS-Orchestra achieves consistent improvements on public benchmarks including mathematical reasoning, multi-hop QA, and search-based QA. Together, MAS-Orchestra and MASBENCH enable better training and understanding of MAS in the pursuit of multi-agent intelligence.
- Abstract(参考訳): マルチエージェントシステム(MAS)はエージェントの協調によるインテリジェンスの向上を約束する一方で、自動MAS設計のアンダーデリバリへの現在のアプローチである。
このような欠点は,(1)方法論的複雑性 - エージェントオーケストレーションは,グローバルシステムレベルの全体的推論を制限し,エージェントの複雑性に悪影響を及ぼすような,シーケンシャルなコードレベルの実行を使用して実行される - (2) 不確実性 – MASは,単一エージェントシステム(SAS)と比較して明確なメリットがあるかどうかを理解せずにデプロイされる,という2つの要因に起因しています。
我々は,MASオーケストレーションを関数呼び出し強化学習問題として定式化し,全MASを一度に生成する訓練時間フレームワークであるMAS-Orchestraを提案する。
MAS-Orchestraでは、複雑なゴール指向サブエージェントを呼び出し可能な関数として抽象化し、内部実行の詳細を隠蔽しながらシステム構造に対するグローバルな推論を可能にする。
MASがいつ、なぜ有益なのかを徹底的に研究するために、Depth、Horizon、Breadth、Parallel、Robustnessの5つの軸に沿ったタスクを特徴付ける制御ベンチマークであるMASBENCHを紹介する。
分析の結果,MASはタスク構造や検証プロトコル,オーケストレータとサブエージェントの両方の能力に大きく依存していることが判明した。
これらの知見に導かれて、MAS-Orchestraは、数学的推論、マルチホップQA、検索ベースのQAを含む、公開ベンチマークにおける一貫した改善を実現している。
MAS-OrchestraとMASBENCHは、マルチエージェントインテリジェンスを追求する上で、MASのより良いトレーニングと理解を可能にする。
関連論文リスト
- Beyond Monolithic Architectures: A Multi-Agent Search and Knowledge Optimization Framework for Agentic Search [56.78490647843876]
エージェント検索は、大規模言語モデル(LLM)が推論とツールの使用をインターリーブできるようにすることによって、複雑な情報を探すための有望なパラダイムとして登場した。
本稿では,bfM-ASKを提案する。bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK。
論文 参考訳(メタデータ) (2026-01-08T08:13:27Z) - BOAD: Discovering Hierarchical Software Engineering Agents via Bandit Optimization [41.08366028094234]
大規模言語モデル(LLM)は、現実世界のソフトウェア工学の問題を一般化するのに苦労する。
既存のシステムはワークフロー全体の問題を処理するために、単一のエージェントに依存することが多い。
人間の技術者が複雑な問題を分解する方法に触発され、我々はSWEエージェントをオーケストラとして構成し、特殊なサブエージェントをコーディネートすることを提案する。
論文 参考訳(メタデータ) (2025-12-29T17:41:11Z) - Diagnose, Localize, Align: A Full-Stack Framework for Reliable LLM Multi-Agent Systems under Instruction Conflicts [75.20929587906228]
LLM(Large Language Model)を利用したマルチエージェントシステム(MAS)は、複雑なタスクにおける協調推論、ツールの使用、役割特化調整を急速に進めている。
しかし、信頼性クリティカルなデプロイメントは、体系的な障害モード、すなわち命令の競合による階層的コンプライアンスによって妨げられている。
論文 参考訳(メタデータ) (2025-09-27T08:43:34Z) - Who is Introducing the Failure? Automatically Attributing Failures of Multi-Agent Systems via Spectrum Analysis [10.235089248238108]
我々は、MASに対する最初のスペクトルベースの障害帰属手法であるFAMASを提案する。
FAMASの中核となる考え方は、繰り返しMASの実行のバリエーションから、各エージェントアクションが障害の原因となる可能性を見積もることである。
特に、エージェント行動群とアクション行動群という2つの重要な因子群を統合するMASに合わせた新しい不審性公式を提案する。
論文 参考訳(メタデータ) (2025-09-17T07:50:44Z) - Orchestrator: Active Inference for Multi-Agent Systems in Long-Horizon Tasks [47.3494579474486]
複雑で非線形なタスクは、部分的な可観測性と準最適調整のためにマルチエージェントシステム(MAS)に挑戦する。
我々は,グローバルなタスク性能を最適化するために,アテンションにインスパイアされた自己創発的コーディネーションと反射型ベンチマークを活用する新しいMASフレームワークであるOrchestratorを提案する。
本研究では, 複雑度を増大させる一連の迷路パズルの枠組みを評価し, 長期的目的を持つ動的非線形環境におけるコーディネーションと性能向上の有効性を実証した。
論文 参考訳(メタデータ) (2025-09-06T09:03:36Z) - AgentOrchestra: Orchestrating Hierarchical Multi-Agent Intelligence with the Tool-Environment-Agent(TEA) Protocol [22.406849007798858]
本稿では,環境,エージェント,ツールを統一システムに統合するツール-環境-エージェントプロトコルを提案する。
本稿では,複雑な目的を分解し,特殊エージェントをコーディネートする中央計画エージェントを備えた階層型マルチエージェントフレームワークであるAgensOrchestraを紹介する。
論文 参考訳(メタデータ) (2025-06-14T13:45:37Z) - Multi-Agent Collaboration via Evolving Orchestration [55.574417128944226]
大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。
LLMに基づくマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し,タスク状態の進化に応じて,中央集権的なオーケストレータ("puppeteer")がエージェント("puppets")を動的に指示する。
クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2025-05-26T07:02:17Z) - MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。
MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文 参考訳(メタデータ) (2025-05-21T00:56:09Z) - Why Do Multi-Agent LLM Systems Fail? [87.90075668488434]
MAST-Dataは7つの人気のあるMASフレームワークで収集された1600以上の注釈付きトレースの包括的なデータセットである。
我々はMAST(Multi-Agent System Failure Taxonomy)を初めて構築する。
MASTとMAST-Dataを利用して、モデル(GPT4、Claude 3、Qwen2.5、CodeLlama)とタスク(コーディング、数学、汎用エージェント)の障害パターンを分析します。
論文 参考訳(メタデータ) (2025-03-17T19:04:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。