論文の概要: Single-agent or Multi-agent Systems? Why Not Both?
- arxiv url: http://arxiv.org/abs/2505.18286v1
- Date: Fri, 23 May 2025 18:30:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.323861
- Title: Single-agent or Multi-agent Systems? Why Not Both?
- Title(参考訳): シングルエージェントシステムかマルチエージェントシステムか - なぜ両方ではないのか?
- Authors: Mingyan Gao, Yanzi Li, Banruo Liu, Yifan Yu, Phillip Wang, Ching-Yu Lin, Fan Lai,
- Abstract要約: マルチエージェントシステム(MAS)は複雑なタスクを分解し、サブタスクを異なる言語モデル(LLM)エージェントやツールに委譲する。
我々は,MASと単一エージェントシステム(SAS)を比較した実証的研究を行った。
我々の設計では、さまざまなエージェントアプリケーションに対して、デプロイメントコストを最大20%削減しながら、精度を1.1-12%向上させる。
- 参考スコア(独自算出の注目度): 2.7635437118448554
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent systems (MAS) decompose complex tasks and delegate subtasks to different large language model (LLM) agents and tools. Prior studies have reported the superior accuracy performance of MAS across diverse domains, enabled by long-horizon context tracking and error correction through role-specific agents. However, the design and deployment of MAS incur higher complexity and runtime cost compared to single-agent systems (SAS). Meanwhile, frontier LLMs, such as OpenAI-o3 and Gemini-2.5-Pro, have rapidly advanced in long-context reasoning, memory retention, and tool usage, mitigating many limitations that originally motivated MAS designs. In this paper, we conduct an extensive empirical study comparing MAS and SAS across various popular agentic applications. We find that the benefits of MAS over SAS diminish as LLM capabilities improve, and we propose efficient mechanisms to pinpoint the error-prone agent in MAS. Furthermore, the performance discrepancy between MAS and SAS motivates our design of a hybrid agentic paradigm, request cascading between MAS and SAS, to improve both efficiency and capability. Our design improves accuracy by 1.1-12% while reducing deployment costs by up to 20% across various agentic applications.
- Abstract(参考訳): マルチエージェントシステム(MAS)は複雑なタスクを分解し、サブタスクを異なる言語モデル(LLM)エージェントやツールに委譲する。
従来の研究では、長期のコンテキストトラッキングとロール固有エージェントによる誤り訂正により、様々な領域にわたるMASの精度が向上したことが報告されている。
しかし、MASの設計と展開は単一エージェントシステム(SAS)よりも複雑で実行時コストが高い。
一方、OpenAI-o3やGemini-2.5-ProのようなフロンティアのLLMは、長いコンテキスト推論、メモリ保持、ツールの使用において急速に進歩し、もともとMASの設計を動機づけた多くの制限を緩和した。
本稿では,MASとSASを多種多様なエージェントアプリケーションで比較した広範な実証的研究を行う。
SAS に対するMAS の利点は LLM 能力の向上とともに減少し,MAS におけるエラー発生要因を特定できる効率的なメカニズムが提案されている。
さらに,MASとSASのパフォーマンスの相違は,MASとSAS間の要求カスケードというハイブリッドエージェントパラダイムの設計を動機付け,効率と能力の両立を図っている。
我々の設計では、さまざまなエージェントアプリケーションに対して、デプロイメントコストを最大20%削減しながら、精度を1.1-12%向上させる。
関連論文リスト
- Multiple Weaks Win Single Strong: Large Language Models Ensemble Weak Reinforcement Learning Agents into a Supreme One [28.264011412168347]
モデルアンサンブルは強化学習(RL)において有効なエージェントの訓練に有用である。
LLM-Ensは,タスク固有の意味理解を用いてRLモデルのアンサンブルを強化する手法である。
論文 参考訳(メタデータ) (2025-05-21T09:35:43Z) - MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。
MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文 参考訳(メタデータ) (2025-05-21T00:56:09Z) - Why Do Multi-Agent LLM Systems Fail? [91.39266556855513]
MAST(Multi-Agent System Failure taxonomy, MAST)は,MASの故障を理解するために考案された分類法である。
我々は、200以上のタスクにまたがる7つの人気のあるMASフレームワークを分析し、6つの専門家のアノテータを含む。
14のユニークな障害モードを特定し、(i)仕様問題、(ii)エージェント間ミスアライメント、(iii)タスク検証の3つに分類した。
論文 参考訳(メタデータ) (2025-03-17T19:04:38Z) - SMoA: Improving Multi-agent Large Language Models with Sparse Mixture-of-Agents [14.08299391695986]
マルチエージェントLLMの効率と多様性を向上させるために,スパース混合エージェント(SMoA)フレームワークを提案する。
SMoAは、個々のLSMエージェント間で情報の流れを分散させる新しい応答選択と早期停止機構を導入している。
推論、アライメント、公平性ベンチマークの実験は、SMoAが従来の混合エージェントアプローチに匹敵するパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2024-11-05T17:33:39Z) - AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents [52.13695464678006]
本研究は, 観察空間と行動空間を簡略化することで, LLMベースのWebエージェントを強化する。
AgentOccam は以前の最先端および同時処理を 9.8 (+29.4%) と 5.9 (+15.8%) で上回っている。
論文 参考訳(メタデータ) (2024-10-17T17:50:38Z) - A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.35849138235116]
本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-03T16:05:48Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。