論文の概要: Rethinking the Value of Multi-Agent Workflow: A Strong Single Agent Baseline
- arxiv url: http://arxiv.org/abs/2601.12307v1
- Date: Sun, 18 Jan 2026 08:16:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.56496
- Title: Rethinking the Value of Multi-Agent Workflow: A Strong Single Agent Baseline
- Title(参考訳): マルチエージェントワークフローの価値を再考する: 強力なシングルエージェントベースライン
- Authors: Jiawei Xu, Arief Koesdwiady, Sisong Bei, Yan Han, Baixiang Huang, Dakuo Wang, Yutong Chen, Zheshen Wang, Peihao Wang, Pan Li, Ying Ding,
- Abstract要約: 一つのエージェントがKVキャッシュの再利用による効率上の利点を生かして均一性を実現できることを示す。
本稿では,単一エージェントの実行を自動的に調整し,推論コストを削減するアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 38.16649115214312
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in LLM-based multi-agent systems (MAS) show that workflows composed of multiple LLM agents with distinct roles, tools, and communication patterns can outperform single-LLM baselines on complex tasks. However, most frameworks are homogeneous, where all agents share the same base LLM and differ only in prompts, tools, and positions in the workflow. This raises the question of whether such workflows can be simulated by a single agent through multi-turn conversations. We investigate this across seven benchmarks spanning coding, mathematics, general question answering, domain-specific reasoning, and real-world planning and tool use. Our results show that a single agent can reach the performance of homogeneous workflows with an efficiency advantage from KV cache reuse, and can even match the performance of an automatically optimized heterogeneous workflow. Building on this finding, we propose \textbf{OneFlow}, an algorithm that automatically tailors workflows for single-agent execution, reducing inference costs compared to existing automatic multi-agent design frameworks without trading off accuracy. These results position the single-LLM implementation of multi-agent workflows as a strong baseline for MAS research. We also note that single-LLM methods cannot capture heterogeneous workflows due to the lack of KV cache sharing across different LLMs, highlighting future opportunities in developing \textit{truly} heterogeneous multi-agent systems.
- Abstract(参考訳): LLMベースのマルチエージェントシステム(MAS)の最近の進歩は、異なる役割、ツール、コミュニケーションパターンを持つ複数のLLMエージェントからなるワークフローが、複雑なタスクにおいて単一LLMベースラインより優れていることを示している。
しかしながら、ほとんどのフレームワークは均質であり、全てのエージェントが同じベースLLMを共有し、ワークフロー内のプロンプト、ツール、位置でのみ異なる。
これにより、このようなワークフローがマルチターン会話を通じて単一のエージェントによってシミュレートできるかどうかという疑問が持ち上がる。
コーディング,数学,一般質問応答,ドメイン固有の推論,実世界の計画とツール利用にまたがる7つのベンチマークでこれを調査する。
以上の結果から,KVキャッシュの再利用による効率向上により,単一エージェントが同種ワークフローの性能に到達でき,自動最適化された異種ワークフローの性能に匹敵する結果が得られた。
この発見に基づいて,単一エージェント実行のためのワークフローを自動的に調整するアルゴリズムである \textbf{OneFlow} を提案し,精度を落とさずに既存の自動マルチエージェント設計フレームワークと比較して推論コストを削減した。
これらの結果は、マルチエージェントワークフローの単一LLM実装をMAS研究の強力なベースラインとしている。
また、単一LLM法は、異なるLLM間でのKVキャッシュの共有が欠如しているため、異種ワークフローを捉えることができないことに留意し、異種マルチエージェントシステムの開発における将来の可能性を強調した。
関連論文リスト
- Do We Always Need Query-Level Workflows? Rethinking Agentic Workflow Generation for Multi-Agent Systems [72.3575737073235]
マルチエージェントシステム(MAS)は、複数のエージェントを協調することで複雑なタスクを解決する。
既存のアプローチはタスクレベルかクエリレベルで生成されるが、その相対的なコストと利点は未だ不明である。
クエリレベルのワークフロー生成は必ずしも必要ではない、なぜなら、トップKレベルのタスクレベルの小さなセットが、すでに同等あるいはそれ以上のクエリをカバーしているからだ。
論文 参考訳(メタデータ) (2026-01-16T10:05:51Z) - Multi-Agent Tool-Integrated Policy Optimization [67.12841355267678]
大規模言語モデル(LLM)は、知識集約的かつ複雑な推論タスクに対して、多ターンツール統合計画にますます依存している。
既存の実装は通常、単一のエージェントに依存するが、コンテキスト長とノイズの多いツールレスポンスに悩まされる。
ツール統合マルチエージェントフレームワークの効果的な強化学習をサポートする方法はない。
論文 参考訳(メタデータ) (2025-10-06T10:44:04Z) - Difficulty-Aware Agentic Orchestration for Query-Specific Multi-Agent Workflows [5.376980683850103]
本稿では,予測困難により誘導されるクエリ固有多エージェントを生成するDifficulty-Aware Agentic Orchestration (DAAO)を提案する。
DAAOは、精度と推論効率の両方において、従来のマルチエージェントシステムを上回る。
論文 参考訳(メタデータ) (2025-09-14T03:57:43Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。