論文の概要: Reinforced Collaboration in Multi-Agent Flow Networks
- arxiv url: http://arxiv.org/abs/2605.12943v1
- Date: Wed, 13 May 2026 03:26:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.784734
- Title: Reinforced Collaboration in Multi-Agent Flow Networks
- Title(参考訳): マルチエージェントフローネットワークにおける強化協調
- Authors: Zheng Wang, Yuang Liu, Yangkai Ding,
- Abstract要約: 我々は、フローネットワークを介してエージェントの協調を組織化し、洗練するデータ駆動型フレームワークMANGOを提案する。
MANGOは強化学習とテキスト勾配を統合し、ワークフローパスとエージェントの動作を協調的に最適化する。
実験の結果、MANGOは最先端のベースラインよりも最大12.8%の性能向上を実現し、効率を47.4%向上し、目に見えない領域に効果的に一般化した。
- 参考スコア(独自算出の注目度): 11.211551212919174
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent systems provide a powerful way to extend large language models (LLMs) by decomposing a complex task into specialized subtasks handled by different agents. However, their performance is often hindered by error propagation, arising from suboptimal workflow design or inaccurate agent outputs, which can propagate through the agent collaboration process and degrade final results. To address the challenges, we present MANGO (Multi-Agent Network Gradient Optimization), a data-driven framework that organizes and refines agent collaboration via a flow network constructed from past successful workflows. MANGO integrates reinforcement learning and textual gradients to jointly optimize workflow paths and agent behaviors, while a skipping mechanism prevents redundant updates to well-optimized agents for improving efficiency. Extensive experiments on seven benchmarks show that MANGO achieves up to 12.8% performance improvement over state-of-the-art baselines, enhances efficiency by 47.4%, and generalizes effectively to unseen domains. Our code and datasets are publicly available at https://github.com/openJiuwen-ai/agent-store/tree/main/community/mango.
- Abstract(参考訳): マルチエージェントシステムは、複雑なタスクを異なるエージェントによって処理される特別なサブタスクに分解することで、大きな言語モデル(LLM)を拡張する強力な方法を提供する。
しかし、それらの性能は、過度なワークフロー設計や不正確なエージェント出力から生じるエラーの伝播によって妨げられ、エージェントの協調プロセスを通じて伝播し、最終的な結果が劣化する。
この課題に対処するために、過去の成功したワークフローから構築されたフローネットワークを介してエージェントの協調を組織化し、洗練するデータ駆動フレームワークMANGO(Multi-Agent Network Gradient Optimization)を提案する。
MANGOは強化学習とテキスト勾配を統合し、ワークフローパスとエージェントの動作を協調的に最適化する。
7つのベンチマークの大規模な実験により、MANGOは最先端のベースラインよりも最大12.8%の性能向上を実現し、効率を47.4%向上し、目に見えない領域に効果的に一般化した。
私たちのコードとデータセットはhttps://github.com/openJiuwen-ai/agent-store/tree/main/community/mangoで公開されています。
関連論文リスト
- AgentSlimming: Towards Efficient and Cost-Aware Multi-Agent Systems [19.373173948984626]
AgentSlimmingは、グラフ構造化マルチエージェントシステムのためのプラグアンドプレイ圧縮フレームワークである。
平均トークンコストを78.9%まで削減し、性能を低下させ、時には精度も向上する。
論文 参考訳(メタデータ) (2026-05-09T09:03:54Z) - DLLM Agent: See Farther, Run Faster [94.74432470237817]
拡散大言語モデル(DLLM)は、自己回帰(AR)デコーディングの代替として、魅力的な効率とモデリング特性を持つ。
我々は、DLLMとARのバックボーンを同一のエージェントワークフロー内でインスタンス化することで、制御された環境でこれを研究する。
DLLMエージェントはARエージェントよりも平均30%以上速く、場合によっては8倍のスピードアップを達成している。
論文 参考訳(メタデータ) (2026-02-07T09:01:18Z) - Optimal-Agent-Selection: State-Aware Routing Framework for Efficient Multi-Agent Collaboration [20.982210711890513]
STRMACは、マルチエージェントシステムにおける効率的な協調のために設計された状態認識ルーティングフレームワークである。
提案手法は,ルータを駆動するためのインタラクション履歴とエージェント知識を符号化し,各ステップで最適な単一エージェントを適応的に選択する。
論文 参考訳(メタデータ) (2025-11-04T02:41:14Z) - Polymath: A Self-Optimizing Agent with Dynamic Hierarchical Workflow [6.636150750052998]
大規模言語モデル(LLM)は、詳細な命令と構造化操作からなるエージェントティックを実行することで、複雑なタスクの解決に優れる。
多くの研究者がコードベースの表現を通じてこれらの生成と最適化を自動化しようとしてきた。
既存の方法は、トレーニングと最適化のためにラベル付きデータセットに頼っていることが多く、現実のダイナミックな問題を解決するのに非効率で柔軟性がない。
論文 参考訳(メタデータ) (2025-08-04T23:50:02Z) - Cross-Task Experiential Learning on LLM-based Multi-Agent Collaboration [63.90193684394165]
マルチエージェント・クロスタスク体験学習(MAEL)は,LSM駆動型エージェントに明示的なクロスタスク学習と経験蓄積を付与する新しいフレームワークである。
経験的学習フェーズでは、タスク解決ワークフローの各ステップの品質を定量化し、その結果の報酬を記憶する。
推論中、エージェントは、各推論ステップの有効性を高めるために、いくつかの例として、高頻度のタスク関連体験を検索する。
論文 参考訳(メタデータ) (2025-05-29T07:24:37Z) - AgentDropout: Dynamic Agent Elimination for Token-Efficient and High-Performance LLM-Based Multi-Agent Collaboration [45.46295333090397]
本稿では,異なる通信ラウンド間の冗長なエージェントと通信を識別するエージェントDropoutを提案する。
AgentDropoutは、プロンプトトークンの消費が21.6%、完了トークンの消費が18.4%、タスクのパフォーマンス改善が1.14である。
論文 参考訳(メタデータ) (2025-03-24T17:04:55Z) - Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。
本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。
提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文 参考訳(メタデータ) (2025-01-14T04:35:37Z) - ComfyBench: Benchmarking LLM-based Agents in ComfyUI for Autonomously Designing Collaborative AI Systems [80.69865295743149]
この研究は、LLMベースのエージェントを使用して、協調AIシステムを自律的に設計する試みである。
ComfyBenchをベースとしたComfyAgentは,エージェントが自律的に協調的なAIシステムを生成して設計できるようにするフレームワークである。
ComfyAgentは、o1-previewに匹敵する解像度を達成し、ComfyBenchの他のエージェントをはるかに上回っているが、ComfyAgentはクリエイティブタスクの15%しか解決していない。
論文 参考訳(メタデータ) (2024-09-02T17:44:10Z) - A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.35849138235116]
本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-03T16:05:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。