論文の概要: CaPo: Cooperative Plan Optimization for Efficient Embodied Multi-Agent Cooperation
- arxiv url: http://arxiv.org/abs/2411.04679v1
- Date: Thu, 07 Nov 2024 13:08:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-08 19:39:29.114882
- Title: CaPo: Cooperative Plan Optimization for Efficient Embodied Multi-Agent Cooperation
- Title(参考訳): CaPo:効率的な多エージェント協調のための協調計画最適化
- Authors: Jie Liu, Pan Zhou, Yingjun Du, Ah-Hwee Tan, Cees G. M. Snoek, Jan-Jakob Sonke, Efstratios Gavves,
- Abstract要約: CaPoは,1)メタプラン生成,2)プログレッシブなメタプランと実行の2つのフェーズで協調効率を向上する。
3Dworld Multi-Agent TransportとCommunicative Watch-And-Helpタスクの実験結果は、CaPoが最先端技術と比較してタスク完了率と効率をはるかに高めることを示した。
- 参考スコア(独自算出の注目度): 98.11670473661587
- License:
- Abstract: In this work, we address the cooperation problem among large language model (LLM) based embodied agents, where agents must cooperate to achieve a common goal. Previous methods often execute actions extemporaneously and incoherently, without long-term strategic and cooperative planning, leading to redundant steps, failures, and even serious repercussions in complex tasks like search-and-rescue missions where discussion and cooperative plan are crucial. To solve this issue, we propose Cooperative Plan Optimization (CaPo) to enhance the cooperation efficiency of LLM-based embodied agents. Inspired by human cooperation schemes, CaPo improves cooperation efficiency with two phases: 1) meta-plan generation, and 2) progress-adaptive meta-plan and execution. In the first phase, all agents analyze the task, discuss, and cooperatively create a meta-plan that decomposes the task into subtasks with detailed steps, ensuring a long-term strategic and coherent plan for efficient coordination. In the second phase, agents execute tasks according to the meta-plan and dynamically adjust it based on their latest progress (e.g., discovering a target object) through multi-turn discussions. This progress-based adaptation eliminates redundant actions, improving the overall cooperation efficiency of agents. Experimental results on the ThreeDworld Multi-Agent Transport and Communicative Watch-And-Help tasks demonstrate that CaPo achieves much higher task completion rate and efficiency compared with state-of-the-arts.
- Abstract(参考訳): 本研究では,大規模言語モデル(LLM)に基づくエンボディエージェント間の協調問題に対処し,エージェントが共通の目標を達成するために協力する必要がある。
従来の手法では、長期の戦略的・協力的な計画なしに、即時かつ不整合に行動を実行し、冗長なステップ、失敗、さらには議論と協力計画が不可欠である捜索救助任務のような複雑なタスクに深刻な反動をもたらすことがしばしばある。
この問題を解決するために,LLMを用いた組込みエージェントの協調効率を高めるために,協調計画最適化(CaPo)を提案する。
人間の協力計画に触発されて、CaPoは2つのフェーズで協力効率を改善する。
1)メタプラン生成、及び
2)プログレッシブ・アダプティブなメタプランと実行。
第1フェーズでは、すべてのエージェントがタスクを分析し、議論し、協力的にメタプランを作成し、タスクを詳細なステップでサブタスクに分解し、効率的なコーディネーションのための長期的な戦略的かつ一貫性のある計画を保証する。
第2フェーズでは、エージェントはメタプランに従ってタスクを実行し、マルチターンの議論を通じて最新の進捗(例えば、対象オブジェクトの発見)に基づいて動的に調整する。
このプログレッシブベースの適応は冗長な動作を排除し、エージェントの全体的な協調効率を改善する。
3Dworld Multi-Agent TransportとCommunicative Watch-And-Helpタスクの実験結果は、CaPoが最先端技術と比較してタスク完了率と効率をはるかに高めることを示した。
関連論文リスト
- Cooperative Strategic Planning Enhances Reasoning Capabilities in Large Language Models [37.899581994741865]
本稿では,新しい協調型マルチエージェント推論フレームワーク(CoPlanner)を提案する。
コプラナーは2つのLSMエージェント(計画エージェントと推論エージェント)から構成される。
以上の結果から,計画エージェントからの指導とエージェント間の効果的な協力が,CoPlannerの優れた性能に寄与することが示唆された。
論文 参考訳(メタデータ) (2024-10-25T23:32:48Z) - Towards Collaborative Intelligence: Propagating Intentions and Reasoning for Multi-Agent Coordination with Large Language Models [41.95288786980204]
現在のエージェントフレームワークは、シングルエージェント実行への依存に悩まされ、モジュール間通信が堅牢でないことが多い。
協調的なMARLにおける協調行動を可能にするための協調エージェントとして,大規模言語モデルを訓練するためのフレームワークを提案する。
伝搬ネットワークは、放送意図をチームメイト固有のコミュニケーションメッセージに変換し、指定されたチームメイトと関連する目標を共有する。
論文 参考訳(メタデータ) (2024-07-17T13:14:00Z) - CoAct: A Global-Local Hierarchy for Autonomous Agent Collaboration [87.51781348070914]
既存のLLMは、様々なNLPタスクで顕著なパフォーマンスを示すが、それでも複雑な現実世界タスクに苦戦している。
本稿では,人間社会における階層的計画と協調のパターンをLLMシステムに伝達するCoActフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-19T09:23:53Z) - Anticipate & Collab: Data-driven Task Anticipation and Knowledge-driven Planning for Human-robot Collaboration [13.631341660350028]
日々の生活活動において人間を支援するエージェントは、今後の課題を予測してより効果的に協力することができる。
データ駆動型手法はタスク予測、計画、関連する問題の最先端を表現しているが、これらの手法は資源不足と不透明である。
本稿では,人間とロボットのコラボレーションに向けたこれまでの取り組みを大幅に拡張するフレームワークであるDaTAPlanについて述べる。
論文 参考訳(メタデータ) (2024-04-04T16:52:48Z) - Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - Learning Multi-Agent Intention-Aware Communication for Optimal
Multi-Order Execution in Finance [96.73189436721465]
まず,現実的な制約を考慮したマルチオーダー実行のためのマルチエージェントRL(MARL)手法を提案する。
本稿では,学習可能なマルチラウンド通信プロトコルを提案する。
2つの実世界の市場のデータに関する実験では、優れたパフォーマンスを示し、コラボレーションの有効性が著しく向上した。
論文 参考訳(メタデータ) (2023-07-06T16:45:40Z) - E-MAPP: Efficient Multi-Agent Reinforcement Learning with Parallel
Program Guidance [20.03014783858498]
並列プログラムガイダンスを用いた効率的なマルチエージェント強化学習(E-MAPP)を提案する。
E-MAPPは並列プログラムを活用する新しいフレームワークで、複数のエージェントを誘導し、10ドル以上の計画を必要とする目標を効率的に達成する。
その結果,E-MAPPは完成率,時間効率,ゼロショット一般化能力において,大きなマージンで優れたベースラインを達成できることが示唆された。
論文 参考訳(メタデータ) (2022-12-05T07:02:05Z) - UneVEn: Universal Value Exploration for Multi-Agent Reinforcement
Learning [53.73686229912562]
我々はUniversal Value Exploration(UneVEn)と呼ばれる新しいMARLアプローチを提案する。
UneVEnは、一連の関連するタスクと、普遍的な後継機能の線形分解を同時に学習する。
一連の探索ゲームにおける実証的な結果、エージェント間の重要な調整を必要とする協調捕食・捕食作業への挑戦、およびStarCraft IIのマイクロマネジメントベンチマークは、UneVEnが他の最先端のMARLメソッドが失敗するタスクを解決できることを示している。
論文 参考訳(メタデータ) (2020-10-06T19:08:47Z) - A Cordial Sync: Going Beyond Marginal Policies for Multi-Agent Embodied
Tasks [111.34055449929487]
エージェントが協力して家具をリビングルームに移動させるという,新しいタスクFurnMoveを紹介した。
既存のタスクとは異なり、FurnMoveはエージェントが各タイミングで調整する必要がある。
既存の分散化されたアクションサンプリング手順は、表現力のある共同アクションポリシーを許さない。
SynC-policiesとCORDIALを用いて、我々のエージェントはFurnMoveで58%の完成率を達成する。
論文 参考訳(メタデータ) (2020-07-09T17:59:57Z) - Developing cooperative policies for multi-stage tasks [0.0]
本稿では,協調型ソフトアクター批判(CSAC)手法を提案する。
CSACは非協調的な政策よりも少なくとも20%高い成功率を達成し、単一エージェントの少なくとも4倍の速さで解に収束した。
論文 参考訳(メタデータ) (2020-07-01T03:32:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。