論文の概要: CAMON: Cooperative Agents for Multi-Object Navigation with LLM-based Conversations
- arxiv url: http://arxiv.org/abs/2407.00632v1
- Date: Sun, 30 Jun 2024 09:14:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 02:17:05.188297
- Title: CAMON: Cooperative Agents for Multi-Object Navigation with LLM-based Conversations
- Title(参考訳): CAMON:LLMを用いた多目的ナビゲーションのための協調エージェント
- Authors: Pengying Wu, Yao Mu, Kangjie Zhou, Ji Ma, Junting Chen, Chang Liu,
- Abstract要約: 大規模言語モデル(LLM)は、目覚ましい理解と計画能力を示した。
本稿では,LLM対応通信と協調を利用した分散マルチエージェントナビゲーションのためのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 22.79813240034754
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual navigation tasks are critical for household service robots. As these tasks become increasingly complex, effective communication and collaboration among multiple robots become imperative to ensure successful completion. In recent years, large language models (LLMs) have exhibited remarkable comprehension and planning abilities in the context of embodied agents. However, their application in household scenarios, specifically in the use of multiple agents collaborating to complete complex navigation tasks through communication, remains unexplored. Therefore, this paper proposes a framework for decentralized multi-agent navigation, leveraging LLM-enabled communication and collaboration. By designing the communication-triggered dynamic leadership organization structure, we achieve faster team consensus with fewer communication instances, leading to better navigation effectiveness and collaborative exploration efficiency. With the proposed novel communication scheme, our framework promises to be conflict-free and robust in multi-object navigation tasks, even when there is a surge in team size.
- Abstract(参考訳): ビジュアルナビゲーションタスクは、家庭用サービスロボットにとって重要である。
これらのタスクが複雑化するにつれて、複数のロボット間の効果的なコミュニケーションと協調が、成功を確実にするために必須となる。
近年,大型言語モデル (LLM) は, エンボディエージェントの文脈において, 顕著な理解と計画能力を示した。
しかし、家庭のシナリオ、特にコミュニケーションを通じて複雑なナビゲーションタスクを完了させるために協力する複数のエージェントの使用において、それらの応用は未調査のままである。
そこで本稿では,LLM対応通信と協調を利用した分散マルチエージェントナビゲーションのためのフレームワークを提案する。
コミュニケーショントリガーによる動的リーダシップ組織構造を設計することにより、コミュニケーションインスタンスの少ないチームによるコンセンサスの向上を実現し、ナビゲーションの効率性と協調的な探索効率が向上します。
提案する新たな通信方式では,チーム規模の増加があっても,マルチオブジェクトナビゲーションタスクにおいて,コンフリクトフリーで堅牢なフレームワークが約束される。
関連論文リスト
- A Scalable Communication Protocol for Networks of Large Language Models [22.651997786682138]
AgoraはAIを利用したエージェントが複雑な問題を効率的に解決するためのメタプロトコルである。
これはAgent Communication Trilemmaを横取りし、インターフェイスやメンバーの変更をしっかりと処理します。
大規模なAgoraネットワーク上では、人間の介入なしに複雑な目標を達成する、自己組織化された完全に自動化されたプロトコルの出現を観察する。
論文 参考訳(メタデータ) (2024-10-14T23:25:13Z) - Towards Collaborative Intelligence: Propagating Intentions and Reasoning for Multi-Agent Coordination with Large Language Models [41.95288786980204]
現在のエージェントフレームワークは、シングルエージェント実行への依存に悩まされ、モジュール間通信が堅牢でないことが多い。
協調的なMARLにおける協調行動を可能にするための協調エージェントとして,大規模言語モデルを訓練するためのフレームワークを提案する。
伝搬ネットワークは、放送意図をチームメイト固有のコミュニケーションメッセージに変換し、指定されたチームメイトと関連する目標を共有する。
論文 参考訳(メタデータ) (2024-07-17T13:14:00Z) - Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。
我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。
IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文 参考訳(メタデータ) (2024-07-09T17:33:24Z) - Hierarchical Auto-Organizing System for Open-Ended Multi-Agent Navigation [12.753472502707153]
Minecraftにおけるマルチエージェント組織のための階層的自動組織ナビゲーションシステムを設計する。
Minecraft環境では、探索や探索を含む一連のナビゲーションタスクも設計しています。
私たちは、具体的AIの境界を押し進め、より人間的な組織構造へと移行する、具体的組織の開発を目指しています。
論文 参考訳(メタデータ) (2024-03-13T06:22:17Z) - Multi-Agent Consensus Seeking via Large Language Models [6.922356864800498]
大規模言語モデル(LLM)によって駆動されるマルチエージェントシステムは、複雑なタスクを協調的に解決する有望な能力を示している。
この研究は、マルチエージェントコラボレーションにおける根本的な問題であるコンセンサス探索について考察する。
論文 参考訳(メタデータ) (2023-10-31T03:37:11Z) - Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation [52.930183136111864]
我々は,大言語モデル(LLM)を評価するためにスコーラブルネゴシエーション(scorable negotiations)を提案する。
合意に達するには、エージェントは強力な算術、推論、探索、計画能力を持つ必要がある。
我々は、新しいゲームを作成し、進化するベンチマークを持つことの難しさを増大させる手順を提供する。
論文 参考訳(メタデータ) (2023-09-29T13:33:06Z) - RoCo: Dialectic Multi-Robot Collaboration with Large Language Models [13.260289557301688]
我々は,事前学習された大規模言語モデル(LLM)のパワーを利用する,マルチロボット協調のための新しいアプローチを提案する。
そこで,RoCoはロボットエージェントとコミュニケーションし,協調してタスクを完了させることができる。
論文 参考訳(メタデータ) (2023-07-10T17:52:01Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - Collaborative Visual Navigation [69.20264563368762]
マルチエージェント視覚ナビゲーション(MAVN)のための大規模3次元データセットCollaVNを提案する。
様々なMAVN変種を探索し、この問題をより一般化する。
メモリ拡張通信フレームワークを提案する。各エージェントには、通信情報を永続的に保存するプライベートな外部メモリが備わっている。
論文 参考訳(メタデータ) (2021-07-02T15:48:16Z) - Learning Structured Communication for Multi-agent Reinforcement Learning [104.64584573546524]
本研究では,マルチエージェント強化学習(MARL)環境下での大規模マルチエージェント通信機構について検討する。
本稿では、より柔軟で効率的な通信トポロジを用いて、LSC(Learning Structured Communication)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-11T07:19:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。