論文の概要: A Survey of Multi-Agent Reinforcement Learning with Communication
- arxiv url: http://arxiv.org/abs/2203.08975v1
- Date: Wed, 16 Mar 2022 22:39:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-18 15:54:36.000651
- Title: A Survey of Multi-Agent Reinforcement Learning with Communication
- Title(参考訳): コミュニケーションによるマルチエージェント強化学習に関する調査
- Authors: Changxi Zhu, Mehdi Dastani, Shihan Wang
- Abstract要約: コミュニケーションは、複数のエージェントの振舞いを調整する効果的なメカニズムである。
既存のComm-MARLシステムを区別し分類するための体系的かつ構造的なアプローチが欠如している。
- 参考スコア(独自算出の注目度): 1.7820563504030822
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Communication is an effective mechanism for coordinating the behavior of
multiple agents. In the field of multi-agent reinforcement learning, agents can
improve the overall learning performance and achieve their objectives by
communication. Moreover, agents can communicate various types of messages,
either to all agents or to specific agent groups, and through specific
channels. With the growing body of research work in MARL with communication
(Comm-MARL), there is lack of a systematic and structural approach to
distinguish and classify existing Comm-MARL systems. In this paper, we survey
recent works in the Comm-MARL field and consider various aspects of
communication that can play a role in the design and development of multi-agent
reinforcement learning systems. With these aspects in mind, we propose several
dimensions along which Comm-MARL systems can be analyzed, developed, and
compared.
- Abstract(参考訳): コミュニケーションは、複数のエージェントの行動を調整する効果的なメカニズムである。
多エージェント強化学習の分野では、エージェントは全体的な学習性能を改善し、コミュニケーションによって目的を達成することができる。
さらに、エージェントは、すべてのエージェントまたは特定のエージェントグループ、および特定のチャネルを介して、さまざまな種類のメッセージを伝達することができる。
コミュニケーションを伴うMARLの研究機関(Comm-MARL)により、既存のComm-MARLシステムを識別・分類するための体系的かつ構造的なアプローチが欠如している。
本稿では,Commun-MARL分野における最近の研究を概観し,多エージェント強化学習システムの設計・開発におけるコミュニケーションの様々な側面について考察する。
これらの側面を念頭に、Comm-MARLシステムを解析、開発、比較できるいくつかの次元を提案する。
関連論文リスト
- Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Improving Multi-Agent Debate with Sparse Communication Topology [9.041025703879905]
マルチエージェントの議論は、推論や事実性タスクのための大規模言語モデルの品質向上に有効であることが証明されている。
本稿では,マルチエージェントシステムにおける通信接続の効果について検討する。
GPTモデルとMistralモデルを用いた実験により,疎通信トポロジを利用したマルチエージェントの議論が同等あるいは優れた性能を達成できることが判明した。
論文 参考訳(メタデータ) (2024-06-17T17:33:09Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - Large Language Model Enhanced Multi-Agent Systems for 6G Communications [94.45712802626794]
本稿では,自然言語を用いたコミュニケーション関連タスクを解くための,カスタマイズされたコミュニケーション知識とツールを備えたマルチエージェントシステムを提案する。
セマンティック通信システムの設計により,提案方式の有効性を検証した。
論文 参考訳(メタデータ) (2023-12-13T02:35:57Z) - A Review of Cooperation in Multi-agent Learning [5.334450724000142]
マルチエージェント学習(MAL)における協調は、多くの分野の共通点におけるトピックである。
本稿では,マルチエージェント学習の基本概念,問題設定,アルゴリズムについて概説する。
論文 参考訳(メタデータ) (2023-12-08T16:42:15Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - Meta-CPR: Generalize to Unseen Large Number of Agents with Communication
Pattern Recognition Module [29.75594940509839]
エージェント数が異なるマルチエージェント環境をマルチタスク問題として定式化する。
本稿では,メタ強化学習(meta-RL)フレームワークを提案する。
提案フレームワークはメタ学習型通信パターン認識(CPR)モジュールを用いて通信の振る舞いを識別する。
論文 参考訳(メタデータ) (2021-12-14T08:23:04Z) - Provably Efficient Cooperative Multi-Agent Reinforcement Learning with
Function Approximation [15.411902255359074]
定常的な通信予算を一定に保っても,ほぼ最適に学習できることを示す。
私たちの仕事は、マルチエージェントコンテキストとマルチアームバンディット文学からMDP、強化学習まで、いくつかのアイデアを一般化します。
論文 参考訳(メタデータ) (2021-03-08T18:51:00Z) - Learning Structured Communication for Multi-agent Reinforcement Learning [104.64584573546524]
本研究では,マルチエージェント強化学習(MARL)環境下での大規模マルチエージェント通信機構について検討する。
本稿では、より柔軟で効率的な通信トポロジを用いて、LSC(Learning Structured Communication)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-11T07:19:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。