論文の概要: A Decentralized Communication Framework based on Dual-Level Recurrence
for Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2202.10612v1
- Date: Tue, 22 Feb 2022 01:36:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-24 04:00:49.092323
- Title: A Decentralized Communication Framework based on Dual-Level Recurrence
for Multi-Agent Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習のためのデュアルレベル再帰に基づく分散通信フレームワーク
- Authors: Jingchen Li and Haobin Shi and Kao-Shing Hwang
- Abstract要約: マルチエージェントシステムのためのデュアルレベルリカレント通信フレームワークを提案する。
第1の再発は通信シーケンスで発生し、エージェント間の通信データを送信するために使用される。
第2の再発は、時系列に基づいて、各エージェントの履歴観測を組み合わせる。
- 参考スコア(独自算出の注目度): 5.220940151628735
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a model enabling decentralized multiple agents to share their
perception of environment in a fair and adaptive way. In our model, both the
current message and historical observation are taken into account, and they are
handled in the same recurrent model but in different forms. We present a
dual-level recurrent communication framework for multi-agent systems, in which
the first recurrence occurs in the communication sequence and is used to
transmit communication data among agents, while the second recurrence is based
on the time sequence and combines the historical observations for each agent.
The developed communication flow separates communication messages from memories
but allows agents to share their historical observations by the dual-level
recurrence. This design makes agents adapt to changeable communication objects,
while the communication results are fair to these agents. We provide a
sufficient discussion about our method in both partially observable and fully
observable environments. The results of several experiments suggest our method
outperforms the existing decentralized communication frameworks and the
corresponding centralized training method.
- Abstract(参考訳): 本稿では,分散エージェントが環境に対する認識を公平かつ適応的に共有できるモデルを提案する。
我々のモデルでは、現在のメッセージと過去の観測の両方を考慮に入れ、同一の繰り返しモデルで処理されるが、異なる形態で処理される。
本稿では,第1の繰り返しが通信シーケンス内で発生し,エージェント間の通信データ伝達に使用されるマルチエージェントシステムにおいて,第2のリカレントが時系列に基づいて,各エージェントの履歴観測を組み合わせるデュアルレベルリカレント通信フレームワークを提案する。
発達した通信フローは、通信メッセージを記憶から分離するが、エージェントは二重レベルの再帰によって過去の観測を共有できる。
この設計により、エージェントは変更可能な通信オブジェクトに適応し、通信結果はこれらのエージェントに公平である。
観測可能な環境と完全に観測可能な環境の両方において,本手法について十分な議論を行う。
実験の結果,既存の分散通信フレームワークとそれに対応する集中型トレーニング手法に勝っていることが示唆された。
関連論文リスト
- Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Semantic Communication for Cooperative Perception using HARQ [51.148203799109304]
我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。
周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。
我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-29T08:53:26Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - T2MAC: Targeted and Trusted Multi-Agent Communication through Selective
Engagement and Evidence-Driven Integration [15.91335141803629]
我々は、エージェントが選択的なエンゲージメントとエビデンス駆動の統合を学ぶのを助けるために、T2MAC(Targeted and Trusted Multi-Agent Communication)を提案する。
T2MACは、エージェントが個別化されたメッセージを作成し、理想的なコミュニケーションウィンドウをピンポイントし、信頼できるパートナーと対話することを可能にする。
本手法は,様々な課題を伴って,多様な協調型マルチエージェントタスクに対して評価を行う。
論文 参考訳(メタデータ) (2024-01-19T18:00:33Z) - Centralized Training with Hybrid Execution in Multi-Agent Reinforcement
Learning [7.163485179361718]
マルチエージェント強化学習(MARL)におけるハイブリッド実行の導入
MARLは、エージェントが任意の通信レベルを持つ協調タスクを実行時に完了させることを目標とする新しいパラダイムである。
我々は,自動回帰予測モデルを用いたMAROを集中的に訓練し,行方不明者の観察を推定する手法を提案する。
論文 参考訳(メタデータ) (2022-10-12T14:58:32Z) - Multi-Agent Coordination via Multi-Level Communication [29.388570369796586]
シークエンシャル・コミュニケーション(SeqComm)という新しいマルチレベル通信方式を提案する。
本稿では,新しいマルチレベル通信方式であるSeqCommを提案する。
論文 参考訳(メタデータ) (2022-09-26T14:08:03Z) - Multi-Agent Adversarial Attacks for Multi-Channel Communications [24.576538640840976]
無線通信シナリオにおける敵をモデル化・解析するためのマルチエージェント・敵システム(MAAS)を提案する。
相手を学習エージェントとしてモデル化することにより,提案するMAASが,送信者戦略の事前知識を必要とせず,送信チャネルと割り当てされた各パワーを適切に選択可能であることを示す。
論文 参考訳(メタデータ) (2022-01-22T23:57:00Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Inference-Based Deterministic Messaging For Multi-Agent Communication [1.8275108630751844]
行列に基づくシグナリングゲームにおける学習について検討し,分散化手法がサブオプティマティリティポリシに収束できることを示した。
次に、送信者が送信者の観察を推測するのを助ける最良のメッセージを決定的に選択するメッセージポリシーの修正を提案します。
論文 参考訳(メタデータ) (2021-03-03T03:09:22Z) - Exploring Zero-Shot Emergent Communication in Embodied Multi-Agent
Populations [59.608216900601384]
本研究では,3次元環境下で関節を作動させることでコミュニケーションを学ぶエージェントについて検討する。
現実的な仮定、意図の非一様分布、共通知識エネルギーコストにおいて、これらのエージェントは新規パートナーに一般化するプロトコルを見つけることができることを示す。
論文 参考訳(メタデータ) (2020-10-29T19:23:10Z) - Learning Structured Communication for Multi-agent Reinforcement Learning [104.64584573546524]
本研究では,マルチエージェント強化学習(MARL)環境下での大規模マルチエージェント通信機構について検討する。
本稿では、より柔軟で効率的な通信トポロジを用いて、LSC(Learning Structured Communication)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-11T07:19:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。