論文の概要: Learning Selective Communication for Multi-Agent Path Finding
- arxiv url: http://arxiv.org/abs/2109.05413v1
- Date: Sun, 12 Sep 2021 03:07:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-17 06:42:54.993962
- Title: Learning Selective Communication for Multi-Agent Path Finding
- Title(参考訳): マルチエージェント経路探索のための学習選択コミュニケーション
- Authors: Ziyuan Ma, Yudong Luo, Jia Pan
- Abstract要約: 決定因果通信(Decision Causal Communication、DCC)は、エージェントが隣人を選択して通信を行うためのシンプルで効率的なモデルである。
DCCは大規模問題を扱うために分散実行に適している。
- 参考スコア(独自算出の注目度): 18.703918339797283
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning communication via deep reinforcement learning (RL) or imitation
learning (IL) has recently been shown to be an effective way to solve
Multi-Agent Path Finding (MAPF). However, existing communication based MAPF
solvers focus on broadcast communication, where an agent broadcasts its message
to all other or predefined agents. It is not only impractical but also leads to
redundant information that could even impair the multi-agent cooperation. A
succinct communication scheme should learn which information is relevant and
influential to each agent's decision making process. To address this problem,
we consider a request-reply scenario and propose Decision Causal Communication
(DCC), a simple yet efficient model to enable agents to select neighbors to
conduct communication during both training and execution. Specifically, a
neighbor is determined as relevant and influential only when the presence of
this neighbor causes the decision adjustment on the central agent. This
judgment is learned only based on agent's local observation and thus suitable
for decentralized execution to handle large scale problems. Empirical
evaluation in obstacle-rich environment indicates the high success rate with
low communication overhead of our method.
- Abstract(参考訳): 近年,Multi-Agent Path Finding (MAPF) の解法として,深層強化学習 (RL) や模倣学習 (IL) による学習コミュニケーションが有効であることが示されている。
しかし、既存の通信ベースのmapfソルバはブロードキャスト通信にフォーカスしており、エージェントがメッセージを他のすべてのまたは事前定義されたエージェントにブロードキャストする。
これは非現実的なだけでなく、マルチエージェントの協力を損なう可能性のある冗長な情報にも繋がる。
簡潔なコミュニケーション方式は、各エージェントの意思決定プロセスに関連があり、影響を及ぼす情報を学習すべきである。
この問題に対処するために、我々は要求応答シナリオを考察し、エージェントが訓練と実行の両方で通信を行えるように簡易かつ効率的なモデルである決定因果通信(DCC)を提案する。
具体的には、この隣接体の存在が中央エージェントの決定調整を引き起こす場合にのみ、隣接体を関連性および影響性として判定する。
この判断はエージェントの局所的な観察に基づいてのみ学習され、大規模な問題に対処するための分散実行に適している。
障害物の多い環境における実証評価は,本手法の通信オーバーヘッドの低い高い成功率を示す。
関連論文リスト
- Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - DCMAC: Demand-aware Customized Multi-Agent Communication via Upper Bound Training [9.068971933560416]
本稿では,アッパーバウンドトレーニングを用いて理想的なポリシを得る,要求対応のカスタマイズ型マルチエージェント通信プロトコルを提案する。
実験結果から,DCMACは,制約のない,通信制約のないシナリオにおいて,ベースラインアルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2024-09-11T09:23:27Z) - Multi-Agent Reinforcement Learning Based on Representational
Communication for Large-Scale Traffic Signal Control [13.844458247041711]
交通信号制御(TSC)は、インテリジェント交通システムにおいて難しい問題である。
大規模TSCのための通信ベースのMARLフレームワークを提案する。
私たちのフレームワークでは、各エージェントがメッセージのどの部分を誰に"送信"するかを指示する通信ポリシーを学習することができます。
論文 参考訳(メタデータ) (2023-10-03T21:06:51Z) - DisPFL: Towards Communication-Efficient Personalized Federated Learning
via Decentralized Sparse Training [84.81043932706375]
本稿では,分散型(ピアツーピア)通信プロトコルであるDis-PFLにおいて,新たな個人化フェデレーション学習フレームワークを提案する。
Dis-PFLはパーソナライズされたスパースマスクを使用して、エッジ上のスパースローカルモデルをカスタマイズする。
本手法は,計算複雑性の異なる異種ローカルクライアントに容易に適応できることを実証する。
論文 参考訳(メタデータ) (2022-06-01T02:20:57Z) - Coordinating Policies Among Multiple Agents via an Intelligent
Communication Channel [81.39444892747512]
MARL(Multi-Agent Reinforcement Learning)では、エージェントが直接通信できる特別なチャンネルがしばしば導入される。
本稿では,エージェントの集団的性能を向上させるために,エージェントが提供した信号の伝達と解釈を学習する,インテリジェントなファシリテータを通じてエージェントがコミュニケーションする手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T14:11:33Z) - Depthwise Convolution for Multi-Agent Communication with Enhanced
Mean-Field Approximation [9.854975702211165]
本稿では,MARL(Multi-agent RL)課題に取り組むための,局所的なコミュニケーション学習に基づく新しい手法を提案する。
まず,局所的な関係を効率的に抽出する深層的畳み込み機能を利用する新しい通信プロトコルを設計する。
第2に,エージェント相互作用の規模を減らすために,平均場近似を導入する。
論文 参考訳(メタデータ) (2022-03-06T07:42:43Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - Learning to Communicate and Correct Pose Errors [75.03747122616605]
本稿では、V2VNetで提案された設定について検討し、近くにある自動運転車が共同で物体検出と動き予測を協調的に行う方法を提案する。
本稿では,コミュニケーションを学習し,潜在的な誤りを推定し,それらの誤りについてコンセンサスを得るための新しいニューラルネットワーク推論フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-10T18:19:40Z) - Exploring Zero-Shot Emergent Communication in Embodied Multi-Agent
Populations [59.608216900601384]
本研究では,3次元環境下で関節を作動させることでコミュニケーションを学ぶエージェントについて検討する。
現実的な仮定、意図の非一様分布、共通知識エネルギーコストにおいて、これらのエージェントは新規パートナーに一般化するプロトコルを見つけることができることを示す。
論文 参考訳(メタデータ) (2020-10-29T19:23:10Z) - Learning to Communicate Using Counterfactual Reasoning [2.8110705488739676]
本稿では,Multi-agent counterfactual communication learning (MACC)法を提案する。
MACCは、通信エージェントの信用割当問題を克服するために、対実的推論に適応する。
実験の結果,MACCは粒子環境における4つのシナリオにおいて,最先端のベースラインよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-06-12T14:02:04Z) - Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。
先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。
I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-06-11T14:07:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。