論文の概要: Multi-Agent Sequential Decision-Making via Communication
- arxiv url: http://arxiv.org/abs/2209.12713v1
- Date: Mon, 26 Sep 2022 14:08:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 18:10:59.954846
- Title: Multi-Agent Sequential Decision-Making via Communication
- Title(参考訳): 通信によるマルチエージェントシークエンシャル意思決定
- Authors: Ziluo Ding, Kefan Su, Weixin Hong, Liwen Zhu, Tiejun Huang, and
Zongqing Lu
- Abstract要約: 本稿では,シークエンシャルコミュニケーション(SeqComm)という新しいコミュニケーション手法を提案する。
交渉段階では、エージェントは隠れた観測状態を伝達することで意思決定の優先順位を決定する。
開始フェーズでは、上位エージェントが意思決定をリードし、下位エージェントと行動を伝える。
- 参考スコア(独自算出の注目度): 27.465335930802453
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Communication helps agents to obtain information about others so that better
coordinated behavior can be learned. Some existing work communicates predicted
future trajectory with others, hoping to get clues about what others would do
for better coordination. However, circular dependencies sometimes can occur
when agents are treated synchronously so it is hard to coordinate
decision-making. In this paper, we propose a novel communication scheme,
Sequential Communication (SeqComm). SeqComm treats agents asynchronously (the
upper-level agents make decisions before the lower-level ones) and has two
communication phases. In negotiation phase, agents determine the priority of
decision-making by communicating hidden states of observations and comparing
the value of intention, which is obtained by modeling the environment dynamics.
In launching phase, the upper-level agents take the lead in making decisions
and communicate their actions with the lower-level agents. Theoretically, we
prove the policies learned by SeqComm are guaranteed to improve monotonically
and converge. Empirically, we show that SeqComm outperforms existing methods in
various multi-agent cooperative tasks.
- Abstract(参考訳): コミュニケーションは、エージェントが他人に関する情報を得るのに役立つため、より良い協調行動が学べる。
既存の作業では、予測された将来の軌道を他の作業者と伝達し、他の作業がよりよい調整のために何をするかを知ることを望んでいます。
しかし、エージェントが同期的に扱われると、円形の依存関係が発生することがあるため、意思決定の調整は困難である。
本稿では,新しい通信方式であるシーケンシャル・コミュニケーション(seqcomm)を提案する。
SeqCommはエージェントを非同期に扱う(上位のエージェントは下位のエージェントよりも先に決定する)。
交渉段階では、エージェントは観察の隠れた状態を伝達し、環境力学をモデル化して得られる意図の値を比較することによって意思決定の優先順位を決定する。
開始段階では、上位のエージェントが意思決定をリードし、下位のエージェントと彼らのアクションを伝達する。
理論的には、SeqCommが学んだ政策は単調に改善し収束することが保証されている。
実験により,SeqCommは様々なマルチエージェント協調作業において,既存の手法よりも優れていることを示す。
関連論文リスト
- ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - Centralized Training with Hybrid Execution in Multi-Agent Reinforcement
Learning [7.163485179361718]
マルチエージェント強化学習(MARL)におけるハイブリッド実行の導入
MARLは、エージェントが任意の通信レベルを持つ協調タスクを実行時に完了させることを目標とする新しいパラダイムである。
我々は,自動回帰予測モデルを用いたMAROを集中的に訓練し,行方不明者の観察を推定する手法を提案する。
論文 参考訳(メタデータ) (2022-10-12T14:58:32Z) - Coordinating Policies Among Multiple Agents via an Intelligent
Communication Channel [81.39444892747512]
MARL(Multi-Agent Reinforcement Learning)では、エージェントが直接通信できる特別なチャンネルがしばしば導入される。
本稿では,エージェントの集団的性能を向上させるために,エージェントが提供した信号の伝達と解釈を学習する,インテリジェントなファシリテータを通じてエージェントがコミュニケーションする手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T14:11:33Z) - A Decentralized Communication Framework based on Dual-Level Recurrence
for Multi-Agent Reinforcement Learning [5.220940151628735]
マルチエージェントシステムのためのデュアルレベルリカレント通信フレームワークを提案する。
第1の再発は通信シーケンスで発生し、エージェント間の通信データを送信するために使用される。
第2の再発は、時系列に基づいて、各エージェントの履歴観測を組み合わせる。
論文 参考訳(メタデータ) (2022-02-22T01:36:59Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Learning Selective Communication for Multi-Agent Path Finding [18.703918339797283]
決定因果通信(Decision Causal Communication、DCC)は、エージェントが隣人を選択して通信を行うためのシンプルで効率的なモデルである。
DCCは大規模問題を扱うために分散実行に適している。
論文 参考訳(メタデータ) (2021-09-12T03:07:20Z) - Inference-Based Deterministic Messaging For Multi-Agent Communication [1.8275108630751844]
行列に基づくシグナリングゲームにおける学習について検討し,分散化手法がサブオプティマティリティポリシに収束できることを示した。
次に、送信者が送信者の観察を推測するのを助ける最良のメッセージを決定的に選択するメッセージポリシーの修正を提案します。
論文 参考訳(メタデータ) (2021-03-03T03:09:22Z) - Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。
先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。
I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-06-11T14:07:57Z) - On Emergent Communication in Competitive Multi-Agent Teams [116.95067289206919]
外部のエージェントチームによるパフォーマンスの競争が社会的影響として作用するかどうかを検討する。
以上の結果から,外部競争の影響により精度と一般化が向上し,コミュニケーション言語が急速に出現することが示唆された。
論文 参考訳(メタデータ) (2020-03-04T01:14:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。