Fugu-MT 論文翻訳(概要): Learning Practical Communication Strategies in Cooperative Multi-Agent Reinforcement Learning

論文の概要: Learning Practical Communication Strategies in Cooperative Multi-Agent Reinforcement Learning

arxiv url: http://arxiv.org/abs/2209.01288v1
Date: Fri, 2 Sep 2022 22:18:43 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-07 13:09:29.785144
Title: Learning Practical Communication Strategies in Cooperative Multi-Agent Reinforcement Learning
Title（参考訳）: 協調型マルチエージェント強化学習における実践的コミュニケーション戦略の学習
Authors: Diyi Hu, Chi Zhang, Viktor Prasanna, Bhaskar, Krishnamachari
Abstract要約: 現実的な無線ネットワークにおける通信は、エージェントの移動量によってネットワーク条件が変化するため、信頼性が低い。本稿では,3つの基本的な問題に対処し,実践的なコミュニケーション戦略を学ぶための枠組みを提案する。我々は,最先端技術と比較して,ゲーム性能,収束速度,通信効率が著しく向上したことを示す。
参考スコア（独自算出の注目度）: 5.539117319607963
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In Multi-Agent Reinforcement Learning, communication is critical to encourage cooperation among agents. Communication in realistic wireless networks can be highly unreliable due to network conditions varying with agents' mobility, and stochasticity in the transmission process. We propose a framework to learn practical communication strategies by addressing three fundamental questions: (1) When: Agents learn the timing of communication based on not only message importance but also wireless channel conditions. (2) What: Agents augment message contents with wireless network measurements to better select the game and communication actions. (3) How: Agents use a novel neural message encoder to preserve all information from received messages, regardless of the number and order of messages. Simulating standard benchmarks under realistic wireless network settings, we show significant improvements in game performance, convergence speed and communication efficiency compared with state-of-the-art.
Abstract（参考訳）: マルチエージェント強化学習では,エージェント間の協調を促進するためにコミュニケーションが不可欠である。現実の無線ネットワークにおける通信は、エージェントの移動性や伝送過程の確率性によって異なるネットワーク条件により、非常に信頼できない。我々は,(1)エージェントがメッセージの重要性だけでなく,無線回線条件にも基いてコミュニケーションのタイミングを学習する場合に,実用的コミュニケーション戦略を学ぶための枠組みを提案する。 2) エージェントは,無線ネットワーク計測によるメッセージ内容の強化を行い,ゲームやコミュニケーション行動のより良い選択を行う。 (3) エージェントは、受信メッセージの数や順序に関わらず、受信メッセージからすべての情報を保存するために、新しいニューラルメッセージエンコーダを使用する。リアルな無線ネットワーク設定下での標準ベンチマークのシミュレーションでは,最先端技術と比較してゲーム性能,収束速度,通信効率が大幅に向上した。

関連論文リスト

Pragmatic Communication in Multi-Agent Collaborative Perception [80.14322755297788]
協調的な知覚は、知覚能力とコミュニケーションコストのトレードオフをもたらす。 PragCommは2つの重要なコンポーネントを持つマルチエージェント協調認識システムである。 PragCommは、32.7K以上の通信量で従来手法より一貫して優れていた。
論文参考訳（メタデータ） (2024-01-23T11:58:08Z)
Will 6G be Semantic Communications? Opportunities and Challenges from Task Oriented and Secure Communications to Integrated Sensing [49.83882366499547]
本稿では,マルチタスク学習を統合した次世代(NextG)ネットワークにおけるタスク指向およびセマンティックコミュニケーションの機会と課題について検討する。我々は、送信側の専用エンコーダと受信側の複数のタスク固有のデコーダを表すディープニューラルネットワークを用いる。トレーニングとテストの段階において、敵対的攻撃に起因する潜在的な脆弱性を精査する。
論文参考訳（メタデータ） (2024-01-03T04:01:20Z)
Multi-Agent Reinforcement Learning Based on Representational Communication for Large-Scale Traffic Signal Control [13.844458247041711]
交通信号制御(TSC)は、インテリジェント交通システムにおいて難しい問題である。大規模TSCのための通信ベースのMARLフレームワークを提案する。私たちのフレームワークでは、各エージェントがメッセージのどの部分を誰に"送信"するかを指示する通信ポリシーを学習することができます。
論文参考訳（メタデータ） (2023-10-03T21:06:51Z)
Learning Multi-Agent Communication with Contrastive Learning [3.816854668079928]
本稿では,コミュニケーション的メッセージが環境状態の異なる不完全なビューと見なされる,別の視点を紹介する。送信したメッセージと受信したメッセージの関係を調べることで,コントラスト学習を用いてコミュニケーションを学ぶことを提案する。通信環境において,本手法は性能と学習速度の両面で,従来の手法よりも優れていた。
論文参考訳（メタデータ） (2023-07-03T23:51:05Z)
AC2C: Adaptively Controlled Two-Hop Communication for Multi-Agent Reinforcement Learning [4.884877440051105]
本稿では,AC2C(Adaptive Controlled Two-Hop Communication)と呼ばれる新しい通信プロトコルを提案する。 AC2Cは、エージェント間の長距離情報交換によるパフォーマンス向上を可能にするために、適応的な2ホップ通信戦略を採用している。本稿では,3つの協調型マルチエージェントタスクにおけるAC2Cの評価を行った。
論文参考訳（メタデータ） (2023-02-24T09:00:34Z)
Less Data, More Knowledge: Building Next Generation Semantic Communication Networks [180.82142885410238]
本稿では、スケーラブルなエンドツーエンドセマンティック通信ネットワークの最初の厳密なビジョンを示す。まず、セマンティック・コミュニケーション・ネットワークの設計は、データ駆動型ネットワークから知識駆動型ネットワークへどのように移行する必要があるかについて議論する。意味表現と言語を用いることで、従来の送信機と受信機が教師と見習いになることを示す。
論文参考訳（メタデータ） (2022-11-25T19:03:25Z)
Over-communicate no more: Situated RL agents learn concise communication protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。強化学習(RL)を用いたコミュニケーションの出現に関する研究エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文参考訳（メタデータ） (2022-11-02T21:08:14Z)
Multi-agent Communication with Graph Information Bottleneck under Limited Bandwidth (a position paper) [92.11330289225981]
多くの実世界のシナリオでは、通信は高価であり、マルチエージェントシステムの帯域幅には一定の制約がある。通信資源を占有する冗長なメッセージは、情報的メッセージの送信をブロックし、パフォーマンスを損なう。本稿では,通信グラフ内の構造情報とノード情報を効果的に圧縮し,帯域幅に制約のある設定に対処する,新しいマルチエージェント通信モジュールCommGIBを提案する。
論文参考訳（メタデータ） (2021-12-20T07:53:44Z)
Interpretation of Emergent Communication in Heterogeneous Collaborative Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文参考訳（メタデータ） (2021-10-12T06:56:11Z)
Minimizing Communication while Maximizing Performance in Multi-Agent Reinforcement Learning [5.612141846711729]
エージェント間通信は、コーディネーションを必要とするマルチエージェントタスクのパフォーマンスを著しく向上させることができる。通信が帯域幅、電力、ネットワーク容量といったシステムの制約によって制限されるような現実世界のアプリケーションでは、送信されるメッセージの数を減らす必要がある。性能を損なうことなく、コミュニケーションを75%削減できることを示す。
論文参考訳（メタデータ） (2021-06-15T23:13:51Z)
Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。 I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文参考訳（メタデータ） (2020-06-11T14:07:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。