論文の概要: Scalability of Message Encoding Techniques for Continuous Communication
Learned with Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2308.04844v1
- Date: Wed, 9 Aug 2023 10:08:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-10 14:13:42.355488
- Title: Scalability of Message Encoding Techniques for Continuous Communication
Learned with Multi-Agent Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習による連続通信のためのメッセージエンコーディング技術のスケーラビリティ
- Authors: Astrid Vanneste, Thomas Somers, Simon Vanneste, Kevin Mets, Tom De
Schepper, Siegfried Mercelis, Peter Hellinckx
- Abstract要約: メッセージに含まれるべき情報量を増やし,エージェント数を増やす効果について検討する。
平均メッセージエンコーダとアテンションメッセージエンコーダの2種類の異なるメッセージエンコーダの評価を行った。
驚いたことに、平均メッセージエンコーダはアテンションメッセージエンコーダよりも一貫して優れています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many multi-agent systems require inter-agent communication to properly
achieve their goal. By learning the communication protocol alongside the action
protocol using multi-agent reinforcement learning techniques, the agents gain
the flexibility to determine which information should be shared. However, when
the number of agents increases we need to create an encoding of the information
contained in these messages. In this paper, we investigate the effect of
increasing the amount of information that should be contained in a message and
increasing the number of agents. We evaluate these effects on two different
message encoding methods, the mean message encoder and the attention message
encoder. We perform our experiments on a matrix environment. Surprisingly, our
results show that the mean message encoder consistently outperforms the
attention message encoder. Therefore, we analyse the communication protocol
used by the agents that use the mean message encoder and can conclude that the
agents use a combination of an exponential and a logarithmic function in their
communication policy to avoid the loss of important information after applying
the mean message encoder.
- Abstract(参考訳): 多くのマルチエージェントシステムは、目標を適切に達成するためにエージェント間通信を必要とする。
マルチエージェント強化学習手法を用いて行動プロトコルと共に通信プロトコルを学習することにより、エージェントは共有すべき情報を決定する柔軟性を得る。
しかし、エージェント数が増加すると、これらのメッセージに含まれる情報のエンコードを作成する必要があります。
本稿では,メッセージに含まれるべき情報量を増やし,エージェント数を増やす効果について検討する。
平均メッセージエンコーダとアテンションメッセージエンコーダの2つの異なるメッセージエンコーダに対して,これらの効果を評価する。
我々はマトリックス環境で実験を行う。
驚くべきことに、平均メッセージエンコーダは、アテンションメッセージエンコーダを一貫して上回っている。
したがって、平均メッセージエンコーダを使用するエージェントが使用する通信プロトコルを分析し、平均メッセージエンコーダを適用した後に重要な情報を失うのを避けるために、エージェントが通信ポリシーにおいて指数関数と対数関数の組み合わせを使用していると結論付けることができる。
関連論文リスト
- Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - Communication-Efficient Collaborative Perception via Information Filling with Codebook [48.087934650038044]
協調的知覚は、他のエージェントと知覚的メッセージの交換を通じて、各エージェントに知覚能力を向上させる権限を与える。
このボトルネック問題に対処するため、私たちの中核となる考え方は、協調メッセージを2つの重要な側面、すなわち表現と選択から最適化することにあります。
これら2つの設計を統合することで,新しいコミュニケーション効率の協調認識システムであるCodeFillingを提案する。
論文 参考訳(メタデータ) (2024-05-08T11:12:37Z) - Verco: Learning Coordinated Verbal Communication for Multi-agent Reinforcement Learning [42.27106057372819]
本稿では,大規模言語モデルをエージェントに組み込むマルチエージェント強化学習アルゴリズムを提案する。
フレームワークにはメッセージモジュールとアクションモジュールがある。
オーバークッキングゲームで行った実験は,既存の手法の学習効率と性能を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2024-04-27T05:10:33Z) - Context-aware Communication for Multi-agent Reinforcement Learning [6.109127175562235]
マルチエージェント強化学習(MARL)のための文脈認識型コミュニケーション手法を開発した。
第1段階では、エージェントは放送方式で粗い表現を交換し、第2段階のコンテキストを提供する。
その後、エージェントは第2段階の注意機構を利用し、受信機用にパーソナライズされたメッセージを選択的に生成する。
CACOMの有効性を評価するため,アクタ批判型と値に基づくMARLアルゴリズムを併用する。
論文 参考訳(メタデータ) (2023-12-25T03:33:08Z) - Generative AI-aided Joint Training-free Secure Semantic Communications
via Multi-modal Prompts [89.04751776308656]
本稿では,多モデルプロンプトを用いたGAI支援型SemComシステムを提案する。
セキュリティ上の懸念に応えて、フレンドリーなジャマーによって支援される隠蔽通信の応用を紹介する。
論文 参考訳(メタデータ) (2023-09-05T23:24:56Z) - Efficient Communication via Self-supervised Information Aggregation for
Online and Offline Multi-agent Reinforcement Learning [12.334522644561591]
MARL(Multi-Agent Reinforcement Learning)の協調学習において,効率的なメッセージアグリゲーションは協調に不可欠である,と我々は主張する。
本稿では, エージェントが受信したメッセージをコンパクトな表現に集約し, ローカルポリシーの強化に高い関連性を持たせることができる, 自己教師型情報集約(MASIA)によるマルチエージェント通信を提案する。
私たちはマルチエージェント通信のためのオフラインベンチマークを構築しています。
論文 参考訳(メタデータ) (2023-02-19T16:02:16Z) - Scalable Communication for Multi-Agent Reinforcement Learning via
Transformer-Based Email Mechanism [9.607941773452925]
コミュニケーションはマルチエージェント強化学習(MARL)における協調性を著しく向上させる
本稿では,部分的に観測されたタスクに対するMARL通信のスケーラビリティ問題に対処するための新しいフレームワークである Transformer-based Email Mechanism (TEM) を提案する。
論文 参考訳(メタデータ) (2023-01-05T05:34:30Z) - Is Semantic Communications Secure? A Tale of Multi-Domain Adversarial
Attacks [70.51799606279883]
セマンティック・コミュニケーションのためのディープ・ニューラル・ネットワーク(DNN)に対するテスト・タイム・アタックを導入する。
再建損失が低い場合でも,伝達情報のセマンティクスを変更可能であることを示す。
論文 参考訳(メタデータ) (2022-12-20T17:13:22Z) - Multi-agent Communication with Graph Information Bottleneck under
Limited Bandwidth (a position paper) [92.11330289225981]
多くの実世界のシナリオでは、通信は高価であり、マルチエージェントシステムの帯域幅には一定の制約がある。
通信資源を占有する冗長なメッセージは、情報的メッセージの送信をブロックし、パフォーマンスを損なう。
本稿では,通信グラフ内の構造情報とノード情報を効果的に圧縮し,帯域幅に制約のある設定に対処する,新しいマルチエージェント通信モジュールCommGIBを提案する。
論文 参考訳(メタデータ) (2021-12-20T07:53:44Z) - Decoder Fusion RNN: Context and Interaction Aware Decoders for
Trajectory Prediction [53.473846742702854]
本稿では,動き予測のための反復的,注意に基づくアプローチを提案する。
Decoder Fusion RNN (DF-RNN) は、リカレント動作エンコーダ、エージェント間マルチヘッドアテンションモジュール、コンテキスト認識デコーダで構成される。
提案手法の有効性をArgoverseモーション予測データセットで検証し,その性能を公開ベンチマークで示す。
論文 参考訳(メタデータ) (2021-08-12T15:53:37Z) - Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。
先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。
I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-06-11T14:07:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。