論文の概要: Learning to Communicate using Contrastive Learning
- arxiv url: http://arxiv.org/abs/2307.01403v1
- Date: Mon, 3 Jul 2023 23:51:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 18:47:26.008719
- Title: Learning to Communicate using Contrastive Learning
- Title(参考訳): コントラスト学習を用いたコミュニケーション学習
- Authors: Yat Long Lo, Biswa Sengupta, Jakob Foerster, Michael Noukhovitch
- Abstract要約: 本稿では,コミュニケーション的メッセージが環境状態の異なる不完全なビューと見なされる,別の視点を紹介する。
送信したメッセージと受信したメッセージの関係を調べることで,コントラスト学習を用いてコミュニケーションを学ぶことを提案する。
通信環境において,本手法は性能と学習速度の両面で,従来の手法よりも優れていた。
- 参考スコア(独自算出の注目度): 2.8484009470171943
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Communication is a powerful tool for coordination in multi-agent RL. But
inducing an effective, common language is a difficult challenge, particularly
in the decentralized setting. In this work, we introduce an alternative
perspective where communicative messages sent between agents are considered as
different incomplete views of the environment state. By examining the
relationship between messages sent and received, we propose to learn to
communicate using contrastive learning to maximize the mutual information
between messages of a given trajectory. In communication-essential
environments, our method outperforms previous work in both performance and
learning speed. Using qualitative metrics and representation probing, we show
that our method induces more symmetric communication and captures global state
information from the environment. Overall, we show the power of contrastive
learning and the importance of leveraging messages as encodings for effective
communication.
- Abstract(参考訳): コミュニケーションはマルチエージェントRLにおけるコーディネーションの強力なツールである。
しかし、効果的な共通言語の導入は、特に分散環境では難しい課題である。
本稿では,エージェント間で送信されるコミュニケーションメッセージが,環境状態の異なる不完全なビューと見なされる,別の視点を提案する。
受信したメッセージ間の関係を調べることにより,与えられた軌道上のメッセージ間の相互情報を最大化するために,コントラスト学習を用いてコミュニケーションを学ぶことを提案する。
通信環境において,本手法は性能と学習速度の両面で,従来の手法よりも優れていた。
定性的メトリクスと表現探索を用いて,本手法がより対称な通信を誘導し,環境からグローバルな状態情報を取得することを示す。
全体として、コントラスト学習の力と、効果的なコミュニケーションのためのエンコーディングとしてメッセージを活用することの重要性を示す。
関連論文リスト
- Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - Cognitive Semantic Communication Systems Driven by Knowledge Graph:
Principle, Implementation, and Performance Evaluation [74.38561925376996]
単一ユーザと複数ユーザのコミュニケーションシナリオに対して,認知意味コミュニケーションフレームワークが2つ提案されている。
知識グラフから推論規則をマイニングすることにより,効果的な意味補正アルゴリズムを提案する。
マルチユーザ認知型セマンティックコミュニケーションシステムにおいて,異なるユーザのメッセージを識別するために,メッセージ復元アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-15T12:01:43Z) - On the Role of Emergent Communication for Social Learning in Multi-Agent
Reinforcement Learning [0.0]
社会学習は、専門家からのヒントを使って、異質なポリシーを整列し、サンプルの複雑さを減らし、部分的に観察可能なタスクを解決する。
本稿では,情報ボトルネックに基づく教師なし手法を提案する。
論文 参考訳(メタデータ) (2023-02-28T03:23:27Z) - Emergent Quantized Communication [34.31732248872158]
本稿では,メッセージの量子化という,離散的なコミュニケーションを実現するための代替手法を提案する。
メッセージの量子化により、モデルのエンドツーエンドのトレーニングが可能になり、複数のセットアップで優れたパフォーマンスを実現します。
論文 参考訳(メタデータ) (2022-11-04T12:39:45Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Beyond Transmitting Bits: Context, Semantics, and Task-Oriented
Communications [88.68461721069433]
次世代システムは、メッセージセマンティクスを折り畳み、コミュニケーションの目標を設計に組み込むことによって、潜在的に豊かになる。
このチュートリアルは、初期適応、セマンティック・アウェア、タスク指向コミュニケーションから始まり、現在までの取り組みを要約する。
その焦点は、情報理論を利用して基礎を提供するアプローチと、意味論やタスク対応コミュニケーションにおける学習の重要な役割である。
論文 参考訳(メタデータ) (2022-07-19T16:00:57Z) - Towards Human-Agent Communication via the Information Bottleneck
Principle [19.121541894577298]
これら3つの要因(実用性、情報性、複雑さ)のトレーディングが、いかに創発的なコミュニケーションを形作るかを研究する。
本稿では,連続空間に埋め込まれた離散信号に入力を圧縮するニューラルネットワークを訓練するVector-Quantized Variational Information Bottleneck (VQ-VIB)を提案する。
論文 参考訳(メタデータ) (2022-06-30T20:10:20Z) - Learning to Ground Decentralized Multi-Agent Communication with
Contrastive Learning [1.116812194101501]
我々は,環境状態の異なる不完全な視点として,エージェント間で送信されるコミュニケーションメッセージに代替的な視点を導入する。
本稿では,与えられた軌跡のメッセージ間の相互情報を自己管理的に最大化することにより,共通言語の出現を誘導する簡単な手法を提案する。
論文 参考訳(メタデータ) (2022-03-07T12:41:32Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Learning Emergent Discrete Message Communication for Cooperative
Reinforcement Learning [36.468498804251574]
離散メッセージ通信は連続メッセージ通信に匹敵する性能を有することを示す。
エージェントに離散的なメッセージを対話的に送信できるアプローチを提案します。
論文 参考訳(メタデータ) (2021-02-24T20:44:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。