論文の概要: Inductive Bias for Emergent Communication in a Continuous Setting
- arxiv url: http://arxiv.org/abs/2306.03830v1
- Date: Tue, 6 Jun 2023 16:15:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 14:24:19.718137
- Title: Inductive Bias for Emergent Communication in a Continuous Setting
- Title(参考訳): 連続環境における創発的コミュニケーションのための誘導バイアス
- Authors: John Isak Fjellvang Villanger and Troels Arnfred Bojesen
- Abstract要約: マルチエージェント強化学習環境における創発的コミュニケーションについて検討する。
連続メッセージのための優れた通信プロトコルの出現を支援するために、誘導バイアスを導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study emergent communication in a multi-agent reinforcement learning
setting, where the agents solve cooperative tasks and have access to a
communication channel. The communication channel may consist of either discrete
symbols or continuous variables. We introduce an inductive bias to aid with the
emergence of good communication protocols for continuous messages, and we look
at the effect this type of inductive bias has for continuous and discrete
messages in itself or when used in combination with reinforcement learning. We
demonstrate that this type of inductive bias has a beneficial effect on the
communication protocols learnt in two toy environments, Negotiation and
Sequence Guess.
- Abstract(参考訳): エージェントが協調作業の解決とコミュニケーションチャネルへのアクセスを行うマルチエージェント強化学習環境における創発的コミュニケーションについて検討する。
通信チャネルは、離散シンボルまたは連続変数のいずれかからなることができる。
我々は,連続メッセージのための優れた通信プロトコルの出現を支援する帰納的バイアスを導入し,このタイプの帰納的バイアスが,連続的および離散的なメッセージそのものや強化学習と組み合わせて使用される場合に与える影響について考察する。
このような帰納バイアスは,2つの玩具環境で学習したコミュニケーションプロトコル,NegotiationとSequence Guessに有効であることを示す。
関連論文リスト
- Will 6G be Semantic Communications? Opportunities and Challenges from
Task Oriented and Secure Communications to Integrated Sensing [49.83882366499547]
本稿では,マルチタスク学習を統合した次世代(NextG)ネットワークにおけるタスク指向およびセマンティックコミュニケーションの機会と課題について検討する。
我々は、送信側の専用エンコーダと受信側の複数のタスク固有のデコーダを表すディープニューラルネットワークを用いる。
トレーニングとテストの段階において、敵対的攻撃に起因する潜在的な脆弱性を精査する。
論文 参考訳(メタデータ) (2024-01-03T04:01:20Z) - Learning Multi-Agent Communication with Contrastive Learning [3.816854668079928]
本稿では,コミュニケーション的メッセージが環境状態の異なる不完全なビューと見なされる,別の視点を紹介する。
送信したメッセージと受信したメッセージの関係を調べることで,コントラスト学習を用いてコミュニケーションを学ぶことを提案する。
通信環境において,本手法は性能と学習速度の両面で,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-03T23:51:05Z) - Emergent Quantized Communication [34.31732248872158]
本稿では,メッセージの量子化という,離散的なコミュニケーションを実現するための代替手法を提案する。
メッセージの量子化により、モデルのエンドツーエンドのトレーニングが可能になり、複数のセットアップで優れたパフォーマンスを実現します。
論文 参考訳(メタデータ) (2022-11-04T12:39:45Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Color Overmodification Emerges from Data-Driven Learning and Pragmatic
Reasoning [53.088796874029974]
話者の指示表現は、実践的な言語使用の性質を照らし出すのに役立つ方法で、コミュニケーションイデアルから逸脱していることを示す。
ニューラルネットワークを学習エージェントとして採用することにより、過度な修正は、頻度の低い、あるいは正常な環境特性に結びつく可能性が高いことを示す。
論文 参考訳(メタデータ) (2022-05-18T18:42:43Z) - Towards Learning to Speak and Hear Through Multi-Agent Communication
over a Continuous Acoustic Channel [21.503787009047677]
私たちは、継続的なコミュニケーションチャネルでエージェント間の緊急言語を観察できますか?
本稿では,話者エージェントが雑音の多い音響チャンネル上でリスナーに属性のセットを伝達する必要があるメッセージング環境を提案する。
DQN を用いてエージェントを訓練すると,(1) 個別の場合とは異なり,音響話者はリスナーのコヒーレンシー向上のために冗長性を学習し,(2) ノイズチャネル上の伝達誤差を暗黙的に補償する,より構成的な通信プロトコルを開発し,(3) DQN はREINFORCE を用いて最適化された手法と比較して,顕著な性能向上と構成性の向上を示した。
論文 参考訳(メタデータ) (2021-11-04T12:44:18Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Learning to Draw: Emergent Communication through Sketching [0.0]
タスクを協調的に解決するために,エージェントがコミュニケーションを学ぶ方法を示す。
既存の研究は言語に重点を置いており、エージェント間で個別のトークンのシーケンスを学習された通信チャネルで送信している。
我々のエージェントはディープニューラルネットワークによってパラメータ化されており、描画手順は微分可能であり、エンドツーエンドのトレーニングを可能にします。
参照型コミュニケーションゲームの枠組みでは,エージェントが図面によるコミュニケーションをうまく学べるだけでなく,適切な帰納的バイアスを伴って,人間が解釈できる方法で行うことができることを示す。
論文 参考訳(メタデータ) (2021-06-03T18:17:55Z) - Learning Emergent Discrete Message Communication for Cooperative
Reinforcement Learning [36.468498804251574]
離散メッセージ通信は連続メッセージ通信に匹敵する性能を有することを示す。
エージェントに離散的なメッセージを対話的に送信できるアプローチを提案します。
論文 参考訳(メタデータ) (2021-02-24T20:44:14Z) - Adversarial Attacks On Multi-Agent Communication [80.4392160849506]
現代の自律システムはすぐに大規模に展開され、協調型マルチエージェントシステムの可能性を広げる。
このような利点は、セキュリティ侵害に対して脆弱であることが示されている通信チャネルに大きく依存している。
本稿では,エージェントが学習した中間表現を共有してコミュニケーションする新しいマルチエージェント環境において,このような攻撃を探索する。
論文 参考訳(メタデータ) (2021-01-17T00:35:26Z) - Exploring Zero-Shot Emergent Communication in Embodied Multi-Agent
Populations [59.608216900601384]
本研究では,3次元環境下で関節を作動させることでコミュニケーションを学ぶエージェントについて検討する。
現実的な仮定、意図の非一様分布、共通知識エネルギーコストにおいて、これらのエージェントは新規パートナーに一般化するプロトコルを見つけることができることを示す。
論文 参考訳(メタデータ) (2020-10-29T19:23:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。