論文の概要: Cheap Talk Discovery and Utilization in Multi-Agent Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2303.10733v1
- Date: Sun, 19 Mar 2023 18:38:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 17:26:05.165607
- Title: Cheap Talk Discovery and Utilization in Multi-Agent Reinforcement
Learning
- Title(参考訳): マルチエージェント強化学習における安価発話発見と活用
- Authors: Yat Long Lo, Christian Schroeder de Witt, Samuel Sokota, Jakob
Nicolaus Foerster, Shimon Whiteson
- Abstract要約: 現在のアプローチは、エージェントが無料の通信チャネル、すなわち安価な通信チャネルを通じてメッセージを送ることを可能にすることによって、エージェント間通信を促進する。
この作業では,エージェントが安価なトークチャネルを発見して使用方法を学ぶ必要があるという,これらの要件を取り上げる。
我々は、CTD/CTU設定において既存のアルゴリズムより優れた相互情報に基づく新しいアルゴリズムを開発する。
- 参考スコア(独自算出の注目度): 44.85419124056661
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: By enabling agents to communicate, recent cooperative multi-agent
reinforcement learning (MARL) methods have demonstrated better task performance
and more coordinated behavior. Most existing approaches facilitate inter-agent
communication by allowing agents to send messages to each other through free
communication channels, i.e., cheap talk channels. Current methods require
these channels to be constantly accessible and known to the agents a priori. In
this work, we lift these requirements such that the agents must discover the
cheap talk channels and learn how to use them. Hence, the problem has two main
parts: cheap talk discovery (CTD) and cheap talk utilization (CTU). We
introduce a novel conceptual framework for both parts and develop a new
algorithm based on mutual information maximization that outperforms existing
algorithms in CTD/CTU settings. We also release a novel benchmark suite to
stimulate future research in CTD/CTU.
- Abstract(参考訳): エージェント間のコミュニケーションを可能にすることにより,近年の協調型マルチエージェント強化学習(marl)手法により,タスク性能と協調行動が向上した。
既存のほとんどのアプローチは、エージェントが無料の通信チャネル、すなわち安価な通信チャネルを通じてメッセージを送ることによって、エージェント間通信を促進する。
現在の方法では、これらのチャネルは常にアクセスでき、エージェントにa prioriを知っておく必要がある。
この作業では,エージェントが安価なトークチャネルを発見して使用方法を学ぶ必要があるという,これらの要件を取り上げる。
したがって、この問題には、安価なトーク発見(CTD)と安価なトーク利用(CTU)の2つの主要な部分がある。
両部品に新しい概念的枠組みを導入し,CTD/CTU設定において既存のアルゴリズムより優れる相互情報の最大化に基づく新しいアルゴリズムを開発する。
また,CTD/CTUの今後の研究を刺激する新しいベンチマークスイートもリリースした。
関連論文リスト
- Context-aware Communication for Multi-agent Reinforcement Learning [6.109127175562235]
マルチエージェント強化学習(MARL)のための文脈認識型コミュニケーション手法を開発した。
第1段階では、エージェントは放送方式で粗い表現を交換し、第2段階のコンテキストを提供する。
その後、エージェントは第2段階の注意機構を利用し、受信機用にパーソナライズされたメッセージを選択的に生成する。
CACOMの有効性を評価するため,アクタ批判型と値に基づくMARLアルゴリズムを併用する。
論文 参考訳(メタデータ) (2023-12-25T03:33:08Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - Cooperative Multi-Agent Reinforcement Learning: Asynchronous
Communication and Linear Function Approximation [77.09836892653176]
マルコフ決定過程の設定におけるマルチエージェント強化学習について検討した。
本稿では非同期通信が可能な値に基づく証明可能な効率的なアルゴリズムを提案する。
我々は、コラボレーションによってパフォーマンスを改善するために、最小の$Omega(dM)$通信の複雑さが必要であることを示す。
論文 参考訳(メタデータ) (2023-05-10T20:29:29Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - Smoothing Dialogue States for Open Conversational Machine Reading [70.83783364292438]
本稿では,2つの対話状態を1つのデコーダとブリッジ決定と質問生成でスムーズにすることで,効果的なゲーティング戦略を提案する。
OR-ShARCデータセットを用いた実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2021-08-28T08:04:28Z) - Quasi-Equivalence Discovery for Zero-Shot Emergent Communication [63.175848843466845]
ゼロショットコーディネーション(ZSC)を実現するための新しい問題設定と準等価探索アルゴリズムを提案する。
これらの2つの要因が参照ゲームにおいて一意に最適なZSCポリシーをもたらすことを示す。
QEDはこの設定における対称性を反復的に発見することができ、最適なZSCポリシーに収束する。
論文 参考訳(メタデータ) (2021-03-14T23:42:37Z) - Effective Communications: A Joint Learning and Communication Framework
for Multi-Agent Reinforcement Learning over Noisy Channels [0.0]
コミュニケーションにおける「有効性問題」の新しい定式化を提案する。
コーディネーションと協調性を向上するために,複数のエージェントがノイズの多いチャネル上で通信することを検討する。
提案した枠組みを用いて学習した共同方針が,コミュニケーションが別々に考慮される場合よりも優れていることを例に示します。
論文 参考訳(メタデータ) (2021-01-02T10:43:41Z) - Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。
先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。
I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-06-11T14:07:57Z) - Networked Multi-Agent Reinforcement Learning with Emergent Communication [18.47483427884452]
MARL(Multi-Agent Reinforcement Learning)法は,他の学習エージェントの存在下で活動するエージェントに対して最適なポリシーを求める。
コーディネートするひとつの方法は、相互通信を学ぶことです。
エージェントは共通のタスクを実行するために学習しながら言語を開発することができるか?
論文 参考訳(メタデータ) (2020-04-06T16:13:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。