論文の概要: Learning to Construct Implicit Communication Channel
- arxiv url: http://arxiv.org/abs/2411.01553v1
- Date: Sun, 03 Nov 2024 12:58:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:49:08.681906
- Title: Learning to Construct Implicit Communication Channel
- Title(参考訳): 意図しないコミュニケーションチャネルを構築するための学習
- Authors: Han Wang, Binbin Chen, Tieying Zhang, Baoxiang Wang,
- Abstract要約: 入出力通信は協調型マルチエージェントシステムにおいて重要な要素である。
暗黙のコミュニケーションの学習に関するこれまでの研究は、主に心の理論(ToM)に依存している。
本稿では,暗黙的な通信チャネルを明示的に構築できるImplicit Channel Protocol (ICP) フレームワークを提案する。
- 参考スコア(独自算出の注目度): 15.362651398484633
- License:
- Abstract: Effective communication is an essential component in collaborative multi-agent systems. Situations where explicit messaging is not feasible have been common in human society throughout history, which motivate the study of implicit communication. Previous works on learning implicit communication mostly rely on theory of mind (ToM), where agents infer the mental states and intentions of others by interpreting their actions. However, ToM-based methods become less effective in making accurate inferences in complex tasks. In this work, we propose the Implicit Channel Protocol (ICP) framework, which allows agents to construct implicit communication channels similar to the explicit ones. ICP leverages a subset of actions, denoted as the scouting actions, and a mapping between information and these scouting actions that encodes and decodes the messages. We propose training algorithms for agents to message and act, including learning with a randomly initialized information map and with a delayed information map. The efficacy of ICP has been tested on the tasks of Guessing Number, Revealing Goals, and Hanabi, where ICP significantly outperforms baseline methods through more efficient information transmission.
- Abstract(参考訳): 効果的なコミュニケーションは、協調型マルチエージェントシステムにおいて欠かせない要素である。
明示的なメッセージが実現不可能な状況は、歴史を通じて人間の社会で一般的であり、暗黙的なコミュニケーションの研究の動機となっている。
これまでは、暗黙のコミュニケーションを学ぶことは主に心の理論(ToM)に依存しており、エージェントは行動の解釈によって、他者の精神状態や意図を推測する。
しかし、ToMベースの手法は複雑なタスクにおいて正確な推論を行うのにあまり効果的ではない。
本研究では,暗黙的な通信チャネルを明示的に構築できるImplicit Channel Protocol (ICP) フレームワークを提案する。
ICPは、スカウトアクションと呼ばれる一連のアクションと、メッセージのエンコードとデコードを行うこれらのスカウトアクションの間のマッピングを利用する。
本稿では,ランダムに初期化された情報マップと遅延した情報マップを用いた学習を含む,エージェントのメッセージ・行動訓練アルゴリズムを提案する。
ICPの有効性は、より効率的な情報伝達により、ICPがベースライン法を著しく上回るゲスティングナンバー、リーベリングゴール、ハナビのタスクでテストされている。
関連論文リスト
- Pragmatic Communication in Multi-Agent Collaborative Perception [80.14322755297788]
協調的な知覚は、知覚能力とコミュニケーションコストのトレードオフをもたらす。
PragCommは2つの重要なコンポーネントを持つマルチエージェント協調認識システムである。
PragCommは、32.7K以上の通信量で従来手法より一貫して優れていた。
論文 参考訳(メタデータ) (2024-01-23T11:58:08Z) - T2MAC: Targeted and Trusted Multi-Agent Communication through Selective
Engagement and Evidence-Driven Integration [15.91335141803629]
我々は、エージェントが選択的なエンゲージメントとエビデンス駆動の統合を学ぶのを助けるために、T2MAC(Targeted and Trusted Multi-Agent Communication)を提案する。
T2MACは、エージェントが個別化されたメッセージを作成し、理想的なコミュニケーションウィンドウをピンポイントし、信頼できるパートナーと対話することを可能にする。
本手法は,様々な課題を伴って,多様な協調型マルチエージェントタスクに対して評価を行う。
論文 参考訳(メタデータ) (2024-01-19T18:00:33Z) - Context-aware Communication for Multi-agent Reinforcement Learning [6.109127175562235]
マルチエージェント強化学習(MARL)のための文脈認識型コミュニケーション手法を開発した。
第1段階では、エージェントは放送方式で粗い表現を交換し、第2段階のコンテキストを提供する。
その後、エージェントは第2段階の注意機構を利用し、受信機用にパーソナライズされたメッセージを選択的に生成する。
CACOMの有効性を評価するため,アクタ批判型と値に基づくMARLアルゴリズムを併用する。
論文 参考訳(メタデータ) (2023-12-25T03:33:08Z) - Batch Selection and Communication for Active Learning with Edge Labeling [54.64985724916654]
コミュニケーション拘束型ベイズ能動的知識蒸留(CC-BAKD)
本研究は,コミュニケーション制約型ベイズ能動的知識蒸留(CC-BAKD)を紹介する。
論文 参考訳(メタデータ) (2023-11-14T10:23:00Z) - From Explicit Communication to Tacit Cooperation:A Novel Paradigm for
Cooperative MARL [14.935456456463731]
本稿では,明示的なコミュニケーションから暗黙的な協調への段階的なシフトを促進する新しいパラダイムを提案する。
初期訓練段階では,エージェント間で関連情報を共有することで協力を促進する。
次に、明示的に伝達された情報と再構成された情報を組み合わせて混合情報を得る。
論文 参考訳(メタデータ) (2023-04-28T06:56:07Z) - Adversarial Learning for Implicit Semantic-Aware Communications [104.08383219177557]
対戦型学習に基づく暗黙的意味認識通信アーキテクチャ(iSAC)を開発した。
我々は、iSACを適用することで、送信先のユーザは、ソースメッセージの真の推論ルールと一致する推論ルールを常に学習できることを示す。
実験結果から,提案したiSACは,既存の非推論通信ソリューションよりも最大19.69dB向上できることがわかった。
論文 参考訳(メタデータ) (2023-01-27T08:28:12Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Beyond Transmitting Bits: Context, Semantics, and Task-Oriented
Communications [88.68461721069433]
次世代システムは、メッセージセマンティクスを折り畳み、コミュニケーションの目標を設計に組み込むことによって、潜在的に豊かになる。
このチュートリアルは、初期適応、セマンティック・アウェア、タスク指向コミュニケーションから始まり、現在までの取り組みを要約する。
その焦点は、情報理論を利用して基礎を提供するアプローチと、意味論やタスク対応コミュニケーションにおける学習の重要な役割である。
論文 参考訳(メタデータ) (2022-07-19T16:00:57Z) - Learning Selective Communication for Multi-Agent Path Finding [18.703918339797283]
決定因果通信(Decision Causal Communication、DCC)は、エージェントが隣人を選択して通信を行うためのシンプルで効率的なモデルである。
DCCは大規模問題を扱うために分散実行に適している。
論文 参考訳(メタデータ) (2021-09-12T03:07:20Z) - Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。
先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。
I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-06-11T14:07:57Z) - Emergence of Pragmatics from Referential Game between Theory of Mind
Agents [64.25696237463397]
エージェントが手書きのルールを指定せずに「行間を読む」能力を自発的に学習するアルゴリズムを提案する。
協調型マルチエージェント教育状況における心の理論(ToM)を統合し,適応型強化学習(RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-21T19:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。