論文の概要: Robust Multi-agent Communication via Multi-view Message Certification
- arxiv url: http://arxiv.org/abs/2305.13936v1
- Date: Sun, 7 May 2023 14:57:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-28 04:59:54.638031
- Title: Robust Multi-agent Communication via Multi-view Message Certification
- Title(参考訳): マルチビューメッセージ認証によるロバストマルチエージェント通信
- Authors: Lei Yuan, Tao Jiang, Lihe Li, Feng Chen, Zongzhang Zhang, Yang Yu
- Abstract要約: 我々は、CroMACと呼ばれるマルチビューメッセージ認証を通じて、堅牢なマルチエージェント通信ポリシーを学習する。
CroMACの下で訓練されたエージェントは、最適なアクションを特定し、選択するための状態-アクション値の保証された低い境界を得ることができる。
- 参考スコア(独自算出の注目度): 20.331565995805413
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Many multi-agent scenarios require message sharing among agents to promote
coordination, hastening the robustness of multi-agent communication when
policies are deployed in a message perturbation environment. Major relevant
works tackle this issue under specific assumptions, like a limited number of
message channels would sustain perturbations, limiting the efficiency in
complex scenarios. In this paper, we take a further step addressing this issue
by learning a robust multi-agent communication policy via multi-view message
certification, dubbed CroMAC. Agents trained under CroMAC can obtain guaranteed
lower bounds on state-action values to identify and choose the optimal action
under a worst-case deviation when the received messages are perturbed.
Concretely, we first model multi-agent communication as a multi-view problem,
where every message stands for a view of the state. Then we extract a
certificated joint message representation by a multi-view variational
autoencoder (MVAE) that uses a product-of-experts inference network. For the
optimization phase, we do perturbations in the latent space of the state for a
certificate guarantee. Then the learned joint message representation is used to
approximate the certificated state representation during training. Extensive
experiments in several cooperative multi-agent benchmarks validate the
effectiveness of the proposed CroMAC.
- Abstract(参考訳): 多くのマルチエージェントシナリオでは、協調を促進するためにエージェント間のメッセージ共有が必要であり、メッセージの摂動環境にポリシーがデプロイされると、マルチエージェント通信の堅牢性が向上する。
メッセージチャネルの数が少ないと摂動が持続し、複雑なシナリオの効率が制限されるような、特定の前提の下で、主要な関連する作業がこの問題に対処します。
本稿では,CroMACと呼ばれるマルチビューメッセージ認証を通じて,堅牢なマルチエージェント通信ポリシーを学習することで,この問題にさらに対処する。
クロマックの下で訓練されたエージェントは、受信したメッセージが摂動したときに最悪の場合の偏差の下で最適なアクションを識別し選択するために、状態動作値の保証された下限を得ることができる。
具体的には、まずマルチエージェント通信をマルチビュー問題としてモデル化し、各メッセージが状態のビューを表す。
次に,多視点変分オートエンコーダ (MVAE) による認証された共同メッセージ表現を抽出する。
最適化フェーズでは、証明書保証のために状態の潜在空間で摂動を行う。
そして、学習した共同メッセージ表現を使用して、トレーニング中に認証された状態表現を近似する。
複数の共同マルチエージェントベンチマークにおける広範囲な実験により,提案手法の有効性が検証された。
関連論文リスト
- Very Large-Scale Multi-Agent Simulation in AgentScope [112.98986800070581]
我々は,ユーザフレンドリーなマルチエージェントプラットフォームであるAgentScopeの新機能とコンポーネントを開発した。
高いスケーラビリティと高効率を実現するために,アクタをベースとした分散機構を提案する。
また、多数のエージェントを便利に監視し、管理するためのWebベースのインターフェースも提供します。
論文 参考訳(メタデータ) (2024-07-25T05:50:46Z) - T2MAC: Targeted and Trusted Multi-Agent Communication through Selective
Engagement and Evidence-Driven Integration [15.91335141803629]
我々は、エージェントが選択的なエンゲージメントとエビデンス駆動の統合を学ぶのを助けるために、T2MAC(Targeted and Trusted Multi-Agent Communication)を提案する。
T2MACは、エージェントが個別化されたメッセージを作成し、理想的なコミュニケーションウィンドウをピンポイントし、信頼できるパートナーと対話することを可能にする。
本手法は,様々な課題を伴って,多様な協調型マルチエージェントタスクに対して評価を行う。
論文 参考訳(メタデータ) (2024-01-19T18:00:33Z) - Context-aware Communication for Multi-agent Reinforcement Learning [6.109127175562235]
マルチエージェント強化学習(MARL)のための文脈認識型コミュニケーション手法を開発した。
第1段階では、エージェントは放送方式で粗い表現を交換し、第2段階のコンテキストを提供する。
その後、エージェントは第2段階の注意機構を利用し、受信機用にパーソナライズされたメッセージを選択的に生成する。
CACOMの有効性を評価するため,アクタ批判型と値に基づくMARLアルゴリズムを併用する。
論文 参考訳(メタデータ) (2023-12-25T03:33:08Z) - Research on Multi-Agent Communication and Collaborative Decision-Making
Based on Deep Reinforcement Learning [0.0]
本論文は,マルチエージェント・プロキシ・ポリシー最適化アルゴリズムに基づくマルチエージェントの協調的意思決定について考察する。
異なるエージェントは、エージェント間の情報交換を通じて局所的な観測によって引き起こされる非定常性を緩和することができる。
実験結果から,マルチエージェント環境の非定常性を改善する効果が得られた。
論文 参考訳(メタデータ) (2023-05-23T14:20:14Z) - Scalable Communication for Multi-Agent Reinforcement Learning via
Transformer-Based Email Mechanism [9.607941773452925]
コミュニケーションはマルチエージェント強化学習(MARL)における協調性を著しく向上させる
本稿では,部分的に観測されたタスクに対するMARL通信のスケーラビリティ問題に対処するための新しいフレームワークである Transformer-based Email Mechanism (TEM) を提案する。
論文 参考訳(メタデータ) (2023-01-05T05:34:30Z) - Learning From Good Trajectories in Offline Multi-Agent Reinforcement
Learning [98.07495732562654]
オフラインマルチエージェント強化学習(MARL)は、事前コンパイルされたデータセットから効果的なマルチエージェントポリシーを学ぶことを目的としている。
オフラインのMARLが学んだエージェントは、しばしばこのランダムなポリシーを継承し、チーム全体のパフォーマンスを脅かす。
この問題に対処するために,共有個人軌道(SIT)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-28T18:11:26Z) - Multi-agent Deep Covering Skill Discovery [50.812414209206054]
本稿では,複数エージェントの結合状態空間の予測被覆時間を最小化し,マルチエージェントオプションを構築するマルチエージェントDeep Covering Option Discoveryを提案する。
また、MARLプロセスにマルチエージェントオプションを採用するための新しいフレームワークを提案する。
提案アルゴリズムは,アテンション機構とエージェントの相互作用を効果的に把握し,マルチエージェントオプションの同定に成功した。
論文 参考訳(メタデータ) (2022-10-07T00:40:59Z) - Coordinating Policies Among Multiple Agents via an Intelligent
Communication Channel [81.39444892747512]
MARL(Multi-Agent Reinforcement Learning)では、エージェントが直接通信できる特別なチャンネルがしばしば導入される。
本稿では,エージェントの集団的性能を向上させるために,エージェントが提供した信号の伝達と解釈を学習する,インテリジェントなファシリテータを通じてエージェントがコミュニケーションする手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T14:11:33Z) - Multimodal Categorization of Crisis Events in Social Media [81.07061295887172]
本稿では,画像とテキストの両方を入力として利用するマルチモーダル融合法を提案する。
特に、弱モダリティから非形式的および誤解を招くコンポーネントをフィルタリングできるクロスアテンションモジュールを導入する。
本手法は,3つの危機関連タスクにおいて,一様アプローチと強いマルチモーダルベースラインを大きなマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-04-10T06:31:30Z) - A Visual Communication Map for Multi-Agent Deep Reinforcement Learning [7.003240657279981]
マルチエージェント学習は、隠蔽された通信媒体を割り当てる上で大きな課題となる。
最近の研究は一般的に、エージェント間の通信を可能にするために、特殊なニューラルネットワークと強化学習を組み合わせる。
本稿では,多数のエージェントを扱うだけでなく,異種機能エージェント間の協調を可能にする,よりスケーラブルなアプローチを提案する。
論文 参考訳(メタデータ) (2020-02-27T02:38:21Z) - Multi-Agent Interactions Modeling with Correlated Policies [53.38338964628494]
本稿では,マルチエージェントインタラクションモデリング問題をマルチエージェント模倣学習フレームワークに実装する。
相関ポリシー(CoDAIL)を用いた分散型適応模倣学習アルゴリズムの開発
様々な実験により、CoDAILはデモレーターに近い複雑な相互作用をより良く再生できることが示されている。
論文 参考訳(メタデータ) (2020-01-04T17:31:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。