Fugu-MT 論文翻訳(概要): Scalable Communication for Multi-Agent Reinforcement Learning via Transformer-Based Email Mechanism

論文の概要: Scalable Communication for Multi-Agent Reinforcement Learning via Transformer-Based Email Mechanism

arxiv url: http://arxiv.org/abs/2301.01919v2
Date: Mon, 12 Jun 2023 07:13:41 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-14 01:41:30.994014
Title: Scalable Communication for Multi-Agent Reinforcement Learning via Transformer-Based Email Mechanism
Title（参考訳）: トランスフォーマー型eメール機構によるマルチエージェント強化学習のためのスケーラブルな通信
Authors: Xudong Guo, Daming Shi, Wenhui Fan
Abstract要約: コミュニケーションはマルチエージェント強化学習(MARL)における協調性を著しく向上させる本稿では,部分的に観測されたタスクに対するMARL通信のスケーラビリティ問題に対処するための新しいフレームワークである Transformer-based Email Mechanism (TEM) を提案する。
参考スコア（独自算出の注目度）: 9.607941773452925
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Communication can impressively improve cooperation in multi-agent reinforcement learning (MARL), especially for partially-observed tasks. However, existing works either broadcast the messages leading to information redundancy, or learn targeted communication by modeling all the other agents as targets, which is not scalable when the number of agents varies. In this work, to tackle the scalability problem of MARL communication for partially-observed tasks, we propose a novel framework Transformer-based Email Mechanism (TEM). The agents adopt local communication to send messages only to the ones that can be observed without modeling all the agents. Inspired by human cooperation with email forwarding, we design message chains to forward information to cooperate with the agents outside the observation range. We introduce Transformer to encode and decode the message chain to choose the next receiver selectively. Empirically, TEM outperforms the baselines on multiple cooperative MARL benchmarks. When the number of agents varies, TEM maintains superior performance without further training.
Abstract（参考訳）: コミュニケーションは多エージェント強化学習(MARL)における協調性を著しく向上させることができる。しかし、既存の作品は情報の冗長性につながるメッセージをブロードキャストするか、他のすべてのエージェントをターゲットとしてモデル化することでターゲットとなるコミュニケーションを学ぶかのどちらかである。本稿では,部分的に監視されたタスクに対するmarl通信のスケーラビリティ問題に取り組むため,新しいフレームワークであるtransformer-based email mechanism (tem)を提案する。エージェントはローカル通信を採用して、すべてのエージェントをモデル化せずに観察できるメッセージのみを送信する。メール転送と人間の協力に触発されて,情報転送のためのメッセージチェーンを設計し,観察範囲外のエージェントと協調する。メッセージチェーンをエンコードしてデコードして次の受信機を選択するためにTransformerを導入する。実験的に、TEMは複数の協調MARLベンチマークのベースラインを上回っている。エージェントの数が異なる場合、TEMはさらなるトレーニングをすることなく優れたパフォーマンスを維持する。

関連論文リスト

AnyMAC: Cascading Flexible Multi-Agent Collaboration via Next-Agent Prediction [70.60422261117816]
本稿では,グラフ構造ではなくシーケンシャル構造を用いて,マルチエージェント協調を再考するフレームワークを提案する。提案手法は,(1)各ステップで最も適したエージェントロールを選択するNext-Agent Predictionと,(2)各エージェントが前ステップから関連する情報にアクセスできるようにするNext-Context Selectionの2つの重要な方向に焦点を当てる。
論文参考訳（メタデータ） (2025-06-21T18:34:43Z)
Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文参考訳（メタデータ） (2024-11-01T05:56:51Z)
Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文参考訳（メタデータ） (2024-05-14T12:40:25Z)
AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文参考訳（メタデータ） (2024-02-21T04:11:28Z)
SpeechAgents: Human-Communication Simulation with Multi-Modal Multi-Agent Systems [53.94772445896213]
大規模言語モデル(LLM)に基づくマルチエージェントシステムは,人間の社会をシミュレートする上で有望な性能を示した。本研究では,マルチモーダルLLMに基づくマルチエージェントシステムであるSpeechAgentsを提案する。
論文参考訳（メタデータ） (2024-01-08T15:01:08Z)
Context-aware Communication for Multi-agent Reinforcement Learning [6.109127175562235]
マルチエージェント強化学習(MARL)のための文脈認識型コミュニケーション手法を開発した。第1段階では、エージェントは放送方式で粗い表現を交換し、第2段階のコンテキストを提供する。その後、エージェントは第2段階の注意機構を利用し、受信機用にパーソナライズされたメッセージを選択的に生成する。 CACOMの有効性を評価するため,アクタ批判型と値に基づくMARLアルゴリズムを併用する。
論文参考訳（メタデータ） (2023-12-25T03:33:08Z)
Large Language Model Enhanced Multi-Agent Systems for 6G Communications [94.45712802626794]
本稿では,自然言語を用いたコミュニケーション関連タスクを解くための,カスタマイズされたコミュニケーション知識とツールを備えたマルチエージェントシステムを提案する。セマンティック通信システムの設計により,提案方式の有効性を検証した。
論文参考訳（メタデータ） (2023-12-13T02:35:57Z)
Multi-Agent Reinforcement Learning Based on Representational Communication for Large-Scale Traffic Signal Control [13.844458247041711]
交通信号制御(TSC)は、インテリジェント交通システムにおいて難しい問題である。大規模TSCのための通信ベースのMARLフレームワークを提案する。私たちのフレームワークでは、各エージェントがメッセージのどの部分を誰に"送信"するかを指示する通信ポリシーを学習することができます。
論文参考訳（メタデータ） (2023-10-03T21:06:51Z)
Efficient Communication via Self-supervised Information Aggregation for Online and Offline Multi-agent Reinforcement Learning [12.334522644561591]
MARL(Multi-Agent Reinforcement Learning)の協調学習において,効率的なメッセージアグリゲーションは協調に不可欠である,と我々は主張する。本稿では, エージェントが受信したメッセージをコンパクトな表現に集約し, ローカルポリシーの強化に高い関連性を持たせることができる, 自己教師型情報集約(MASIA)によるマルチエージェント通信を提案する。私たちはマルチエージェント通信のためのオフラインベンチマークを構築しています。
論文参考訳（メタデータ） (2023-02-19T16:02:16Z)
Coordinating Policies Among Multiple Agents via an Intelligent Communication Channel [81.39444892747512]
MARL(Multi-Agent Reinforcement Learning)では、エージェントが直接通信できる特別なチャンネルがしばしば導入される。本稿では,エージェントの集団的性能を向上させるために,エージェントが提供した信号の伝達と解釈を学習する,インテリジェントなファシリテータを通じてエージェントがコミュニケーションする手法を提案する。
論文参考訳（メタデータ） (2022-05-21T14:11:33Z)
Learning Individually Inferred Communication for Multi-Agent Cooperation [37.56115000150748]
我々はエージェントエージェントがエージェントエージェントコミュニケーションの事前学習を可能にするために、個別推論通信(I2C)を提案する。先行知識は因果推論によって学習され、フィードフォワードニューラルネットワークによって実現される。 I2Cは通信オーバーヘッドを減らすだけでなく、様々なマルチエージェント協調シナリオのパフォーマンスを向上させることができる。
論文参考訳（メタデータ） (2020-06-11T14:07:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。