Fugu-MT 論文翻訳(概要): CoDreamer: Communication-Based Decentralised World Models

論文の概要: CoDreamer: Communication-Based Decentralised World Models

arxiv url: http://arxiv.org/abs/2406.13600v1
Date: Wed, 19 Jun 2024 14:42:40 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-21 19:24:08.010572
Title: CoDreamer: Communication-Based Decentralised World Models
Title（参考訳）: CoDreamer: コミュニケーションベースの分散世界モデル
Authors: Edan Toledo, Amanda Prorok,
Abstract要約: CoDreamerはマルチエージェント環境のためのDreamerアルゴリズムの拡張である。我々はCoDreamerがDreamerの単純な応用よりも表現力が高いことを示す。
参考スコア（独自算出の注目度）: 7.598921989525738
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Sample efficiency is a critical challenge in reinforcement learning. Model-based RL has emerged as a solution, but its application has largely been confined to single-agent scenarios. In this work, we introduce CoDreamer, an extension of the Dreamer algorithm for multi-agent environments. CoDreamer leverages Graph Neural Networks for a two-level communication system to tackle challenges such as partial observability and inter-agent cooperation. Communication is separately utilised within the learned world models and within the learned policies of each agent to enhance modelling and task-solving. We show that CoDreamer offers greater expressive power than a naive application of Dreamer, and we demonstrate its superiority over baseline methods across various multi-agent environments.
Abstract（参考訳）: サンプル効率は強化学習において重要な課題である。モデルベースのRLは、ソリューションとして登場したが、そのアプリケーションは、主に単一エージェントのシナリオに限られている。本研究では,マルチエージェント環境のためのDreamerアルゴリズムの拡張であるCoDreamerを紹介する。 CoDreamerはグラフニューラルネットワークを2レベル通信システムとして利用し、部分観測可能性やエージェント間の協調といった課題に対処する。コミュニケーションは、学習された世界のモデルと、各エージェントの学習されたポリシーの中で別々に利用され、モデリングとタスク解決を強化する。我々は,CoDreamerがDreamerの素質的応用よりも表現力が高く,多様なマルチエージェント環境におけるベースライン手法よりも優れていることを示す。

関連論文リスト

FusDreamer: Label-efficient Remote Sensing World Model for Multimodal Data Classification [7.523866920738647]
本稿では,マルチモーダルデータ融合(FusDreamer)のためのラベル効率のよいリモートセンシング世界モデルを提案する。 FusDreamerは、世界モデルを統一表現コンテナとして使用して、共通知識と高レベルの知識を抽象化する。 4つの典型的なデータセットで実施された実験は、提案されたFusDreamerの有効性と利点を示している。
論文参考訳（メタデータ） (2025-03-18T01:45:51Z)
Multimodal Dreaming: A Global Workspace Approach to World Model-Based Reinforcement Learning [2.5749046466046903]
強化学習(Reinforcement Learning, RL)では、世界モデルはエージェントの行動に応じて環境がどのように進化するかを捉えることを目的としている。潜在空間内での夢のプロセスの実行は、より少ない環境ステップでのトレーニングを可能にすることを示す。我々は、GWとWorld Modelsの組み合わせは、RLエージェントの意思決定を改善する大きな可能性を秘めていると結論づける。
論文参考訳（メタデータ） (2025-02-28T15:24:17Z)
Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文参考訳（メタデータ） (2024-11-01T05:56:51Z)
Learning Emergence of Interaction Patterns across Independent RL Agents in Multi-Agent Environments [3.0284592792243794]
ボトムアップネットワーク(BUN)は、マルチエージェントの集合を統一エンティティとして扱う。協調ナビゲーションやトラヒックコントロールなどのタスクを含む,さまざまな協調型マルチエージェントシナリオに対する実証的な評価は,BUNが計算コストを大幅に削減したベースライン手法よりも優れていることを一貫して証明している。
論文参考訳（メタデータ） (2024-10-03T14:25:02Z)
COLLAGE: Collaborative Human-Agent Interaction Generation using Hierarchical Latent Diffusion and Language Models [14.130327598928778]
大規模言語モデル (LLMs) と階層型運動固有ベクトル量子化変分オートエンコーダ (VQ-VAEs) を提案する。我々のフレームワークは、現実的で多様な協調的な人間-オブジェクト-ヒューマンインタラクションを生成し、最先端の手法より優れています。我々の研究は、ロボット工学、グラフィックス、コンピュータビジョンなど、様々な領域における複雑な相互作用をモデリングする新たな可能性を開く。
論文参考訳（メタデータ） (2024-09-30T17:02:13Z)
Decentralized Transformers with Centralized Aggregation are Sample-Efficient Multi-Agent World Models [106.94827590977337]
本稿では,分散化された局所力学を拡張性のために学習するマルチエージェントRL(MARL)の新たな世界モデルを提案する。また、集中表現アグリゲーションを可能にする効果的なソリューションとしてPerceiver Transformerを導入する。 Starcraft Multi-Agent Challenge (SMAC) の結果は、サンプル効率と全体的な性能の両方において、強力なモデルフリーアプローチと既存のモデルベース手法よりも優れていることを示している。
論文参考訳（メタデータ） (2024-06-22T12:40:03Z)
Scaling Large-Language-Model-based Multi-Agent Collaboration [75.5241464256688]
大規模言語モデルによるエージェントのパイオニア化は、マルチエージェントコラボレーションの設計パターンを暗示している。神経スケーリング法則に触発された本研究では,マルチエージェント協調におけるエージェントの増加に類似の原理が適用されるかを検討する。
論文参考訳（メタデータ） (2024-06-11T11:02:04Z)
Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文参考訳（メタデータ） (2024-05-14T12:40:25Z)
COMBO: Compositional World Models for Embodied Multi-Agent Cooperation [64.27636858152522]
分散エージェントは、世界の部分的な自我中心的な見解にのみ、協力しなくてはならない。我々は、部分的な自我中心の観測から世界全体の状態を推定するために生成モデルを訓練する。複数のエージェントの自然な構成可能な共同動作を分解することにより、マルチエージェント協調のための構成的世界モデルを学ぶ。
論文参考訳（メタデータ） (2024-04-16T17:59:11Z)
An Interactive Agent Foundation Model [49.77861810045509]
本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文参考訳（メタデータ） (2024-02-08T18:58:02Z)
MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
MADiffは拡散型マルチエージェント学習フレームワークである。分散ポリシと集中型コントローラの両方として機能する。実験の結果,MADiffは様々なマルチエージェント学習タスクにおいて,ベースラインアルゴリズムよりも優れていた。
論文参考訳（メタデータ） (2023-05-27T02:14:09Z)
The Emergence of Adversarial Communication in Multi-Agent Reinforcement Learning [6.18778092044887]
多くの現実世界の問題は、複数の自律エージェントの調整を必要とする。最近の研究は、複雑なマルチエージェント協調を可能にする明示的なコミュニケーション戦略を学ぶためのグラフニューラルネットワーク(GNN)の約束を示している。一つの利己的なエージェントが高度に操作的なコミュニケーション戦略を学習し、協調的なエージェントチームを大幅に上回っていることを示す。
論文参考訳（メタデータ） (2020-08-06T12:48:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。