論文の概要: Collaborative Auto-Curricula Multi-Agent Reinforcement Learning with
Graph Neural Network Communication Layer for Open-ended Wildfire-Management
Resource Distribution
- arxiv url: http://arxiv.org/abs/2204.11350v1
- Date: Sun, 24 Apr 2022 20:13:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-26 13:49:41.063491
- Title: Collaborative Auto-Curricula Multi-Agent Reinforcement Learning with
Graph Neural Network Communication Layer for Open-ended Wildfire-Management
Resource Distribution
- Title(参考訳): オープンエンドワイルドファイア管理資源分布のためのグラフニューラルネットワーク層を用いた協調的オートキュリキュラマルチエージェント強化学習
- Authors: Philipp Dominic Siedler
- Abstract要約: 我々は,グラフニューラルネットワーク(GNN)通信層を用いたMARL(Multi-Agent Reinforcement Learning)機構を構築した。
本研究は,山火事管理のための資源分布の文脈で実施する。
我々のMA通信提案は、Greedy Heuristic BaselineとSingle-Agent (SA)セットアップより優れている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most real-world domains can be formulated as multi-agent (MA) systems.
Intentionality sharing agents can solve more complex tasks by collaborating,
possibly in less time. True cooperative actions are beneficial for egoistic and
collective reasons. However, teaching individual agents to sacrifice egoistic
benefits for a better collective performance seems challenging. We build on a
recently proposed Multi-Agent Reinforcement Learning (MARL) mechanism with a
Graph Neural Network (GNN) communication layer. Rarely chosen communication
actions were marginally beneficial. Here we propose a MARL system in which
agents can help collaborators perform better while risking low individual
performance. We conduct our study in the context of resource distribution for
wildfire management. Communicating environmental features and partially
observable fire occurrence help the agent collective to pre-emptively
distribute resources. Furthermore, we introduce a procedural training
environment accommodating auto-curricula and open-endedness towards better
generalizability. Our MA communication proposal outperforms a Greedy Heuristic
Baseline and a Single-Agent (SA) setup. We further demonstrate how
auto-curricula and openendedness improves generalizability of our MA proposal.
- Abstract(参考訳): ほとんどの実世界のドメインはマルチエージェント(ma)システムとして定式化できる。
意図共有エージェントは、おそらくより少ない時間で協力することで、より複雑なタスクを解決できる。
真の協調行動は、利己的および集団的理由に有益である。
しかし、個々のエージェントにエゴリスティックな利益を犠牲にして、よりよい集団的パフォーマンスを得るように教えるのは困難である。
我々は,グラフニューラルネットワーク(GNN)通信層を用いたMARL(Multi-Agent Reinforcement Learning)機構を構築した。
稀に選択されたコミュニケーション行動は極めて有益であった。
本稿では,エージェントが協調作業者のパフォーマンスを向上させながら,個人のパフォーマンスを低下させることが可能なmarlシステムを提案する。
我々は,野火管理のための資源配分の文脈で研究を行う。
環境特性の伝達と部分的に観察可能な火災の発生は、エージェント集団が事前にリソースを分配するのに役立つ。
さらに,汎用性向上に向けて,自己帰結と開放性を考慮した手続き訓練環境を提案する。
我々のMA通信提案は、Greedy Heuristic BaselineとSingle-Agent (SA)セットアップより優れている。
さらに,自動計算とオープン性によってMA提案の一般化性が向上することを示す。
関連論文リスト
- Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - AgentVerse: Facilitating Multi-Agent Collaboration and Exploring
Emergent Behaviors [93.38830440346783]
本稿では,その構成をより高機能なシステムとして協調的に調整できるマルチエージェントフレームワークを提案する。
実験により,フレームワークが単一エージェントより優れたマルチエージェントグループを効果的に展開できることが実証された。
これらの振舞いの観点から、我々は、ポジティブなものを活用し、ネガティブなものを緩和し、マルチエージェントグループの協調可能性を改善するためのいくつかの戦略について議論する。
論文 参考訳(メタデータ) (2023-08-21T16:47:11Z) - Learning Reward Machines in Cooperative Multi-Agent Tasks [75.79805204646428]
本稿では,MARL(Multi-Agent Reinforcement Learning)に対する新しいアプローチを提案する。
これは、協調的なタスク分解と、サブタスクの構造をコードする報酬機(RM)の学習を組み合わせる。
提案手法は、部分的に観測可能な環境下での報酬の非マルコフ的性質に対処するのに役立つ。
論文 参考訳(メタデータ) (2023-03-24T15:12:28Z) - Dynamic Collaborative Multi-Agent Reinforcement Learning Communication
for Autonomous Drone Reforestation [0.0]
我々は,協調型マルチエージェント強化学習(MARL)による自律型ドローンによる森林再生にアプローチする。
エージェントは動的に変化するネットワークの一部として通信することができる。
その結果、コミュニケーションが協調し、集団的パフォーマンスを高め、正確さを植え付け、個々のエージェントのリスクテイク性を高めるかが示される。
論文 参考訳(メタデータ) (2022-11-14T13:25:22Z) - Multi-agent Deep Covering Skill Discovery [50.812414209206054]
本稿では,複数エージェントの結合状態空間の予測被覆時間を最小化し,マルチエージェントオプションを構築するマルチエージェントDeep Covering Option Discoveryを提案する。
また、MARLプロセスにマルチエージェントオプションを採用するための新しいフレームワークを提案する。
提案アルゴリズムは,アテンション機構とエージェントの相互作用を効果的に把握し,マルチエージェントオプションの同定に成功した。
論文 参考訳(メタデータ) (2022-10-07T00:40:59Z) - Scalable Multi-Agent Model-Based Reinforcement Learning [1.95804735329484]
我々は,モデルベース強化学習(MBRL)を用いて協調環境における集中型トレーニングをさらに活用するMAMBAという新しい手法を提案する。
エージェント間のコミュニケーションは、実行期間中に各エージェントのワールドモデルを維持するのに十分であり、一方、仮想ロールアウトはトレーニングに使用でき、環境と対話する必要がなくなる。
論文 参考訳(メタデータ) (2022-05-25T08:35:00Z) - Locality Matters: A Scalable Value Decomposition Approach for
Cooperative Multi-Agent Reinforcement Learning [52.7873574425376]
協調型マルチエージェント強化学習(MARL)は,エージェント数で指数関数的に大きい状態空間と動作空間により,スケーラビリティの問題に直面する。
本稿では,学習分散実行パラダイムに局所報酬を組み込んだ,新しい価値に基づくマルチエージェントアルゴリズム LOMAQ を提案する。
論文 参考訳(メタデータ) (2021-09-22T10:08:15Z) - AoI-Aware Resource Allocation for Platoon-Based C-V2X Networks via
Multi-Agent Multi-Task Reinforcement Learning [22.890835786710316]
本稿は,小隊の無線リソース管理を意識した情報年齢(AoI)の問題について検討する。
複数の自律型プラトンは、C-V2X通信技術を利用して、協力的認識メッセージ(CAM)をフォロワーに広める。
我々は,マルチエージェント強化学習(marl)に基づく分散リソース割当フレームワークを活用し,各小隊リーダ(pl)がエージェントとして行動し,環境と相互作用して最適方針を学ぶ。
論文 参考訳(メタデータ) (2021-05-10T08:39:56Z) - UneVEn: Universal Value Exploration for Multi-Agent Reinforcement
Learning [53.73686229912562]
我々はUniversal Value Exploration(UneVEn)と呼ばれる新しいMARLアプローチを提案する。
UneVEnは、一連の関連するタスクと、普遍的な後継機能の線形分解を同時に学習する。
一連の探索ゲームにおける実証的な結果、エージェント間の重要な調整を必要とする協調捕食・捕食作業への挑戦、およびStarCraft IIのマイクロマネジメントベンチマークは、UneVEnが他の最先端のMARLメソッドが失敗するタスクを解決できることを示している。
論文 参考訳(メタデータ) (2020-10-06T19:08:47Z) - Reward Machines for Cooperative Multi-Agent Reinforcement Learning [30.84689303706561]
協調型マルチエージェント強化学習において、エージェントの集合は共通の目標を達成するために共有環境で対話することを学ぶ。
本稿では、報酬関数の構造化表現として使われる単純な機械である報酬機械(RM)を用いて、チームのタスクを符号化する手法を提案する。
マルチエージェント設定におけるRMの新たな解釈は、要求されるチームメイト相互依存性を明示的に符号化し、チームレベルのタスクを個々のエージェントのサブタスクに分解することを可能にする。
論文 参考訳(メタデータ) (2020-07-03T23:08:14Z) - A Visual Communication Map for Multi-Agent Deep Reinforcement Learning [7.003240657279981]
マルチエージェント学習は、隠蔽された通信媒体を割り当てる上で大きな課題となる。
最近の研究は一般的に、エージェント間の通信を可能にするために、特殊なニューラルネットワークと強化学習を組み合わせる。
本稿では,多数のエージェントを扱うだけでなく,異種機能エージェント間の協調を可能にする,よりスケーラブルなアプローチを提案する。
論文 参考訳(メタデータ) (2020-02-27T02:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。