論文の概要: A coevolutionary approach to deep multi-agent reinforcement learning
- arxiv url: http://arxiv.org/abs/2104.05610v2
- Date: Tue, 13 Apr 2021 10:07:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-14 11:12:38.215033
- Title: A coevolutionary approach to deep multi-agent reinforcement learning
- Title(参考訳): 深層マルチエージェント強化学習への共進化的アプローチ
- Authors: Daan Klijn, A.E. Eiben
- Abstract要約: Coevolutionに基づく新しいアプローチを記述および検証します。
マルチエージェントアタリゲームにおける2つのDeep Coevolutionary Algorithmのベンチマークを行った。
以上の結果から,Deep Coevolutionaryアルゴリズムは様々なゲームでうまく学習できることが示唆された。
- 参考スコア(独自算出の注目度): 5.33024001730262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditionally, Deep Artificial Neural Networks (DNN's) are trained through
gradient descent. Recent research shows that Deep Neuroevolution (DNE) is also
capable of evolving multi-million-parameter DNN's, which proved to be
particularly useful in the field of Reinforcement Learning (RL). This is mainly
due to its excellent scalability and simplicity compared to the traditional
MDP-based RL methods. So far, DNE has only been applied to complex single-agent
problems. As evolutionary methods are a natural choice for multi-agent
problems, the question arises whether DNE can also be applied in a complex
multi-agent setting. In this paper, we describe and validate a new approach
based on Coevolution. To validate our approach, we benchmark two Deep
Coevolutionary Algorithms on a range of multi-agent Atari games and compare our
results against the results of Ape-X DQN. Our results show that these Deep
Coevolutionary algorithms (1) can be successfully trained to play various
games, (2) outperform Ape-X DQN in some of them, and therefore (3) show that
Coevolution can be a viable approach to solving complex multi-agent
decision-making problems.
- Abstract(参考訳): 伝統的に、ディープニューラルネットワーク(DNN)は勾配降下によって訓練される。
近年の研究では、DNE(Deep Neuroevolution)は、強化学習(Reinforcement Learning, RL)の分野で特に有用であることが示されている。
これは主に、従来のmdpベースのrlメソッドに比べてスケーラビリティとシンプルさが優れているためである。
これまでのところ、DNEは複雑な単一エージェント問題にのみ適用されている。
進化的手法はマルチエージェント問題にとって自然な選択であるので、DNEが複雑なマルチエージェント設定にも適用できるかどうかが問題となる。
本稿では、Coevolutionに基づく新しいアプローチを記述し、検証する。
提案手法を検証するため,複数エージェントのAtariゲーム上で2つのDeep Coevolutionary Algorithmをベンチマークし,Ape-X DQNの結果と比較した。
以上の結果から,これらの深層共進化アルゴリズム(1)は様々なゲームをうまく練習でき,(2)一部のゲームではap-x dqnよりも優れており,(3)複雑なマルチエージェント意思決定問題に対して共進化は有効なアプローチであることが示された。
関連論文リスト
- DARLEI: Deep Accelerated Reinforcement Learning with Evolutionary
Intelligence [77.78795329701367]
本稿では,進化アルゴリズムと並列化強化学習を組み合わせたフレームワークであるDARLEIを提案する。
我々はDARLEIの性能を様々な条件で特徴付け、進化形態の多様性に影響を与える要因を明らかにした。
今後DARLEIを拡張して、よりリッチな環境における多様な形態素間の相互作用を取り入れていきたいと考えています。
論文 参考訳(メタデータ) (2023-12-08T16:51:10Z) - Neural Amortized Inference for Nested Multi-agent Reasoning [54.39127942041582]
本研究では,人間のような推論能力と計算限界のギャップを埋める新しい手法を提案する。
提案手法を2つの挑戦的マルチエージェント相互作用領域で評価する。
論文 参考訳(メタデータ) (2023-08-21T22:40:36Z) - Supplementing Gradient-Based Reinforcement Learning with Simple
Evolutionary Ideas [4.873362301533824]
我々は、強化学習(RL)における大規模だが指向的な学習ステップを導入するための、単純でサンプル効率のよいアルゴリズムを提案する。
この手法では、共通経験バッファを持つRLエージェントの集団を用いて、ポリシー空間を効率的に探索するために、エージェントのクロスオーバーと突然変異を行う。
論文 参考訳(メタデータ) (2023-05-10T09:46:53Z) - Predictive Coding beyond Gaussian Distributions [38.51699576854394]
予測符号化(英: Predictive coding, PC)は、階層型ガウス生成モデルに基づく推論を行う神経科学に着想を得た手法である。
これらの手法は、複雑な層やアクティベーション関数のダイナミクスを複製できないため、現代のニューラルネットワークに従わない。
提案手法は,条件付き言語モデルにおいて,トランスフォーマネットワークをトレーニングし,BPに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2022-11-07T12:02:05Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - An Efficient Application of Neuroevolution for Competitive Multiagent
Learning [0.0]
NEATは、最高のパフォーマンスのニューラルネットワークアーキテクチャを得るために使われる一般的な進化戦略である。
本稿では, NEATアルゴリズムを用いて, 変形したポンポンゲーム環境において, 競争力のあるマルチエージェント学習を実現する。
論文 参考訳(メタデータ) (2021-05-23T10:34:48Z) - Evolving Nano Particle Cancer Treatments with Multiple Particle Types [0.0]
本稿では,癌腫瘍を標的としたナノ粒子ベースの薬物デリバリーシステムを設計する際の問題点について検討する。
複数のタイプのNPを利用することは、治療の複雑さが高いため、より効果的であることが期待されている。
この結果から,あらかじめ定義された計算予算の下で,進化的手法を用いて解空間を探索する場合,複数のタイプのNPを利用する方が効率的であることが示唆された。
論文 参考訳(メタデータ) (2020-11-10T08:46:30Z) - How Neural Networks Extrapolate: From Feedforward to Graph Neural
Networks [80.55378250013496]
勾配勾配降下法によりトレーニングされたニューラルネットワークが、トレーニング分布の支持の外で学んだことを外挿する方法について検討する。
グラフニューラルネットワーク(GNN)は、より複雑なタスクでいくつかの成功を収めている。
論文 参考訳(メタデータ) (2020-09-24T17:48:59Z) - SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep
Reinforcement Learning [102.78958681141577]
SUNRISEは単純な統一アンサンブル法であり、様々な非政治的な深層強化学習アルゴリズムと互換性がある。
SUNRISEは, (a) アンサンブルに基づく重み付きベルマンバックアップと, (b) 最上位の自信境界を用いて行動を選択する推論手法を統合し, 効率的な探索を行う。
論文 参考訳(メタデータ) (2020-07-09T17:08:44Z) - GeneCAI: Genetic Evolution for Acquiring Compact AI [36.04715576228068]
ディープニューラルネットワーク(DNN)は、より高い推論精度を達成するために、より複雑なアーキテクチャへと進化している。
モデル圧縮技術は、リソース制限されたモバイルデバイスにそのような計算集約的なアーキテクチャを効率的に展開するために利用することができる。
本稿では,階層ごとの圧縮ハイパーパラメータのチューニング方法を自動的に学習する新しい最適化手法であるGeneCAIを紹介する。
論文 参考訳(メタデータ) (2020-04-08T20:56:37Z) - Alpha Discovery Neural Network based on Prior Knowledge [55.65102700986668]
遺伝的プログラミング(GP)は、金融自動化機能構築タスクにおける最先端技術である。
本稿では,分散金融技術指標の自動構築が可能なニューラルネットワーク構造であるAlpha Discovery Neural Network (ADNN)を提案する。
論文 参考訳(メタデータ) (2019-12-26T03:10:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。