論文の概要: Distributed Deep Reinforcement Learning: A Survey and A Multi-Player
Multi-Agent Learning Toolbox
- arxiv url: http://arxiv.org/abs/2212.00253v1
- Date: Thu, 1 Dec 2022 03:39:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 15:30:48.107510
- Title: Distributed Deep Reinforcement Learning: A Survey and A Multi-Player
Multi-Agent Learning Toolbox
- Title(参考訳): 分散深層強化学習:マルチプレイヤーマルチエージェント学習ツールボックス
- Authors: Qiyue Yin, Tongtong Yu, Shengqi Shen, Jun Yang, Meijing Zhao, Kaiqi
Huang, Bin Liang, Liang Wang
- Abstract要約: 本稿では,古典的分散強化学習法を比較し,効率的な分散学習を実現するために重要な要素について検討する。
強みと弱みを解析することにより、マルチプレイヤー分散深層強化学習ツールボックスを開発し、リリースする。
この簡単なレビューは、分散した深層強化学習に関心のある研究者に、ガイドやスパークを提供することを期待しています。
- 参考スコア(独自算出の注目度): 40.98957248850696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the breakthrough of AlphaGo, deep reinforcement learning becomes a
recognized technique for solving sequential decision-making problems. Despite
its reputation, data inefficiency caused by its trial and error learning
mechanism makes deep reinforcement learning hard to be practical in a wide
range of areas. Plenty of methods have been developed for sample efficient deep
reinforcement learning, such as environment modeling, experience transfer, and
distributed modifications, amongst which, distributed deep reinforcement
learning has shown its potential in various applications, such as
human-computer gaming, and intelligent transportation. In this paper, we
conclude the state of this exciting field, by comparing the classical
distributed deep reinforcement learning methods, and studying important
components to achieve efficient distributed learning, covering single player
single agent distributed deep reinforcement learning to the most complex
multiple players multiple agents distributed deep reinforcement learning.
Furthermore, we review recently released toolboxes that help to realize
distributed deep reinforcement learning without many modifications of their
non-distributed versions. By analyzing their strengths and weaknesses, a
multi-player multi-agent distributed deep reinforcement learning toolbox is
developed and released, which is further validated on Wargame, a complex
environment, showing usability of the proposed toolbox for multiple players and
multiple agents distributed deep reinforcement learning under complex games.
Finally, we try to point out challenges and future trends, hoping this brief
review can provide a guide or a spark for researchers who are interested in
distributed deep reinforcement learning.
- Abstract(参考訳): AlphaGoのブレークスルーにより、深層強化学習はシーケンシャルな意思決定問題を解決するための技術として認知される。
その評判にもかかわらず、その試行錯誤学習機構によって引き起こされるデータ非効率は、広範囲で深い強化学習を実践し難いものにしている。
環境モデリングや経験移譲,分散的な修正など,効率的な深層学習のための多種多様な手法が開発されており,その中でも,人為的コンピュータゲームやインテリジェントトランスポートといった様々な応用において,分散深層学習がその可能性を示している。
本稿では,従来の分散深部強化学習法を比較し,分散学習を実現するために重要な要素について検討し,分散深部強化学習を複数のエージェントを分散深部強化学習として扱うことで,このエキサイティングな分野の現状を結論付ける。
さらに,分散深層強化学習を実現するためのツールボックスを,非分散バージョンに多くの修正を加えることなくレビューした。
それらの強みと弱点を分析してマルチプレイヤー分散深度強化学習ツールボックスを開発し、複雑な環境であるウォーゲームでさらに検証し、複数のプレイヤーと複数のエージェントが複雑なゲームの下で分散深度強化学習を行うためのツールボックスの有用性を示す。
最後に、私たちは課題と今後のトレンドを指摘し、この短いレビューが分散深層強化学習に興味を持つ研究者のガイドやきっかけになることを期待しています。
関連論文リスト
- Private Knowledge Sharing in Distributed Learning: A Survey [50.51431815732716]
人工知能の台頭は多くの産業に革命をもたらし、社会の働き方を変えた。
異なるエンティティが分散または所有する学習プロセスにおいて、情報を活用することが不可欠である。
現代のデータ駆動サービスは、分散知識エンティティを結果に統合するために開発されています。
論文 参考訳(メタデータ) (2024-02-08T07:18:23Z) - Generating Personas for Games with Multimodal Adversarial Imitation
Learning [47.70823327747952]
強化学習は、人間のレベルでゲームをすることができるエージェントを生産する上で、広く成功している。
強化学習を超えて進むことは、幅広い人間のプレイスタイルをモデル化するために必要である。
本稿では,プレイテストのための複数のペルソナポリシーを生成するための,新しい模倣学習手法を提案する。
論文 参考訳(メタデータ) (2023-08-15T06:58:19Z) - A Unifying Perspective on Multi-Calibration: Game Dynamics for
Multi-Objective Learning [63.20009081099896]
マルチキャリブレーション予測器の設計と解析のための統一フレームワークを提供する。
ゲームダイナミクスとの接続を利用して,多様なマルチ校正学習問題に対する最先端の保証を実現する。
論文 参考訳(メタデータ) (2023-02-21T18:24:17Z) - DIAMBRA Arena: a New Reinforcement Learning Platform for Research and
Experimentation [91.3755431537592]
本研究は、強化学習研究と実験のための新しいプラットフォームであるDIAMBRA Arenaを提示する。
高品質な環境のコレクションが,OpenAI Gym標準に完全に準拠したPython APIを公開している。
これらは、離散的なアクションと観測を生のピクセルと追加の数値で構成したエピソディックなタスクである。
論文 参考訳(メタデータ) (2022-10-19T14:39:10Z) - Multi-Modal Mutual Information (MuMMI) Training for Robust
Self-Supervised Deep Reinforcement Learning [13.937546816302715]
この研究は、複数の、信頼性の低いセンサーを使って、有用で堅牢な深層世界のモデルを学ぶことに焦点を当てている。
我々は、相互情報を低バウンドでトレーニングした、新しいマルチモーダルディープ潜在状態空間モデルに貢献する。
実験の結果,本手法は最先端の深層強化学習法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-06T01:39:21Z) - Multiagent Deep Reinforcement Learning: Challenges and Directions
Towards Human-Like Approaches [0.0]
本稿では,最も一般的なマルチエージェント問題表現とその主な課題について述べる。
これらの課題に対処する5つの研究領域を特定します。
我々は,マルチエージェント強化学習が成功するためには,これらの課題を学際的アプローチで解決することを提案する。
論文 参考訳(メタデータ) (2021-06-29T19:53:15Z) - The AI Arena: A Framework for Distributed Multi-Agent Reinforcement
Learning [0.3437656066916039]
分散マルチエージェント強化学習のための柔軟な抽象化を備えたスケーラブルなフレームワークであるAI Arenaを紹介します。
複数の異なる学習環境において、一般的なRL技術よりも分散マルチエージェント学習アプローチによる性能向上を示す。
論文 参考訳(メタデータ) (2021-03-09T22:16:19Z) - Learning From Multiple Experts: Self-paced Knowledge Distillation for
Long-tailed Classification [106.08067870620218]
我々は,LFME(Learning From Multiple Experts)と呼ばれる自己評価型知識蒸留フレームワークを提案する。
提案するLFMEフレームワークは,複数の'Experts'からの知識を集約して,統一された学生モデルを学ぶ。
提案手法は,最先端の手法に比べて優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-01-06T12:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。