Fugu-MT 論文翻訳(概要): Distributed Deep Reinforcement Learning: A Survey and A Multi-Player Multi-Agent Learning Toolbox

論文の概要: Distributed Deep Reinforcement Learning: A Survey and A Multi-Player Multi-Agent Learning Toolbox

arxiv url: http://arxiv.org/abs/2212.00253v1
Date: Thu, 1 Dec 2022 03:39:24 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-02 15:30:48.107510
Title: Distributed Deep Reinforcement Learning: A Survey and A Multi-Player Multi-Agent Learning Toolbox
Title（参考訳）: 分散深層強化学習:マルチプレイヤーマルチエージェント学習ツールボックス
Authors: Qiyue Yin, Tongtong Yu, Shengqi Shen, Jun Yang, Meijing Zhao, Kaiqi Huang, Bin Liang, Liang Wang
Abstract要約: 本稿では,古典的分散強化学習法を比較し,効率的な分散学習を実現するために重要な要素について検討する。強みと弱みを解析することにより、マルチプレイヤー分散深層強化学習ツールボックスを開発し、リリースする。この簡単なレビューは、分散した深層強化学習に関心のある研究者に、ガイドやスパークを提供することを期待しています。
参考スコア（独自算出の注目度）: 40.98957248850696
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the breakthrough of AlphaGo, deep reinforcement learning becomes a recognized technique for solving sequential decision-making problems. Despite its reputation, data inefficiency caused by its trial and error learning mechanism makes deep reinforcement learning hard to be practical in a wide range of areas. Plenty of methods have been developed for sample efficient deep reinforcement learning, such as environment modeling, experience transfer, and distributed modifications, amongst which, distributed deep reinforcement learning has shown its potential in various applications, such as human-computer gaming, and intelligent transportation. In this paper, we conclude the state of this exciting field, by comparing the classical distributed deep reinforcement learning methods, and studying important components to achieve efficient distributed learning, covering single player single agent distributed deep reinforcement learning to the most complex multiple players multiple agents distributed deep reinforcement learning. Furthermore, we review recently released toolboxes that help to realize distributed deep reinforcement learning without many modifications of their non-distributed versions. By analyzing their strengths and weaknesses, a multi-player multi-agent distributed deep reinforcement learning toolbox is developed and released, which is further validated on Wargame, a complex environment, showing usability of the proposed toolbox for multiple players and multiple agents distributed deep reinforcement learning under complex games. Finally, we try to point out challenges and future trends, hoping this brief review can provide a guide or a spark for researchers who are interested in distributed deep reinforcement learning.
Abstract（参考訳）: AlphaGoのブレークスルーにより、深層強化学習はシーケンシャルな意思決定問題を解決するための技術として認知される。その評判にもかかわらず、その試行錯誤学習機構によって引き起こされるデータ非効率は、広範囲で深い強化学習を実践し難いものにしている。環境モデリングや経験移譲,分散的な修正など,効率的な深層学習のための多種多様な手法が開発されており,その中でも,人為的コンピュータゲームやインテリジェントトランスポートといった様々な応用において,分散深層学習がその可能性を示している。本稿では,従来の分散深部強化学習法を比較し,分散学習を実現するために重要な要素について検討し,分散深部強化学習を複数のエージェントを分散深部強化学習として扱うことで,このエキサイティングな分野の現状を結論付ける。さらに,分散深層強化学習を実現するためのツールボックスを,非分散バージョンに多くの修正を加えることなくレビューした。それらの強みと弱点を分析してマルチプレイヤー分散深度強化学習ツールボックスを開発し、複雑な環境であるウォーゲームでさらに検証し、複数のプレイヤーと複数のエージェントが複雑なゲームの下で分散深度強化学習を行うためのツールボックスの有用性を示す。最後に、私たちは課題と今後のトレンドを指摘し、この短いレビューが分散深層強化学習に興味を持つ研究者のガイドやきっかけになることを期待しています。

関連論文リスト

WebSeer: Training Deeper Search Agents through Reinforcement Learning with Self-Reflection [51.10348385624784]
本稿では,自己回帰機構によって強化された強化学習によって訓練された,よりインテリジェントな検索エージェントであるWebSeerを紹介する。提案手法はツール使用チェーンを大幅に拡張し,回答精度を向上する。
論文参考訳（メタデータ） (2025-10-21T16:52:00Z)
Reinforcement Learning Agent for a 2D Shooter Game [0.0]
複雑なゲーム環境における強化学習エージェントは、しばしばスパース報酬、トレーニング不安定性、サンプル効率の低下に悩まされる。本稿では,オフライン模倣学習とオンライン強化学習を組み合わせた2次元シューティングゲームエージェントのハイブリッドトレーニング手法を提案する。
論文参考訳（メタデータ） (2025-09-18T15:07:41Z)
Private Knowledge Sharing in Distributed Learning: A Survey [50.51431815732716]
人工知能の台頭は多くの産業に革命をもたらし、社会の働き方を変えた。異なるエンティティが分散または所有する学習プロセスにおいて、情報を活用することが不可欠である。現代のデータ駆動サービスは、分散知識エンティティを結果に統合するために開発されています。
論文参考訳（メタデータ） (2024-02-08T07:18:23Z)
Generating Personas for Games with Multimodal Adversarial Imitation Learning [47.70823327747952]
強化学習は、人間のレベルでゲームをすることができるエージェントを生産する上で、広く成功している。強化学習を超えて進むことは、幅広い人間のプレイスタイルをモデル化するために必要である。本稿では,プレイテストのための複数のペルソナポリシーを生成するための,新しい模倣学習手法を提案する。
論文参考訳（メタデータ） (2023-08-15T06:58:19Z)
A Unifying Perspective on Multi-Calibration: Game Dynamics for Multi-Objective Learning [63.20009081099896]
マルチキャリブレーション予測器の設計と解析のための統一フレームワークを提供する。ゲームダイナミクスとの接続を利用して,多様なマルチ校正学習問題に対する最先端の保証を実現する。
論文参考訳（メタデータ） (2023-02-21T18:24:17Z)
DIAMBRA Arena: a New Reinforcement Learning Platform for Research and Experimentation [91.3755431537592]
本研究は、強化学習研究と実験のための新しいプラットフォームであるDIAMBRA Arenaを提示する。高品質な環境のコレクションが,OpenAI Gym標準に完全に準拠したPython APIを公開している。これらは、離散的なアクションと観測を生のピクセルと追加の数値で構成したエピソディックなタスクである。
論文参考訳（メタデータ） (2022-10-19T14:39:10Z)
Multi-Modal Mutual Information (MuMMI) Training for Robust Self-Supervised Deep Reinforcement Learning [13.937546816302715]
この研究は、複数の、信頼性の低いセンサーを使って、有用で堅牢な深層世界のモデルを学ぶことに焦点を当てている。我々は、相互情報を低バウンドでトレーニングした、新しいマルチモーダルディープ潜在状態空間モデルに貢献する。実験の結果,本手法は最先端の深層強化学習法よりも優れていた。
論文参考訳（メタデータ） (2021-07-06T01:39:21Z)
Multiagent Deep Reinforcement Learning: Challenges and Directions Towards Human-Like Approaches [0.0]
本稿では,最も一般的なマルチエージェント問題表現とその主な課題について述べる。これらの課題に対処する5つの研究領域を特定します。我々は,マルチエージェント強化学習が成功するためには,これらの課題を学際的アプローチで解決することを提案する。
論文参考訳（メタデータ） (2021-06-29T19:53:15Z)
The AI Arena: A Framework for Distributed Multi-Agent Reinforcement Learning [0.3437656066916039]
分散マルチエージェント強化学習のための柔軟な抽象化を備えたスケーラブルなフレームワークであるAI Arenaを紹介します。複数の異なる学習環境において、一般的なRL技術よりも分散マルチエージェント学習アプローチによる性能向上を示す。
論文参考訳（メタデータ） (2021-03-09T22:16:19Z)
Learning From Multiple Experts: Self-paced Knowledge Distillation for Long-tailed Classification [106.08067870620218]
我々は,LFME(Learning From Multiple Experts)と呼ばれる自己評価型知識蒸留フレームワークを提案する。提案するLFMEフレームワークは,複数の'Experts'からの知識を集約して,統一された学生モデルを学ぶ。提案手法は,最先端の手法に比べて優れた性能が得られることを示す。
論文参考訳（メタデータ） (2020-01-06T12:57:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。