Fugu-MT 論文翻訳(概要): Efficient Reinforcement Learning Development with RLzoo

論文の概要: Efficient Reinforcement Learning Development with RLzoo

arxiv url: http://arxiv.org/abs/2009.08644v2
Date: Thu, 19 Aug 2021 01:59:29 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-17 02:58:31.713611
Title: Efficient Reinforcement Learning Development with RLzoo
Title（参考訳）: RLzooを用いた効率的な強化学習
Authors: Zihan Ding, Tianyang Yu, Yanhua Huang, Hongming Zhang, Guo Li, Quancheng Guo, Luo Mai and Hao Dong
Abstract要約: 既存のDeep Reinforcement Learning (DRL)ライブラリは、DRLエージェントのプロトタイピングを貧弱にサポートしている。 DRLエージェントの開発を効率化することを目的とした新しいDRLライブラリRLzooを紹介する。
参考スコア（独自算出の注目度）: 21.31425280231093
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Many researchers and developers are exploring for adopting Deep Reinforcement Learning (DRL) techniques in their applications. They however often find such an adoption challenging. Existing DRL libraries provide poor support for prototyping DRL agents (i.e., models), customising the agents, and comparing the performance of DRL agents. As a result, the developers often report low efficiency in developing DRL agents. In this paper, we introduce RLzoo, a new DRL library that aims to make the development of DRL agents efficient. RLzoo provides developers with (i) high-level yet flexible APIs for prototyping DRL agents, and further customising the agents for best performance, (ii) a model zoo where users can import a wide range of DRL agents and easily compare their performance, and (iii) an algorithm that can automatically construct DRL agents with custom components (which are critical to improve agent's performance in custom applications). Evaluation results show that RLzoo can effectively reduce the development cost of DRL agents, while achieving comparable performance with existing DRL libraries.
Abstract（参考訳）: 多くの研究者と開発者は、彼らのアプリケーションにDeep Reinforcement Learning (DRL)技術を採用することを模索している。しかし、彼らはしばしばそのような採用に挑戦する。既存のDRLライブラリは、DRLエージェント(モデル)のプロトタイピング、エージェントのカスタマイズ、DRLエージェントのパフォーマンスの比較を貧弱にサポートしている。その結果、開発者はDRLエージェントの開発において低効率を報告することが多い。本稿では,drl エージェントの開発を効率化することを目的とした drl ライブラリである rlzoo を紹介する。 rlzooは開発者に (i)DRLエージェントをプロトタイピングするための高レベルかつ柔軟なAPI、さらに最高のパフォーマンスのためにエージェントをカスタマイズする。 (ii)幅広いdrlエージェントをインポートし、その性能を簡単に比較できるモデル動物園 (iii)drlエージェントをカスタムコンポーネントで自動的に構築するアルゴリズム(カスタムアプリケーションにおけるエージェントのパフォーマンスを改善するために重要である)。 RLzoo は既存の DRL ライブラリと同等の性能を保ちながら,DRL エージェントの開発コストを効果的に削減できることを示す。

関連論文リスト

Blockchain-based Crowdsourced Deep Reinforcement Learning as a Service [15.605693371392212]
深層強化学習(Dep Reinforcement Learning, DRL)は、複雑な問題を解決するための強力なパラダイムである。本稿では,新しいクラウドソース型DRL as a Service (DRL as a Service) フレームワークを提案する。このフレームワークはDRL関連のサービスをユーザに提供し、DRLトレーニングとモデル共有という2種類のタスクをカバーしている。
論文参考訳（メタデータ） (2025-01-22T18:54:39Z)
Generative AI for Deep Reinforcement Learning: Framework, Analysis, and Use Cases [60.30995339585003]
深部強化学習(DRL)は様々な分野に広く適用されており、優れた成果を上げている。 DRLは、サンプル効率の低下や一般化の低さなど、いくつかの制限に直面している。本稿では、これらの問題に対処し、DRLアルゴリズムの性能を向上させるために、生成AI(GAI)を活用する方法について述べる。
論文参考訳（メタデータ） (2024-05-31T01:25:40Z)
ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL [80.10358123795946]
大規模言語モデルを微調整するためのマルチターンRLアルゴリズムを構築するためのフレームワークを開発する。我々のフレームワークは階層的なRLアプローチを採用し、2つのRLアルゴリズムを並列に実行している。実験により,ArCHerはエージェントタスクの効率と性能を大幅に向上させることがわかった。
論文参考訳（メタデータ） (2024-02-29T18:45:56Z)
SRL: Scaling Distributed Reinforcement Learning to Over Ten Thousand Cores [13.948640763797776]
本稿では,RLトレーニングアプリケーションを汎用フレームワークに統合する,RLトレーニングのデータフローに関する新しい抽象化を提案する。スケーラブルで効率的で分散的なRLシステムであるReaLly scalableRLを開発した。 SRLは15k以上のCPUコアでRL実験を大規模に実施した初めての学術コミュニティである。
論文参考訳（メタデータ） (2023-06-29T05:16:25Z)
RL$^3$: Boosting Meta Reinforcement Learning via RL inside RL$^2$ [12.111848705677142]
メタRLへの入力において、従来のRLを通してタスク毎に学習されるアクション値を含むハイブリッドアプローチであるRL$3$を提案する。 RL$3$は、RL$2$と比較して、短期的にはデータ効率を保ちながら、長期的には累積的な報酬を多く得ており、アウト・オブ・ディストリビューション・タスクよりも一般化されていることを示す。
論文参考訳（メタデータ） (2023-06-28T04:16:16Z)
On Transforming Reinforcement Learning by Transformer: The Development Trajectory [97.79247023389445]
Transformerは元々自然言語処理用に開発されたもので、コンピュータビジョンでも大きな成功を収めている。既存の開発をアーキテクチャ拡張と軌道最適化の2つのカテゴリに分類する。ロボット操作,テキストベースのゲーム,ナビゲーション,自律運転におけるTRLの主な応用について検討する。
論文参考訳（メタデータ） (2022-12-29T03:15:59Z)
Reducing Action Space: Reference-Model-Assisted Deep Reinforcement Learning for Inverter-based Volt-Var Control [15.755809730271327]
Inverter-based Volt-Var Control (IB-VVC) のための参照モデル支援深部強化学習(DRL)を提案する。 DRLの動作空間を低減するために,参照モデルを用いたDRLアプローチを設計する。 DRLの学習困難を軽減し、参照モデル支援DRLアプローチの性能を最適化する。
論文参考訳（メタデータ） (2022-10-10T02:55:16Z)
Retrieval-Augmented Reinforcement Learning [63.32076191982944]
過去の経験のデータセットを最適な行動にマップするために、ネットワークをトレーニングします。検索プロセスは、現在のコンテキストで有用なデータセットから情報を取得するために訓練される。検索強化R2D2はベースラインR2D2エージェントよりもかなり高速に学習し,より高いスコアを得ることを示す。
論文参考訳（メタデータ） (2022-02-17T02:44:05Z)
Enhancing the Generalization Performance and Speed Up Training for DRL-based Mapless Navigation [18.13884934663477]
DRLエージェントはトレーニングシナリオでうまく動作し、目に見えない現実のシナリオではうまく動作しない。本稿では,DRLエージェントがこのような未知のシナリオでフェールする理由を論じ,LiDAR読み出しの表現がエージェントの性能劣化の鍵となる要因であることを示す。そこで本稿では,DRLエージェントの性能向上とトレーニングの高速化を目的とした,簡易かつ効率的な入力前処理(IP)手法を提案する。
論文参考訳（メタデータ） (2021-03-22T09:36:51Z)
Auto-Agent-Distiller: Towards Efficient Deep Reinforcement Learning Agents via Neural Architecture Search [14.292072505007974]
本稿では,様々なタスクに対して最適なDRLエージェントを自動検索するAuto-Agent-Distiller (A2D) フレームワークを提案する。我々は,バニラNASがDRLトレーニング安定性のばらつきが大きいため,最適なエージェントの探索に容易に失敗できることを実証した。そこで我々は,教師エージェントのアクターと評論家の両方から知識を抽出し,探索プロセスを安定化し,探索エージェントの最適性を向上する新しい蒸留機構を開発する。
論文参考訳（メタデータ） (2020-12-24T04:07:36Z)
Distributed Reinforcement Learning for Cooperative Multi-Robot Object Manipulation [53.262360083572005]
強化学習(RL)を用いた協調型マルチロボットオブジェクト操作タスクの検討分散近似RL(DA-RL)とゲーム理論RL(GT-RL)の2つの分散マルチエージェントRLアプローチを提案する。本稿では, DA-RL と GT-RL を多エージェントシステムに適用し, 大規模システムへの拡張が期待される。
論文参考訳（メタデータ） (2020-03-21T00:43:54Z)
MushroomRL: Simplifying Reinforcement Learning Research [60.70556446270147]
MushroomRLはオープンソースのPythonライブラリで、強化学習(RL)実験の実装と実行を簡単にするために開発された。他の利用可能なライブラリと比較して、MushroomRLは、新しいRL方法論の実装とテストの労力を最小限に抑えるために、包括的で柔軟なフレームワークを提供することを目的として作られた。
論文参考訳（メタデータ） (2020-01-04T17:23:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。