論文の概要: Tianshou: a Highly Modularized Deep Reinforcement Learning Library
- arxiv url: http://arxiv.org/abs/2107.14171v1
- Date: Thu, 29 Jul 2021 16:49:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-30 13:08:26.190233
- Title: Tianshou: a Highly Modularized Deep Reinforcement Learning Library
- Title(参考訳): Tianshou: 高度にモジュール化された深層強化学習ライブラリ
- Authors: Jiayi Weng, Huayu Chen, Dong Yan, Kaichao You, Alexis Duburcq, Minghao
Zhang, Hang Su, Jun Zhu
- Abstract要約: 我々は、PyTorchをバックエンドとして使用する、深層強化学習(DRL)のための高度にモジュール化されたピソンライブラリであるTianshouを紹介する。
9つの古典的アルゴリズムと9/13のMujocoタスクを最先端のパフォーマンスでカバーした、TianshouのMuJoCo環境のベンチマークをリリースする。
- 参考スコア(独自算出の注目度): 33.486928553404056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present Tianshou, a highly modularized python library for deep
reinforcement learning (DRL) that uses PyTorch as its backend. Tianshou aims to
provide building blocks to replicate common RL experiments and has officially
supported more than 15 classic algorithms succinctly. To facilitate related
research and prove Tianshou's reliability, we release Tianshou's benchmark of
MuJoCo environments, covering 9 classic algorithms and 9/13 Mujoco tasks with
state-of-the-art performance. We open-sourced Tianshou at
https://github.com/thu-ml/tianshou/, which has received over 3k stars and
become one of the most popular PyTorch-based DRL libraries.
- Abstract(参考訳): 我々は,pytorchをバックエンドとする深層強化学習(drl)のための高度にモジュール化されたpythonライブラリであるtianshouを提案する。
Tianshouは、一般的なRL実験を再現するビルディングブロックを提供することを目的としており、15以上の古典的アルゴリズムを簡潔にサポートしている。
関連研究の促進とTianhouの信頼性を証明するため、TianhouのMuJoCo環境ベンチマークをリリースし、9つの古典的アルゴリズムと9/13のMujocoタスクを最先端のパフォーマンスでカバーした。
私たちはTianshouをhttps://github.com/thu-ml/tianshou/でオープンソース化しました。
関連論文リスト
- XuanCe: A Comprehensive and Unified Deep Reinforcement Learning Library [18.603206638756056]
XuanCeは総合的に統合された深層強化学習(DRL)ライブラリである。
XuanCeは40以上の古典DRLとマルチエージェントDRLアルゴリズムを含む幅広い機能を提供している。
XuanCeはオープンソースで、https://agi-brain.com/agi-brain/xuance.gitでアクセスできる。
論文 参考訳(メタデータ) (2023-12-25T14:45:39Z) - TorchDEQ: A Library for Deep Equilibrium Models [72.65236284030894]
TorchDEQは、最小限のコードとベストプラクティスで複数のドメイン上でDEQを定義し、トレーニングし、推論することを可能にする、アウト・オブ・ザ・ボックスのライブラリです。
私たちは、異なるドメインにまたがる6つの暗黙のモデルをサポートするDEQ Zoo'を構築します。
DEQ Zooの6つのプロジェクトすべてにまたがる10のデータセット上でのDECのパフォーマンス、トレーニングの安定性、効率を大幅に改善しました。
論文 参考訳(メタデータ) (2023-10-28T06:16:10Z) - TorchRL: A data-driven decision-making library for PyTorch [20.776851077664915]
PyTorchは、プレミア機械学習フレームワークとして昇格したが、決定および制御タスクのためのネイティブで包括的なライブラリが欠如している。
我々はPyTorchの汎用制御ライブラリであるTorchRLを提案する。
ビルディングブロックの詳細な説明と、ドメインやタスクにわたるライブラリの概要について説明する。
論文 参考訳(メタデータ) (2023-06-01T11:45:45Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - Open-Source Skull Reconstruction with MONAI [3.245541722525715]
MUG500+の頭蓋骨データセットを事前訓練したmonAIの深層学習に基づく頭蓋骨再建法を提案する。
本論文の主目的は、monAIフレームワークの下で、オープンソースコードと事前学習されたディープラーニングモデルの調査である。
論文 参考訳(メタデータ) (2022-11-25T12:12:23Z) - imitation: Clean Imitation Learning Implementations [7.7064239657103375]
模倣は、PyTorchにおける模倣と報酬学習アルゴリズムのオープンソース実装を提供する。
3つの逆強化学習(IRL)アルゴリズム、3つの模倣学習アルゴリズム、選好比較を含む。
論文 参考訳(メタデータ) (2022-11-22T03:11:29Z) - d3rlpy: An Offline Deep Reinforcement Learning Library [0.0]
我々は、Python用のオープンソースのオフライン深層学習(RL)ライブラリであるd3rlpyを紹介した。
d3rlpyは、オフラインのディープRLアルゴリズムと、ユーザフレンドリーなAPIによるオンラインアルゴリズムをサポートする。
論文 参考訳(メタデータ) (2021-11-06T03:09:39Z) - RL-DARTS: Differentiable Architecture Search for Reinforcement Learning [62.95469460505922]
我々は、強化学習(RL)における微分可能なアーキテクチャ探索(DARTS)の最初の応用の1つであるRL-DARTSを紹介する。
画像エンコーダをDARTSスーパーネットに置き換えることにより、検索方法はサンプリング効率が高く、余分な計算資源が最小限必要であり、また、既存のコードに小さな変更を加える必要がなく、オフ・ポリティクスとオン・ポリティクスのRLアルゴリズムとも互換性がある。
スーパーネットはより優れたセルを徐々に学習し、手作業で設計したポリシーに対して高い競争力を持つ代替アーキテクチャへとつながり、RLポリシーの以前の設計選択も検証できることを示す。
論文 参考訳(メタデータ) (2021-06-04T03:08:43Z) - Robust Deep Reinforcement Learning through Adversarial Loss [74.20501663956604]
近年の研究では、深層強化学習剤は、エージェントの入力に対する小さな逆方向の摂動に弱いことが示されている。
敵攻撃に対する堅牢性を向上した強化学習エージェントを訓練するための原則的フレームワークであるRADIAL-RLを提案する。
論文 参考訳(メタデータ) (2020-08-05T07:49:42Z) - DeepRobust: A PyTorch Library for Adversarial Attacks and Defenses [52.18827652666269]
DeepRobustはPyTorchの逆学習ライブラリである。
この研究分野を育成するための、包括的で使いやすいプラットフォームの構築を目指している。
論文 参考訳(メタデータ) (2020-05-13T04:43:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。