論文の概要: SuperSuit: Simple Microwrappers for Reinforcement Learning Environments
- arxiv url: http://arxiv.org/abs/2008.08932v1
- Date: Mon, 17 Aug 2020 00:30:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 02:59:10.471533
- Title: SuperSuit: Simple Microwrappers for Reinforcement Learning Environments
- Title(参考訳): SuperSuit: 強化学習環境のためのシンプルなマイクロラッパ
- Authors: J. K. Terry, Benjamin Black, Ananth Hari
- Abstract要約: SuperSuitはPythonライブラリで、すべての人気のあるラッパーとラッパーが含まれており、観察/アクション/リワードに関数を簡単に適用できる。
これは、標準のGym環境仕様と、マルチエージェント環境のためのPettingZoo仕様と互換性がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In reinforcement learning, wrappers are universally used to transform the
information that passes between a model and an environment. Despite their
ubiquity, no library exists with reasonable implementations of all popular
preprocessing methods. This leads to unnecessary bugs, code inefficiencies, and
wasted developer time. Accordingly we introduce SuperSuit, a Python library
that includes all popular wrappers, and wrappers that can easily apply lambda
functions to the observations/actions/reward. It's compatible with the standard
Gym environment specification, as well as the PettingZoo specification for
multi-agent environments. The library is available at
https://github.com/PettingZoo-Team/SuperSuit,and can be installed via pip.
- Abstract(参考訳): 強化学習では、ラッパーはモデルと環境の間の情報を変換するために普遍的に使用される。
ユビキタスにもかかわらず、一般的なプリプロセッシングメソッドをすべて合理的に実装したライブラリは存在しない。
これは不要なバグ、コードの非効率、開発者の時間を無駄にする。
そこで、人気のあるラッパーをすべて含むPythonライブラリであるSuperSuitと、観測/アクション/リワードにラムダ関数を簡単に適用可能なラッパーを紹介します。
これは、標準のGym環境仕様と、マルチエージェント環境のためのPettingZoo仕様と互換性がある。
このライブラリはhttps://github.com/PettingZoo-Team/SuperSuitで入手できる。
関連論文リスト
- PufferLib: Making Reinforcement Learning Libraries and Environments Play Nice [0.8702432681310401]
PufferLibは、一般的な互換性問題を排除したワンライン環境ラッパーを提供する。
PufferLibを使えば、CleanRLやSB3といった慣れ親しんだライブラリを使って、AtariやProcgenといった古典的なベンチマークからNetHackやNeural MMOのような複雑なシミュレータまでスケールすることができる。
私たちのコードはすべて、MITライセンスの下でフリーでオープンソースのソフトウェアです。
論文 参考訳(メタデータ) (2024-06-11T21:13:34Z) - pyvene: A Library for Understanding and Improving PyTorch Models via
Interventions [79.72930339711478]
$textbfpyvene$は、さまざまなPyTorchモジュールに対するカスタマイズ可能な介入をサポートするオープンソースライブラリである。
私たちは、$textbfpyvene$が、ニューラルモデルへの介入を実行し、他のモデルとインターバルされたモデルを共有するための統一されたフレームワークを提供する方法を示します。
論文 参考訳(メタデータ) (2024-03-12T16:46:54Z) - Causal-learn: Causal Discovery in Python [53.17423883919072]
因果発見は、観測データから因果関係を明らかにすることを目的としている。
$textitcausal-learn$は因果発見のためのオープンソースのPythonライブラリである。
論文 参考訳(メタデータ) (2023-07-31T05:00:35Z) - torchgfn: A PyTorch GFlowNet library [56.071033896777784]
torchgfnはPyTorchライブラリで、このニーズに対処することを目指している。
環境のためのシンプルなAPIと、サンプルと損失のための有用な抽象化を提供する。
論文 参考訳(メタデータ) (2023-05-24T00:20:59Z) - PyTorch Adapt [37.03614011735927]
PyTorch Adaptはドメイン適応のためのライブラリである。
ドメイン適応(Domain adapt)は、既存のモデルを新しいドメインで動作させる機械学習アルゴリズムの一種である。
完全に機能したツールキットで、数行のコードで完全なトレイン/テストパイプラインを作成できる。
論文 参考訳(メタデータ) (2022-11-28T18:59:09Z) - IMBENS: Ensemble Class-imbalanced Learning in Python [26.007498723608155]
imbensはオープンソースのPythonツールボックスで、クラス不均衡なデータに対してアンサンブル学習アルゴリズムを実装し、デプロイする。
imbensはMITオープンソースライセンスでリリースされており、Python Package Index (PyPI)からインストールすることができる。
論文 参考訳(メタデータ) (2021-11-24T20:14:20Z) - PyTorchVideo: A Deep Learning Library for Video Understanding [71.89124881732015]
PyTorchVideoは、ビデオ理解タスクのためのオープンソースのディープラーニングライブラリである。
マルチモーダルデータローディング、変換、モデルを含む、ビデオ理解ツールのフルスタックをカバーする。
ライブラリはPyTorchをベースにしており、任意のトレーニングフレームワークで使用することができる。
論文 参考訳(メタデータ) (2021-11-18T18:59:58Z) - Solo-learn: A Library of Self-supervised Methods for Visual
Representation Learning [83.02597612195966]
solo-learnは視覚表現学習のための自己指導型のメソッドのライブラリである。
Pythonで実装され、PytorchとPytorch Lightningを使用して、このライブラリは研究と業界のニーズの両方に適合する。
論文 参考訳(メタデータ) (2021-08-03T22:19:55Z) - Small-Text: Active Learning for Text Classification in Python [23.87081733039124]
small-textはPython用の使いやすいアクティブラーニングライブラリである。
シングルラベルとマルチラベルのテキスト分類のためのプールベースのアクティブラーニングを提供する。
論文 参考訳(メタデータ) (2021-07-21T19:23:56Z) - mvlearn: Multiview Machine Learning in Python [103.55817158943866]
mvlearnは、主要なマルチビュー機械学習メソッドを実装するPythonライブラリである。
パッケージはPython Package Index(PyPI)とcondaパッケージマネージャからインストールできる。
論文 参考訳(メタデータ) (2020-05-25T02:35:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。