論文の概要: PufferLib: Making Reinforcement Learning Libraries and Environments Play Nice
- arxiv url: http://arxiv.org/abs/2406.12905v1
- Date: Tue, 11 Jun 2024 21:13:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-23 13:15:04.304401
- Title: PufferLib: Making Reinforcement Learning Libraries and Environments Play Nice
- Title(参考訳): PufferLib: 強化学習ライブラリと環境の遊び方
- Authors: Joseph Suarez,
- Abstract要約: PufferLibは、一般的な互換性問題を排除したワンライン環境ラッパーを提供する。
PufferLibを使えば、CleanRLやSB3といった慣れ親しんだライブラリを使って、AtariやProcgenといった古典的なベンチマークからNetHackやNeural MMOのような複雑なシミュレータまでスケールすることができる。
私たちのコードはすべて、MITライセンスの下でフリーでオープンソースのソフトウェアです。
- 参考スコア(独自算出の注目度): 0.8702432681310401
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: You have an environment, a model, and a reinforcement learning library that are designed to work together but don't. PufferLib makes them play nice. The library provides one-line environment wrappers that eliminate common compatibility problems and fast vectorization to accelerate training. With PufferLib, you can use familiar libraries like CleanRL and SB3 to scale from classic benchmarks like Atari and Procgen to complex simulators like NetHack and Neural MMO. We release pip packages and prebuilt images with dependencies for dozens of environments. All of our code is free and open-source software under the MIT license, complete with baselines, documentation, and support at pufferai.github.io.
- Abstract(参考訳): 環境、モデル、強化学習ライブラリがあり、一緒に動作するように設計されていますが、そうではありません。
PufferLibは、それらをうまく演奏させる。
このライブラリは、一般的な互換性問題を排除し、トレーニングを加速するために高速なベクトル化を行うワンライン環境ラッパーを提供する。
PufferLibを使えば、CleanRLやSB3といった慣れ親しんだライブラリを使って、AtariやProcgenといった古典的なベンチマークからNetHackやNeural MMOのような複雑なシミュレータまでスケールすることができる。
pipパッケージとビルド済みのイメージは、数十の環境に依存しています。
私たちのコードはすべてMITライセンスの下でフリーでオープンソースで、ベースライン、ドキュメント、pufferai.github.ioでのサポートが完備しています。
関連論文リスト
- BayesDLL: Bayesian Deep Learning Library [29.624531252627484]
大規模ディープネットワークのためのPyTorch用の新しいベイズニューラルネットワークライブラリをリリースする。
我々のライブラリは,変分推論,MCドロップアウト,近似勾配MCMC,ラプラス近似といった主流推論アルゴリズムを実装している。
論文 参考訳(メタデータ) (2023-09-22T15:27:54Z) - torchgfn: A PyTorch GFlowNet library [56.071033896777784]
torchgfnはPyTorchライブラリで、このニーズに対処することを目指している。
環境のためのシンプルなAPIと、サンプルと損失のための有用な抽象化を提供する。
論文 参考訳(メタデータ) (2023-05-24T00:20:59Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - Code Librarian: A Software Package Recommendation System [65.05559087332347]
オープンソースライブラリ用のリコメンデーションエンジンであるLibrarianを提示する。
1)プログラムのインポートライブラリで頻繁に使用されること、2)プログラムのインポートライブラリと似た機能を持つこと、3)開発者の実装と似た機能を持つこと、4)提供されるコードのコンテキストで効率的に使用できること、である。
論文 参考訳(メタデータ) (2022-10-11T12:30:05Z) - Repro: An Open-Source Library for Improving the Reproducibility and
Usability of Publicly Available Research Code [74.28810048824519]
Reproは、研究コードのユーザビリティ向上を目的とした、オープンソースのライブラリである。
Dockerコンテナ内で研究者がリリースしたソフトウェアを実行するための軽量Python APIを提供する。
論文 参考訳(メタデータ) (2022-04-29T01:54:54Z) - ReservoirComputing.jl: An Efficient and Modular Library for Reservoir
Computing Models [0.17499351967216337]
ReservoirComputing.jlは、貯水池コンピューティングモデルのためのオープンソースのJuliaライブラリである。
コードとドキュメントは、MITライセンス下でGithubにホストされている。
論文 参考訳(メタデータ) (2022-04-08T13:33:09Z) - skrl: Modular and Flexible Library for Reinforcement Learning [0.0]
skrlはPythonで書かれた強化学習のためのオープンソースのモジュールライブラリである。
NVIDIA Isaac Gym環境のロード、設定、操作を可能にする。
論文 参考訳(メタデータ) (2022-02-08T12:43:31Z) - Bridging the Language Gap: An Empirical Study of Bindings for Open Source Machine Learning Libraries Across Software Package Ecosystems [9.339419442638983]
機械学習ライブラリにより、開発者は自身のアプリケーションに高度なML機能を統合できる。
しかし、一般的なMLライブラリは、すべてのプログラミング言語やソフトウェアパッケージエコシステムで利用できない。
13のソフトウェアパッケージエコシステムにまたがる546のMLライブラリに対して,2,436のクロスエコシステムバインディングを収集します。
論文 参考訳(メタデータ) (2022-01-18T18:53:21Z) - Solo-learn: A Library of Self-supervised Methods for Visual
Representation Learning [83.02597612195966]
solo-learnは視覚表現学習のための自己指導型のメソッドのライブラリである。
Pythonで実装され、PytorchとPytorch Lightningを使用して、このライブラリは研究と業界のニーズの両方に適合する。
論文 参考訳(メタデータ) (2021-08-03T22:19:55Z) - SuperSuit: Simple Microwrappers for Reinforcement Learning Environments [0.0]
SuperSuitはPythonライブラリで、すべての人気のあるラッパーとラッパーが含まれており、観察/アクション/リワードに関数を簡単に適用できる。
これは、標準のGym環境仕様と、マルチエージェント環境のためのPettingZoo仕様と互換性がある。
論文 参考訳(メタデータ) (2020-08-17T00:30:06Z) - Picasso: A Sparse Learning Library for High Dimensional Data Analysis in
R and Python [77.33905890197269]
本稿では,様々なスパース学習問題に対して,経路座標を統一的に最適化する新しいライブラリについて述べる。
ライブラリはR++でコード化されており、ユーザフレンドリーなスパース実験を行っている。
論文 参考訳(メタデータ) (2020-06-27T02:39:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。