論文の概要: Brax -- A Differentiable Physics Engine for Large Scale Rigid Body
Simulation
- arxiv url: http://arxiv.org/abs/2106.13281v1
- Date: Thu, 24 Jun 2021 19:09:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-28 13:00:51.567228
- Title: Brax -- A Differentiable Physics Engine for Large Scale Rigid Body
Simulation
- Title(参考訳): Brax - 大規模剛体シミュレーションのための微分可能な物理エンジン
- Authors: C. Daniel Freeman, Erik Frey, Anton Raichuk, Sertan Girgin, Igor
Mordatch, Olivier Bachem
- Abstract要約: JAXで書かれた剛体シミュレーションのためのオープンソースのライブラリであるBraxを紹介します。
既存の強化学習文献にインスパイアされた一連のタスクについて結果を提示するが、エンジンで再作成する。
- 参考スコア(独自算出の注目度): 33.36244621210259
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present Brax, an open source library for rigid body simulation with a
focus on performance and parallelism on accelerators, written in JAX. We
present results on a suite of tasks inspired by the existing reinforcement
learning literature, but remade in our engine. Additionally, we provide
reimplementations of PPO, SAC, ES, and direct policy optimization in JAX that
compile alongside our environments, allowing the learning algorithm and the
environment processing to occur on the same device, and to scale seamlessly on
accelerators. Finally, we include notebooks that facilitate training of
performant policies on common OpenAI Gym MuJoCo-like tasks in minutes.
- Abstract(参考訳): 我々は、JAXで書かれたアクセラレータのパフォーマンスと並列性に焦点を当てた、剛体シミュレーションのためのオープンソースのライブラリであるBraxを紹介します。
既存の強化学習文献にインスパイアされた一連のタスクについて結果を提示するが、エンジンで再作成する。
さらに、PPO、SAC、ES、およびJAXの直接的なポリシー最適化を再実装し、環境と共にコンパイルし、学習アルゴリズムと環境処理を同一デバイス上で実行し、アクセラレータ上でシームレスにスケールできるようにする。
最後に、一般的なOpenAI Gym MuJoCoライクなタスク上で、パフォーマンスポリシーのトレーニングを容易にするノートブックを含めます。
関連論文リスト
- minimax: Efficient Baselines for Autocurricula in JAX [42.270349368227436]
この研究は、加速ハードウェア上でのUEDトレーニングのためのminimaxライブラリを導入している。
JAXを使って完全に拡張された環境とオートキュラムアルゴリズムを実装し、minimaxはハードウェアアクセラレーションのためにトレーニングループ全体をコンパイルできる。
論文 参考訳(メタデータ) (2023-11-21T16:43:13Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - JAX-LOB: A GPU-Accelerated limit order book simulator to unlock large
scale reinforcement learning for trading [8.884142720013081]
金融取引所はリミット・オーダー・ブック(LOB)を使用して注文を処理し、取引にマッチする。
多くのアプリケーションでは、ABMの校正やRLエージェントの訓練のために複数の書籍を処理する必要がある。
我々は,数千冊の書籍を並列に処理できるGPU対応LOBシミュレータを初めて紹介し,メッセージ単位の処理時間を著しく短縮した。
論文 参考訳(メタデータ) (2023-08-25T10:26:43Z) - Gym-preCICE: Reinforcement Learning Environments for Active Flow Control [0.0]
Gym-preCICEはPythonのアダプタで、Gymnasium (以前はOpenAI Gymとして知られていた) APIに完全に準拠している。
Gym-preCICEは、分割多重物理シミュレーションのためのオープンソースの結合ライブラリであるPreCICEを利用する。
このフレームワークは、リアルな物理ベースのシミュレーションツールボックスとRLアルゴリズムをシームレスに統合する。
論文 参考訳(メタデータ) (2023-05-03T10:54:56Z) - Orbit: A Unified Simulation Framework for Interactive Robot Learning
Environments [38.23943905182543]
NVIDIA Isaac Simによるロボット学習のための統一的でモジュール化されたフレームワークOrbitを紹介する。
写真リアリスティックなシーンと高忠実度剛性で変形可能なボディシミュレーションを備えたロボット環境を構築するためのモジュラーデザインを提供する。
我々は,表現学習,強化学習,模倣学習,タスク・アンド・モーション・プランニングなど,さまざまな研究領域を支援することを目的としている。
論文 参考訳(メタデータ) (2023-01-10T20:19:17Z) - Braxlines: Fast and Interactive Toolkit for RL-driven Behavior
Engineering beyond Reward Maximization [15.215372246434413]
強化学習(RL)によるアプローチでは、継続的な制御の目標は、望ましい振る舞いを合成することである。
本稿では,単純な報酬RLを超える高速かつインタラクティブな行動生成ツールキットであるbraxlinesを紹介する。
我々の実装は、JaxのハードウェアアクセラレーションであるBraxシミュレータ上に構築されており、最小限の修正を施し、トレーニングの数分以内に動作を可能にする。
論文 参考訳(メタデータ) (2021-10-10T02:41:01Z) - SurRoL: An Open-source Reinforcement Learning Centered and dVRK
Compatible Platform for Surgical Robot Learning [78.76052604441519]
SurRoLは、ダ・ヴィンチ・リサーチキット(dVRK)と互換性のある外科ロボット学習のためのRL中心のシミュレーションプラットフォームである。
プラットフォームには10の学習ベースの外科的タスクが構築されており、実際の自律的な外科的実行に共通している。
シミュレーションにおいてRLアルゴリズムを用いてSurRoLの評価を行い、奥行き分析を行い、実際のdVRKにトレーニングされたポリシーをデプロイし、実世界でより優れた転送性を実現することを示す。
論文 参考訳(メタデータ) (2021-08-30T07:43:47Z) - PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable
Physics [89.81550748680245]
PasticineLabと呼ばれる新しい微分可能な物理ベンチマークを導入する。
各タスクにおいて、エージェントはマニピュレータを使用して、プラスチックを所望の構成に変形させる。
本稿では,既存の強化学習(RL)手法と勾配に基づく手法について評価する。
論文 参考訳(メタデータ) (2021-04-07T17:59:23Z) - Composable Learning with Sparse Kernel Representations [110.19179439773578]
再生カーネルヒルベルト空間におけるスパース非パラメトリック制御系を学習するための強化学習アルゴリズムを提案する。
正規化アドバンテージ関数を通じてステートアクション関数の構造を付与することにより、このアプローチのサンプル複雑さを改善します。
2次元環境下を走行しながらレーザースキャナーを搭載したロボットの複数シミュレーションにおける障害物回避政策の学習に関するアルゴリズムの性能を実証する。
論文 参考訳(メタデータ) (2021-03-26T13:58:23Z) - A User's Guide to Calibrating Robotics Simulators [54.85241102329546]
本稿では,シミュレーションで学習したモデルやポリシーを現実世界に伝達することを目的とした,様々なアルゴリズムの研究のためのベンチマークとフレームワークを提案する。
我々は、様々なアルゴリズムの性能に関する洞察を特徴付け、提供するために、広く知られたシミュレーション環境の実験を行う。
我々の分析は、この分野の実践者にとって有用であり、sim-to-realアルゴリズムの動作と主特性について、より深い選択をすることができる。
論文 参考訳(メタデータ) (2020-11-17T22:24:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。