論文の概要: PixelBrax: Learning Continuous Control from Pixels End-to-End on the GPU
- arxiv url: http://arxiv.org/abs/2502.00021v1
- Date: Thu, 16 Jan 2025 08:00:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-09 05:47:06.130746
- Title: PixelBrax: Learning Continuous Control from Pixels End-to-End on the GPU
- Title(参考訳): PixelBrax: GPUでエンドツーエンドのPixelから継続的制御を学ぶ
- Authors: Trevor McInroe, Samuel Garcin,
- Abstract要約: 画素観察を伴う連続制御タスクの集合であるPixelBraxについて述べる。
私たちはBrax物理エンジンと純粋なJAXを組み合わせて、強化学習実験をGPU上でエンドツーエンドで実行できるようにします。
- 参考スコア(独自算出の注目度): 0.9208007322096533
- License:
- Abstract: We present PixelBrax, a set of continuous control tasks with pixel observations. We combine the Brax physics engine with a pure JAX renderer, allowing reinforcement learning (RL) experiments to run end-to-end on the GPU. PixelBrax can render observations over thousands of parallel environments and can run two orders of magnitude faster than existing benchmarks that rely on CPU-based rendering. Additionally, PixelBrax supports fully reproducible experiments through its explicit handling of any stochasticity within the environments and supports color and video distractors for benchmarking generalization. We open-source PixelBrax alongside JAX implementations of several RL algorithms at github.com/trevormcinroe/pixelbrax.
- Abstract(参考訳): 画素観察を伴う連続制御タスクの集合であるPixelBraxについて述べる。
我々はBrax物理エンジンと純粋なJAXレンダラーを組み合わせて、強化学習(RL)実験をGPU上でエンドツーエンドで実行できるようにします。
PixelBraxは数千の並列環境上で観測結果をレンダリングすることができ、CPUベースのレンダリングに依存する既存のベンチマークよりも2桁高速に実行することができる。
さらに、PixelBraxは、環境内のいかなる確率性も明示的に扱うことで、完全な再現可能な実験をサポートし、ベンチマークの一般化のために色とビデオのイントラクタをサポートする。
我々は、github.com/trevormcinroe/pixelbraxで、いくつかのRLアルゴリズムのJAX実装とともにPixelBraxをオープンソース化しました。
関連論文リスト
- 3D Gaussian Ray Tracing: Fast Tracing of Particle Scenes [50.36933474990516]
本研究は, 粒子のトレーシング, 境界体積階層の構築, 高性能なレイトレーシングハードウェアを用いた各画素のレイキャストについて考察する。
半透明粒子の多量処理を効率的に行うために,有界メッシュで粒子をカプセル化するアルゴリズムについて述べる。
実験は、我々のアプローチの速度と精度、およびコンピュータグラフィックスとビジョンにおけるいくつかの応用を実証する。
論文 参考訳(メタデータ) (2024-07-09T17:59:30Z) - Is One GPU Enough? Pushing Image Generation at Higher-Resolutions with Foundation Models [4.257210316104905]
我々はPixelsmithを紹介した。これはゼロショットのテキスト・ツー・イメージ生成フレームワークで、1つのGPUで高解像度の画像をサンプリングする。
我々は,事前学習した拡散モデルの出力を1000倍に拡大できることを初めて示し,ギガピクセル画像生成への道を開いた。
論文 参考訳(メタデータ) (2024-06-11T13:33:33Z) - JaxMARL: Multi-Agent RL Environments and Algorithms in JAX [105.343918678781]
我々は、GPU対応の効率と多くの一般的なMARL環境のサポートを組み合わせた、最初のオープンソースPythonベースのライブラリであるJaxMARLを紹介します。
我々の実験は、壁時計時間の観点から、JAXベースのトレーニングパイプラインが既存のアプローチの約14倍高速であることを示している。
また、人気の高いStarCraft Multi-Agent ChallengeのJAXベースの近似的な再実装であるSMAXを紹介し、ベンチマークする。
論文 参考訳(メタデータ) (2023-11-16T18:58:43Z) - Deep and Fast Approximate Order Independent Transparency [0.0]
順序独立透明性(OIT)を効率的に計算するための機械学習手法を提案する。
提案手法は高速で,メモリの一定量が少なく,従来の近似手法に比べて精度が高い。
論文 参考訳(メタデータ) (2023-05-17T13:21:45Z) - Learn how to Prune Pixels for Multi-view Neural Image-based Synthesis [10.571582038258443]
本稿では,ピクセルプルーニングの手法であるLeHoPPを提案する。
レンダリングビューにおける各入力ピクセルの重要性について検討し、無関係なピクセルの使用を避ける。
画像ベースのレンダリングネットワークを再トレーニングしなくても,合成品質と画素レートのトレードオフは良好である。
論文 参考訳(メタデータ) (2023-05-05T14:29:24Z) - VoGE: A Differentiable Volume Renderer using Gaussian Ellipsoids for
Analysis-by-Synthesis [62.47221232706105]
本稿では,ガウス再構成カーネルをボリュームプリミティブとして利用するVoGEを提案する。
本稿では,VoGEを用いて効率よくレンダリングを行うために,体積密度集約と粗大な描画戦略に関する近似クローズフォーム解を提案する。
VoGEは、オブジェクトポーズ推定、形状/テクスチャフィッティング、推論など、様々な視覚タスクに適用された場合、SoTAより優れている。
論文 参考訳(メタデータ) (2022-05-30T19:52:11Z) - AlphaRotate: A Rotation Detection Benchmark using TensorFlow [63.39088942989411]
AlphaRotateは、さまざまなデータセットでスケーラブルなローテーション検出を実行するためのオープンソースのベンチマークである。
現在、単一のドキュメント化されたAPIの下で18以上の一般的な回転検出モデルを提供している。
AlphaRotateはPyPIからインストールでき、Apache-2.0ライセンスでリリースされている。
論文 参考訳(メタデータ) (2021-11-12T11:56:40Z) - Learning from Shader Program Traces [19.288861518662547]
画像処理のためのディープネットワークは通常、RGBピクセルから学習する。
本稿では,プログラム実行中に計算される中間値であるプログラムトレースから学習することを提案する。
論文 参考訳(メタデータ) (2021-02-08T21:08:14Z) - Reducing the Annotation Effort for Video Object Segmentation Datasets [50.893073670389164]
ピクセルマスクでフレームを密にラベル付けしても 大規模なデータセットにはスケールしない
我々は、より安価なバウンディングボックスアノテーションからピクセルレベルで擬似ラベルを自動生成するために、深層畳み込みネットワークを使用します。
我々は新しいTAO-VOSベンチマークを取得し、www.vision.rwth-aachen.de/page/taovosで公開している。
論文 参考訳(メタデータ) (2020-11-02T17:34:45Z) - Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。
最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。
ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文 参考訳(メタデータ) (2020-06-18T08:16:25Z) - Heterogeneous CPU+GPU Stochastic Gradient Descent Algorithms [1.3249453757295084]
ヘテロジニアスCPU+GPUアーキテクチャの深層学習のためのトレーニングアルゴリズムについて検討する。
私たちの2倍の目標 -- 収束率と資源利用を同時に最大化する -- は、この問題を難しくします。
これらのアルゴリズムの実装は,複数の実データセットよりも高速な収束と資源利用の両立を実現していることを示す。
論文 参考訳(メタデータ) (2020-04-19T05:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。