Fugu-MT 論文翻訳(概要): PixelBrax: Learning Continuous Control from Pixels End-to-End on the GPU

論文の概要: PixelBrax: Learning Continuous Control from Pixels End-to-End on the GPU

arxiv url: http://arxiv.org/abs/2502.00021v1
Date: Thu, 16 Jan 2025 08:00:10 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-09 08:11:47.082938
Title: PixelBrax: Learning Continuous Control from Pixels End-to-End on the GPU
Title（参考訳）: PixelBrax: GPUでエンドツーエンドのPixelから継続的制御を学ぶ
Authors: Trevor McInroe, Samuel Garcin,
Abstract要約: 画素観察を伴う連続制御タスクの集合であるPixelBraxについて述べる。私たちはBrax物理エンジンと純粋なJAXを組み合わせて、強化学習実験をGPU上でエンドツーエンドで実行できるようにします。
参考スコア（独自算出の注目度）: 0.9208007322096533
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present PixelBrax, a set of continuous control tasks with pixel observations. We combine the Brax physics engine with a pure JAX renderer, allowing reinforcement learning (RL) experiments to run end-to-end on the GPU. PixelBrax can render observations over thousands of parallel environments and can run two orders of magnitude faster than existing benchmarks that rely on CPU-based rendering. Additionally, PixelBrax supports fully reproducible experiments through its explicit handling of any stochasticity within the environments and supports color and video distractors for benchmarking generalization. We open-source PixelBrax alongside JAX implementations of several RL algorithms at github.com/trevormcinroe/pixelbrax.
Abstract（参考訳）: 画素観察を伴う連続制御タスクの集合であるPixelBraxについて述べる。我々はBrax物理エンジンと純粋なJAXレンダラーを組み合わせて、強化学習(RL)実験をGPU上でエンドツーエンドで実行できるようにします。 PixelBraxは数千の並列環境上で観測結果をレンダリングすることができ、CPUベースのレンダリングに依存する既存のベンチマークよりも2桁高速に実行することができる。さらに、PixelBraxは、環境内のいかなる確率性も明示的に扱うことで、完全な再現可能な実験をサポートし、ベンチマークの一般化のために色とビデオのイントラクタをサポートする。我々は、github.com/trevormcinroe/pixelbraxで、いくつかのRLアルゴリズムのJAX実装とともにPixelBraxをオープンソース化しました。

関連論文リスト

Minute-Long Videos with Dual Parallelisms [57.22737565366549]
Diffusion Transformer (DiT)ベースのビデオ拡散モデルは、大規模に高品質なビデオを生成するが、長いビデオの処理遅延とメモリコストは禁じられている。我々はDualParalと呼ばれる新しい分散推論戦略を提案する。 1つのGPUでビデオ全体を生成する代わりに、時間フレームとモデルレイヤの両方をGPU間で並列化します。
論文参考訳（メタデータ） (2025-05-27T11:55:22Z)
Sparse VideoGen: Accelerating Video Diffusion Transformers with Spatial-Temporal Sparsity [59.80405282381126]
拡散変換器(DiT)はビデオ生成を支配しているが、その高い計算コストは現実の応用性を著しく制限する。 Sparse VideoGen (SVG) と呼ばれる3次元フルアテンションに固有の空間を利用して推論効率を向上する学習自由フレームワークを提案する。 SVGはCagVideoX-v1.5とHunyuanVideoで最大2.28倍と2.33倍のスピードアップを達成する。
論文参考訳（メタデータ） (2025-02-03T19:29:16Z)
A User's Guide to $\ exttt{KSig}$: GPU-Accelerated Computation of the Signature Kernel [12.111848705677138]
シグネチャカーネルは、シーケンシャルおよびテンポラルデータのための正定カーネルである。この章では、署名カーネルを演算するためのGPUアクセラレーションアルゴリズムを実装した、$textttKSig$、$textttScikit-Learn$互換Pythonパッケージについて短い紹介を行う。
論文参考訳（メタデータ） (2025-01-13T09:11:13Z)
3D Gaussian Ray Tracing: Fast Tracing of Particle Scenes [50.36933474990516]
本研究は, 粒子のトレーシング, 境界体積階層の構築, 高性能なレイトレーシングハードウェアを用いた各画素のレイキャストについて考察する。半透明粒子の多量処理を効率的に行うために,有界メッシュで粒子をカプセル化するアルゴリズムについて述べる。実験は、我々のアプローチの速度と精度、およびコンピュータグラフィックスとビジョンにおけるいくつかの応用を実証する。
論文参考訳（メタデータ） (2024-07-09T17:59:30Z)
Is One GPU Enough? Pushing Image Generation at Higher-Resolutions with Foundation Models [4.257210316104905]
我々はPixelsmithを紹介した。これはゼロショットのテキスト・ツー・イメージ生成フレームワークで、1つのGPUで高解像度の画像をサンプリングする。我々は,事前学習した拡散モデルの出力を1000倍に拡大できることを初めて示し,ギガピクセル画像生成への道を開いた。
論文参考訳（メタデータ） (2024-06-11T13:33:33Z)
JaxMARL: Multi-Agent RL Environments and Algorithms in JAX [105.343918678781]
我々は、GPU対応の効率と多くの一般的なMARL環境のサポートを組み合わせた、最初のオープンソースPythonベースのライブラリであるJaxMARLを紹介します。我々の実験は、壁時計時間の観点から、JAXベースのトレーニングパイプラインが既存のアプローチの約14倍高速であることを示している。また、人気の高いStarCraft Multi-Agent ChallengeのJAXベースの近似的な再実装であるSMAXを紹介し、ベンチマークする。
論文参考訳（メタデータ） (2023-11-16T18:58:43Z)
Deep and Fast Approximate Order Independent Transparency [0.0]
順序独立透明性(OIT)を効率的に計算するための機械学習手法を提案する。提案手法は高速で,メモリの一定量が少なく,従来の近似手法に比べて精度が高い。
論文参考訳（メタデータ） (2023-05-17T13:21:45Z)
Learn how to Prune Pixels for Multi-view Neural Image-based Synthesis [10.571582038258443]
本稿では,ピクセルプルーニングの手法であるLeHoPPを提案する。レンダリングビューにおける各入力ピクセルの重要性について検討し、無関係なピクセルの使用を避ける。画像ベースのレンダリングネットワークを再トレーニングしなくても,合成品質と画素レートのトレードオフは良好である。
論文参考訳（メタデータ） (2023-05-05T14:29:24Z)
VoGE: A Differentiable Volume Renderer using Gaussian Ellipsoids for Analysis-by-Synthesis [62.47221232706105]
本稿では,ガウス再構成カーネルをボリュームプリミティブとして利用するVoGEを提案する。本稿では,VoGEを用いて効率よくレンダリングを行うために,体積密度集約と粗大な描画戦略に関する近似クローズフォーム解を提案する。 VoGEは、オブジェクトポーズ推定、形状/テクスチャフィッティング、推論など、様々な視覚タスクに適用された場合、SoTAより優れている。
論文参考訳（メタデータ） (2022-05-30T19:52:11Z)
AlphaRotate: A Rotation Detection Benchmark using TensorFlow [63.39088942989411]
AlphaRotateは、さまざまなデータセットでスケーラブルなローテーション検出を実行するためのオープンソースのベンチマークである。現在、単一のドキュメント化されたAPIの下で18以上の一般的な回転検出モデルを提供している。 AlphaRotateはPyPIからインストールでき、Apache-2.0ライセンスでリリースされている。
論文参考訳（メタデータ） (2021-11-12T11:56:40Z)
Learning from Shader Program Traces [19.288861518662547]
画像処理のためのディープネットワークは通常、RGBピクセルから学習する。本稿では,プログラム実行中に計算される中間値であるプログラムトレースから学習することを提案する。
論文参考訳（メタデータ） (2021-02-08T21:08:14Z)
Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文参考訳（メタデータ） (2020-06-18T08:16:25Z)
Heterogeneous CPU+GPU Stochastic Gradient Descent Algorithms [1.3249453757295084]
ヘテロジニアスCPU+GPUアーキテクチャの深層学習のためのトレーニングアルゴリズムについて検討する。私たちの2倍の目標 -- 収束率と資源利用を同時に最大化する -- は、この問題を難しくします。これらのアルゴリズムの実装は,複数の実データセットよりも高速な収束と資源利用の両立を実現していることを示す。
論文参考訳（メタデータ） (2020-04-19T05:21:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。