論文の概要: VkSplat: High-Performance 3DGS Training in Vulkan Compute
- arxiv url: http://arxiv.org/abs/2605.00219v1
- Date: Thu, 30 Apr 2026 20:48:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.748403
- Title: VkSplat: High-Performance 3DGS Training in Vulkan Compute
- Title(参考訳): VkSplat:Vulkan Computeでの高性能3DGSトレーニング
- Authors: Jingxiang Chen, Mohamed Ibrahim, Yang Liu,
- Abstract要約: VkSplatは、Vulkan計算で完全に実装された、クロスベンダな3DGSトレーニングパイプラインである。
GPU+PyTorchベースラインよりも3.3倍の速度と33%のVRAM削減を実現しています。
私たちの知る限りでは、これは、最先端のパフォーマンスを達成した初めてのフルVulkanベースの3DGSトレーニングパイプラインです。
- 参考スコア(独自算出の注目度): 5.777354778900711
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present VkSplat, a high-performance, cross-vendor 3D Gaussian Splatting (3DGS) training pipeline implemented fully in Vulkan compute, addressing performance and compatibility limitation of existing training pipelines. With various optimizations, we achieve $3.3\times$ speed and $33\%$ VRAM reduction over CUDA+PyTorch baseline, maintaining quality, and demonstrating compatibility across GPU vendors. To the best of our knowledge, this is the first fully-Vulkan-based 3DGS training pipeline that achieves state-of-the-art performance. Code: \href{https://github.com/harry7557558/vksplat}{https://github.com/harry7557558/vksplat}
- Abstract(参考訳): VkSplatは、Vulkan計算に完全に実装された高性能でクロスベンダな3Dガウススティング(3DGS)トレーニングパイプラインであり、既存のトレーニングパイプラインの性能と互換性の限界に対処する。
様々な最適化により、CUDA+PyTorchベースラインよりも3.3\times$スピードと3.3\%のVRAM削減を実現し、品質を維持し、GPUベンダー間の互換性を示す。
私たちの知る限りでは、これは、最先端のパフォーマンスを達成した初めてのフルVulkanベースの3DGSトレーニングパイプラインです。
コード: \href{https://github.com/harry7557558/vksplat}{https://github.com/harry757558/vksplat}
関連論文リスト
- Splats under Pressure: Exploring Performance-Energy Trade-offs in Real-Time 3D Gaussian Splatting under Constrained GPU Budgets [0.0]
本稿では,GPU計算予算の異なるエッジクライアント上でのリアルタイム3Dガウススプラッティング(3DGS)の実現可能性について検討する。
複数の物理デバイスを評価する代わりに、エミュレーションベースのアプローチを採用しています。
フレームレート、実行時の動作、そして様々な複雑さのシーンにおける消費電力を測定します。
論文 参考訳(メタデータ) (2026-04-08T15:05:29Z) - CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation [51.72529978689561]
Agentは、カーネルの専門知識を3つのコンポーネントで開発する大規模なエージェント強化学習システムである。
AgentはKernelBench上で、トーチコンパイルよりも100%、100%、92%高速なレートを提供する。
論文 参考訳(メタデータ) (2026-02-27T18:58:05Z) - Visionary: The World Model Carrier Built on WebGPU-Powered Gaussian Splatting Platform [104.39464309969253]
Visionaryは、リアルタイムな様々なガウススティングとレンダリングのための、オープンでWebネイティブなプラットフォームである。
Visionaryは、軽量で“クリック・トゥ・ラン”なブラウザエクスペリエンスを維持しながら、動的ニューラル処理を可能にする。
論文 参考訳(メタデータ) (2025-12-09T10:54:58Z) - Triangle Splatting+: Differentiable Rendering with Opaque Triangles [54.18495204764292]
微分可能なスティングフレームワーク内での三角形を直接最適化するTriangle Splatting+を導入する。
本手法は, 視覚的忠実度において, より効率的かつ高速なトレーニングを継続しながら, 従来のスプレイティング手法を超越した手法である。
結果として生じるセミコネクテッドメッシュは、物理ベースのシミュレーションやインタラクティブなウォークスルーのような下流のアプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-09-29T17:43:46Z) - Speedy Deformable 3D Gaussian Splatting: Fast Rendering and Compression of Dynamic Scenes [57.69608119350651]
動的シーンへの3次元ガウススティング(3DGS)の最近の拡張は、ニューラルネットワークを用いて各ガウスの時間変化変形を予測することによって、高品質な新規ビュー合成を実現する。
しかしながら、ガウス毎のニューラルネットワークを各フレームで実行することは、レンダリング速度を制限し、メモリと計算要求を増大させる、重大なボトルネックとなる。
動的3DGSおよび4DGS表現のレンダリング速度を2つの相補的手法により低減し,高速化する汎用パイプラインであるSpeedy Deformable 3D Gaussian Splatting(SpeeDe3DGS)を提案する。
論文 参考訳(メタデータ) (2025-06-09T16:30:48Z) - FlexGS: Train Once, Deploy Everywhere with Many-in-One Flexible 3D Gaussian Splatting [57.97160965244424]
3Dガウススプラッティング(3DGS)は、3Dシーン表現や新しいビュー合成に様々な応用を可能にしている。
従来のアプローチでは、重要でないガウス人を刈り取ることに重点を置いており、3DGSを効果的に圧縮している。
本稿では3DGSの弾性推論手法を提案する。
論文 参考訳(メタデータ) (2025-06-04T17:17:57Z) - GauRast: Enhancing GPU Triangle Rasterizers to Accelerate 3D Gaussian Splatting [3.275890592583965]
3D Gaussian Splatting (3DGS)は高品質な3Dレンダリング手法である。
3DGSを加速するためのこれまでの取り組みは、相当な統合オーバーヘッドとハードウェアコストを必要とする専用のアクセラレータに依存していた。
本研究では、3DGSパイプラインと高度に最適化された従来のグラフィックスパイプラインの類似性を活用する加速度戦略を提案する。
論文 参考訳(メタデータ) (2025-03-20T19:54:05Z) - INR-Arch: A Dataflow Architecture and Compiler for Arbitrary-Order
Gradient Computations in Implicit Neural Representation Processing [66.00729477511219]
計算グラフとして表される関数を考えると、従来のアーキテクチャはn階勾配を効率的に計算する上で困難に直面している。
InR-Archは,n階勾配の計算グラフをハードウェア最適化データフローアーキテクチャに変換するフレームワークである。
1.8-4.8x と 1.5-3.6x の高速化を CPU と GPU のベースラインと比較した結果を示す。
論文 参考訳(メタデータ) (2023-08-11T04:24:39Z) - Project CGX: Scalable Deep Learning on Commodity GPUs [17.116792714097738]
本稿では,ハードウェアオーバープロビジョンがアルゴリズムとシステム設計によって置き換えられるかを検討する。
本稿では,通信圧縮のための効率的なソフトウェアサポートを提供するCGXというフレームワークを提案する。
このフレームワークは、コンシューマグレードのマルチGPUシステムから通信ボトルネックを取り除くことができる。
論文 参考訳(メタデータ) (2021-11-16T17:00:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。