Fugu-MT 論文翻訳(概要): Accelerating 3D Gaussian Splatting with Neural Sorting and Axis-Oriented Rasterization

論文の概要: Accelerating 3D Gaussian Splatting with Neural Sorting and Axis-Oriented Rasterization

arxiv url: http://arxiv.org/abs/2506.07069v1
Date: Sun, 08 Jun 2025 10:14:54 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-10 16:33:10.660188
Title: Accelerating 3D Gaussian Splatting with Neural Sorting and Axis-Oriented Rasterization
Title（参考訳）: ニューラルソーティングと軸方向ラスタ化による3次元ガウス散乱の高速化
Authors: Zhican Wang, Guanghui He, Dantong Liu, Lingjun Gao, Shell Xu Hu, Chen Zhang, Zhuoran Song, Nicholas Lane, Wayne Luk, Hongxiang Fan,
Abstract要約: 3D Gaussian Splatting (3DGS) は、最近、高品質で効率的なビュー合成において大きな注目を集めている。アルゴリズムの性能は素晴らしいが、リソースに制約のあるデバイスのリアルタイムレンダリングは、厳しい電力と地域予算のために依然として大きな課題だ。
参考スコア（独自算出の注目度）: 14.87046071090259
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: 3D Gaussian Splatting (3DGS) has recently gained significant attention for high-quality and efficient view synthesis, making it widely adopted in fields such as AR/VR, robotics, and autonomous driving. Despite its impressive algorithmic performance, real-time rendering on resource-constrained devices remains a major challenge due to tight power and area budgets. This paper presents an architecture-algorithm co-design to address these inefficiencies. First, we reveal substantial redundancy caused by repeated computation of common terms/expressions during the conventional rasterization. To resolve this, we propose axis-oriented rasterization, which pre-computes and reuses shared terms along both the X and Y axes through a dedicated hardware design, effectively reducing multiply-and-add (MAC) operations by up to 63%. Second, by identifying the resource and performance inefficiency of the sorting process, we introduce a novel neural sorting approach that predicts order-independent blending weights using an efficient neural network, eliminating the need for costly hardware sorters. A dedicated training framework is also proposed to improve its algorithmic stability. Third, to uniformly support rasterization and neural network inference, we design an efficient reconfigurable processing array that maximizes hardware utilization and throughput. Furthermore, we introduce a $\pi$-trajectory tile schedule, inspired by Morton encoding and Hilbert curve, to optimize Gaussian reuse and reduce memory access overhead. Comprehensive experiments demonstrate that the proposed design preserves rendering quality while achieving a speedup of $23.4\sim27.8\times$ and energy savings of $28.8\sim51.4\times$ compared to edge GPUs for real-world scenes. We plan to open-source our design to foster further development in this field.
Abstract（参考訳）: 3D Gaussian Splatting (3DGS)は、最近、高品質で効率的なビュー合成において大きな注目を集めており、AR/VR、ロボティクス、自動運転などの分野で広く採用されている。アルゴリズムの性能は素晴らしいが、リソースに制約のあるデバイスのリアルタイムレンダリングは、厳しい電力と地域予算のために依然として大きな課題だ。本稿では,これらの非効率性に対処するアーキテクチャ・アルゴリズムを共同設計する。まず, 従来のラスタ化において, 共通項/表現の繰り返し計算によって生じるかなりの冗長性を明らかにする。そこで本研究では,X軸とY軸の共用項を専用ハードウェア設計により事前計算・再利用する軸方向ラスタライゼーションを提案し,乗算加算(MAC)演算を最大63%削減する。第二に、ソートプロセスの資源と性能の非効率性を同定することにより、効率的なニューラルネットワークを用いて注文非依存のブレンディング重量を予測する新しいニューラルソート手法を導入し、コストのかかるハードウェアソートの必要性を排除した。アルゴリズムの安定性を改善するために、専用のトレーニングフレームワークも提案されている。第3に、ラスタ化とニューラルネットワーク推論を均一にサポートするために、ハードウェア利用とスループットを最大化する効率的な再構成可能な処理アレイを設計する。さらに、モートンエンコーディングとヒルベルト曲線にインスパイアされた$\pi$-trajectory tile scheduleを導入し、ガウスの再利用を最適化し、メモリアクセスオーバーヘッドを低減する。総合的な実験では、提案された設計はレンダリング品質を保ちながら、23.4\sim27.8\times$と28.8\sim51.4\times$を現実のシーンのエッジGPUと比較する。この分野でのさらなる開発を促進するために、設計をオープンソース化する予定です。

関連論文リスト

Quantile Rendering: Efficiently Embedding High-dimensional Feature on 3D Gaussian Splatting [52.18697134979677]
コンピュータビジョンの最近の進歩は、3Dガウススプラッティング(3D-GS)を活用して、OVS(Open-vocabulary segmentation)を3Dドメインに拡張することに成功している。既存の方法はコードブックや特徴圧縮を採用しており、情報損失を引き起こし、セグメンテーションの品質が低下する。本稿では,高忠実度を維持しながら高次元特徴を効率的に処理する3次元ガウスの新たなレンダリング戦略であるQuantile Rendering(Q-Render)を紹介する。本フレームワークは,512次元特徴写像上での43.7倍の高速化でリアルタイムレンダリングを実現するとともに,最先端の手法よりも優れる。
論文参考訳（メタデータ） (2025-12-24T04:16:18Z)
Comprehensive Design Space Exploration for Tensorized Neural Network Hardware Accelerators [11.97184801369339]
高次テンソル分解は、エッジ展開のためのコンパクトなディープニューラルネットワークを得るために広く採用されている。このようなハードウェアを意識しない設計は、テンソル化モデルの潜在的な遅延とエネルギーの利点を曖昧にすることが多い。テンソル化ニューラルネットワークの効率的なトレーニングと推論のために,これらの次元を統一設計空間内に統一する共同探索フレームワークを提案する。
論文参考訳（メタデータ） (2025-11-22T08:18:40Z)
Perceive-Sample-Compress: Towards Real-Time 3D Gaussian Splatting [7.421996491601524]
本稿では,3次元ガウス平滑化のための新しい知覚・サンプル圧縮フレームワークを提案する。提案手法は,リアルタイムレンダリング速度を維持しながら,メモリ効率と視覚的品質を大幅に向上することを示す。
論文参考訳（メタデータ） (2025-08-07T01:34:38Z)
Duplex-GS: Proxy-Guided Weighted Blending for Real-Time Order-Independent Gaussian Splatting [37.17972426764452]
本稿では、プロキシガウス表現と順序に依存しないレンダリング技術を統合する二重階層フレームワークを提案する。我々は、我々のフレームワークとオーダー独立透明性(OIT)をシームレスに組み合わせることで、物理的にインスパイアされた重み付けされた和レンダリング技術を開発し、同時に「ポーピング」と「透明性」アーティファクトを除去する。提案手法は,既存のOITをベースとしたガウス版よりも1.5～4倍高速で高品質なレンダリングを実現し,ガウス版におけるOITレンダリングの利点を検証した。
論文参考訳（メタデータ） (2025-08-05T07:44:30Z)
Second-order Optimization of Gaussian Splats with Importance Sampling [51.95046424364725]
3D Gaussian Splatting (3DGS) は、高品質で高速な推論時間のため、新しいビューレンダリングに広く用いられている。本稿では,Levenberg-Marquardt (LM) と Conjugate Gradient (CG) に基づく新しい2階最適化手法を提案する。提案手法は標準LMよりも3倍の高速化を実現し,ガウス数が少ない場合のAdamを6倍の6倍の速さで上回る。
論文参考訳（メタデータ） (2025-04-17T12:52:08Z)
ProtoGS: Efficient and High-Quality Rendering with 3D Gaussian Prototypes [81.48624894781257]
3D Gaussian Splatting (3DGS) は、新しいビュー合成において大きな進歩を遂げてきたが、ガウスプリミティブのかなりの数によって制限されている。近年の手法では、密度の高いガウスの記憶容量を圧縮することでこの問題に対処しているが、レンダリングの品質と効率の維持には失敗している。本稿では,ガウスの原始体を表現するためにガウスのプロトタイプを学習するProtoGSを提案し,視覚的品質を犠牲にすることなくガウスの総量を大幅に削減する。
論文参考訳（メタデータ） (2025-03-21T18:55:14Z)
iFlame: Interleaving Full and Linear Attention for Efficient Mesh Generation [49.8026360054331]
iFlameはメッシュ生成のためのトランスフォーマーベースの新しいネットワークアーキテクチャである。本稿では,線形アテンションの効率とフルアテンション機構の表現力を組み合わせたインターリービング自己回帰メッシュ生成フレームワークを提案する。提案するインターリービングフレームワークは,計算効率と生成性能を効果的にバランスさせることが示唆された。
論文参考訳（メタデータ） (2025-03-20T19:10:37Z)
Accelerating Linear Recurrent Neural Networks for the Edge with Unstructured Sparsity [39.483346492111515]
線形リカレントニューラルネットワークは、推論中に一定のメモリ使用量と時間毎の時間を含む強力な長距離シーケンスモデリングを可能にする。非構造化空間は、互換性のあるハードウェアプラットフォームによって加速されるときに、計算とメモリの要求を大幅に削減できる魅力的なソリューションを提供する。非常に疎い線形RNNは、高密度ベースラインよりも高い効率と性能のトレードオフを一貫して達成している。
論文参考訳（メタデータ） (2025-02-03T13:09:21Z)
Efficient Density Control for 3D Gaussian Splatting [3.6379656024631215]
3D Gaussian Splatting (3DGS) は新規なビュー合成において優れた性能を示した。本研究では,(1)ガウシアンの位置,形状,不透明度を正確に制御するLong-Axis Split,(2)ガウシアンに対する不完全性の再設定後の回復速度の差を利用したリカバリ・アウェア・プルーニングを提案する。
論文参考訳（メタデータ） (2024-11-15T12:12:56Z)
Taming 3DGS: High-Quality Radiance Fields with Limited Resources [50.92437599516609]
3D Gaussian Splatting (3DGS)は、高速で解釈可能で高忠実なレンダリングで新規ビュー合成を変換した。予算で3DGSモデルをトレーニングし、レンダリングするという課題に取り組みます。我々は、勾配計算と属性更新のための高速で数値的に等価な解を導出する。
論文参考訳（メタデータ） (2024-06-21T20:44:23Z)
GES: Generalized Exponential Splatting for Efficient Radiance Field Rendering [112.16239342037714]
GES(Generalized Exponential Splatting)は、GEF(Generalized Exponential Function)を用いて3Dシーンをモデル化する斬新な表現である。周波数変調損失の助けを借りて、GESは新規なビュー合成ベンチマークにおいて競合性能を達成する。
論文参考訳（メタデータ） (2024-02-15T17:32:50Z)
Latency-aware Unified Dynamic Networks for Efficient Image Recognition [72.8951331472913]
LAUDNetは動的ネットワークの理論的および実用的な効率ギャップを橋渡しするフレームワークである。 3つの主要な動的パラダイム - 適応型計算、動的層スキップ、動的チャネルスキップ - を統合している。これにより、V100,3090やTX2 GPUのようなプラットフォーム上で、ResNetのようなモデルの遅延を50%以上削減できる。
論文参考訳（メタデータ） (2023-08-30T10:57:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。