論文の概要: TRIM: Scalable 3D Gaussian Diffusion Inference with Temporal and Spatial Trimming
- arxiv url: http://arxiv.org/abs/2511.16642v1
- Date: Thu, 20 Nov 2025 18:49:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.793737
- Title: TRIM: Scalable 3D Gaussian Diffusion Inference with Temporal and Spatial Trimming
- Title(参考訳): TRIM:時空間トリミングによるスケーラブルな3次元ガウス拡散推定
- Authors: Zeyuan Yin, Xiaoming Liu,
- Abstract要約: 3次元ガウス拡散モデルの最近の進歩は、時間集約的な認知とポストデノゲーション処理に悩まされている。
我々は、$textbfT$rajectory $textbfR$eductionと$textbfI$nstance $textbfM$ask denoisingを提案する。
- 参考スコア(独自算出の注目度): 10.73970270886881
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in 3D Gaussian diffusion models suffer from time-intensive denoising and post-denoising processing due to the massive number of Gaussian primitives, resulting in slow generation and limited scalability along sampling trajectories. To improve the efficiency of 3D diffusion models, we propose $\textbf{TRIM}$ ($\textbf{T}$rajectory $\textbf{R}$eduction and $\textbf{I}$nstance $\textbf{M}$ask denoising), a post-training approach that incorporates both temporal and spatial trimming strategies, to accelerate inference without compromising output quality while supporting the inference-time scaling for Gaussian diffusion models. Instead of scaling denoising trajectories in a costly end-to-end manner, we develop a lightweight selector model to evaluate latent Gaussian primitives derived from multiple sampled noises, enabling early trajectory reduction by selecting candidates with high-quality potential. Furthermore, we introduce instance mask denoising to prune learnable Gaussian primitives by filtering out redundant background regions, reducing inference computation at each denoising step. Extensive experiments and analysis demonstrate that TRIM significantly improves both the efficiency and quality of 3D generation. Source code is available at $\href{https://github.com/zeyuanyin/TRIM}{link}$.
- Abstract(参考訳): 3次元ガウス拡散モデルの最近の進歩は、大量のガウス原始体により、時間集約的なデノナイジングとポストデノナイジング処理に悩まされ、サンプリング軌道に沿って、生成が遅く、スケーラビリティが制限される。
3次元拡散モデルの効率を改善するために、時空間トリミング戦略を組み込んだ後トレーニングアプローチである$\textbf{T}$rajectory $\textbf{R}$eductionと$\textbf{I}$nstance $\textbf{M}$ask denoisingを提案し、ガウス拡散モデルの推論時間スケーリングをサポートしながら、出力品質を損なうことなく推論を加速させる。
コストのかかる終端軌道をスケールする代わりに、複数のサンプルノイズから派生した潜時ガウス原始を評価できる軽量セレクタモデルを開発し、高品質なポテンシャルを持つ候補を選択することで早期軌道の低減を可能にする。
さらに,学習可能なガウスプリミティブに対して,冗長な背景領域をフィルタリングし,各デノナイジングステップにおける推論計算を減らすことで,インスタンスマスクをデノナイジングする。
大規模な実験と分析により、TRIMは3D生成の効率と品質の両方を著しく改善することが示された。
ソースコードは$\href{https://github.com/zeyuanyin/TRIM}{link}$で入手できる。
関連論文リスト
- ReSplat: Learning Recurrent Gaussian Splats [98.14472247275512]
ReSplatはフィードフォワードリカレントガウシアンスプラッティングモデルであり、明示的に勾配を計算せずに3Dガウシアンを反復的に洗練する。
我々は16倍のサブサンプル空間で動作するコンパクトな再構成モデルを導入し、以前のピクセルごとのガウスモデルよりも16倍のガウスモデルを生成する。
提案手法は,ガウス数を大幅に削減し,レンダリング速度を向上させるとともに,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-10-09T17:59:59Z) - Parallel Sampling of Diffusion Models on $SO(3)$ [6.950206740436355]
本稿では,$SO(3)$多様体上の拡散過程を高速化するアルゴリズムを設計する。
実験の結果,提案アルゴリズムは最大4.9$times$の高速化を実現し,単一サンプルを生成する遅延を著しく低減することがわかった。
論文 参考訳(メタデータ) (2025-07-14T14:51:02Z) - Metropolis-Hastings Sampling for 3D Gaussian Reconstruction [31.840492077537018]
3次元ガウス平滑化のための適応型サンプリングフレームワーク(3DGS)を提案する。
我々の枠組みは, 確率的サンプリングプロセスとして, デンシフィケーションとプルーニングを改質することで限界を克服する。
提案手法は,最先端モデルのビュー合成品質を適度に上回りながら,より高速な収束を実現する。
論文 参考訳(メタデータ) (2025-06-15T19:12:37Z) - Noise Conditional Variational Score Distillation [60.38982038894823]
騒音条件変化スコア蒸留(NCVSD)は, 予混合拡散モデルから生成消音剤を蒸留する新しい方法である。
この知見を変分スコア蒸留フレームワークに組み込むことで、生成的デノイザのスケーラブルな学習を可能にする。
論文 参考訳(メタデータ) (2025-06-11T06:01:39Z) - Second-order Optimization of Gaussian Splats with Importance Sampling [51.95046424364725]
3D Gaussian Splatting (3DGS) は、高品質で高速な推論時間のため、新しいビューレンダリングに広く用いられている。
本稿では,Levenberg-Marquardt (LM) と Conjugate Gradient (CG) に基づく新しい2階最適化手法を提案する。
提案手法は標準LMよりも3倍の高速化を実現し,ガウス数が少ない場合のAdamを6倍の6倍の速さで上回る。
論文 参考訳(メタデータ) (2025-04-17T12:52:08Z) - Binocular-Guided 3D Gaussian Splatting with View Consistency for Sparse View Synthesis [53.702118455883095]
本稿では,ガウススプラッティングを用いたスパースビューから新しいビューを合成する新しい手法を提案する。
私たちのキーとなるアイデアは、両眼画像間の両眼立体的一貫性に固有の自己超越を探索することにあります。
我々の手法は最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2024-10-24T15:10:27Z) - GaussianSR: 3D Gaussian Super-Resolution with 2D Diffusion Priors [14.743494200205754]
低分解能入力ビューからの高分解能新規ビュー合成(HRNVS)は、高分解能データがないため難しい課題である。
従来の手法では、低解像度の入力ビューから高分解能ニューラルネットワーク(NeRF)を最適化するが、レンダリング速度は遅い。
本研究では,高速なレンダリング速度で高品質な画像を生成する能力により,3Dガウススティング(3DGS)に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-06-14T15:19:21Z) - Learning to Discretize Denoising Diffusion ODEs [41.50816120270017]
拡散確率モデル(英: Diffusion Probabilistic Models, DPM)は、様々な領域における競争性能を示す生成モデルである。
本稿では,サンプリングのための最適な時間離散化学習を目的とした軽量フレームワークLD3を提案する。
我々はLD3がサンプリング効率をはるかに低い計算オーバーヘッドで改善できることを解析的かつ実証的に実証した。
論文 参考訳(メタデータ) (2024-05-24T12:51:23Z) - DreamGaussian: Generative Gaussian Splatting for Efficient 3D Content Creation [55.661467968178066]
本稿では,DreamGaussianを提案する。DreamGaussianは,効率と品質を両立させる新しい3Dコンテンツ生成フレームワークである。
我々の重要な洞察は、UV空間におけるメッシュ抽出とテクスチャ改善を伴う3次元ガウススプラッティングモデルを設計することである。
ニューラル・ラジアンス・フィールドにおける占有プルーニングとは対照的に、3次元ガウスの進行的な密度化は3次元生成タスクにおいて著しく速く収束することを示した。
論文 参考訳(メタデータ) (2023-09-28T17:55:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。