論文の概要: WavePlanes: A compact Wavelet representation for Dynamic Neural Radiance Fields
- arxiv url: http://arxiv.org/abs/2312.02218v3
- Date: Wed, 8 May 2024 13:24:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-09 19:00:52.750736
- Title: WavePlanes: A compact Wavelet representation for Dynamic Neural Radiance Fields
- Title(参考訳): WavePlanes: 動的ニューラルラジアンス場のためのコンパクトウェーブレット表現
- Authors: Adrian Azzarelli, Nantheera Anantrasirichai, David R Bull,
- Abstract要約: 本稿では,高速かつコンパクトな明示的モデルであるWavePlanesについて述べる。
Nレベル2次元ウェーブレット係数を用いたマルチスケール空間および時空間特徴平面表現を提案する。
ウェーブレット係数の間隔を計算し、ハッシュマップを用いてモデルを圧縮する。
- 参考スコア(独自算出の注目度): 9.158626732325915
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dynamic Neural Radiance Fields (Dynamic NeRF) enhance NeRF technology to model moving scenes. However, they are resource intensive and challenging to compress. To address these issues, this paper presents WavePlanes, a fast and more compact explicit model. We propose a multi-scale space and space-time feature plane representation using N-level 2-D wavelet coefficients. The inverse discrete wavelet transform reconstructs feature signals at varying detail, which are linearly decoded to approximate the color and density of volumes in a 4-D grid. Exploiting the sparsity of wavelet coefficients, we compress the model using a Hash Map containing only non-zero coefficients and their locations on each plane. Compared to the state-of-the-art (SotA) plane-based models, WavePlanes is up to 15x smaller while being less resource demanding and competitive in performance and training time. Compared to other small SotA models WavePlanes preserves details better without requiring custom CUDA code or high performance computing resources. Our code is available at: https://github.com/azzarelli/waveplanes/
- Abstract(参考訳): Dynamic Neural Radiance Fields (Dynamic NeRF)は、移動シーンをモデル化するためのNeRF技術を強化する。
しかし、それらは資源集約的で圧縮が難しい。
本稿では,これらの問題に対処するために,高速でコンパクトな明示的モデルであるWavePlanesを提案する。
Nレベル2次元ウェーブレット係数を用いたマルチスケール空間および時空間特徴平面表現を提案する。
逆離散ウェーブレット変換は、4次元グリッドにおける体積の色と密度を近似するために線形デコードされた特徴信号を様々な詳細で再構成する。
ウェーブレット係数の間隔を計算し、非ゼロ係数と各平面上の位置のみを含むハッシュマップを用いてモデルを圧縮する。
最先端(SotA)プレーンベースモデルと比較すると、WavePlanesは最大15倍小さくなり、リソースの需要も少なく、性能やトレーニング時間も競争力がある。
他の小さなSotAモデルと比較すると、WavePlanesはカスタムCUDAコードや高性能コンピューティングリソースを必要とせずに詳細を保存できる。
私たちのコードは、https://github.com/azzarelli/waveplanes/で利用可能です。
関連論文リスト
- Compression of 3D Gaussian Splatting with Optimized Feature Planes and Standard Video Codecs [5.583906047971048]
3D Splattingは3Dシーン表現の認識手法であり、高いレンダリング品質とスピードで知られている。
本稿では,コンパクト表現を用いてストレージオーバーヘッドを大幅に削減する効率的な圧縮手法を提案する。
実験により,本手法は,高レンダリング品質を維持しつつ,データ圧縮性において既存の手法よりも優れることを示した。
論文 参考訳(メタデータ) (2025-01-06T21:37:30Z) - DaRePlane: Direction-aware Representations for Dynamic Scene Reconstruction [26.39519157164198]
DaRePlaneは、6つの異なる方向からダイナミクスをキャプチャする新しい表現手法である。
DaRePlaneは様々な複雑なダイナミックシーンのための新しいビュー合成において最先端のパフォーマンスを得る。
論文 参考訳(メタデータ) (2024-10-18T04:19:10Z) - WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.25711405944239]
深部画像登録は異常な精度と高速な推測を示した。
近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。
本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文 参考訳(メタデータ) (2024-07-18T11:51:01Z) - SAGS: Structure-Aware 3D Gaussian Splatting [53.6730827668389]
本研究では,シーンの形状を暗黙的に符号化する構造認識型ガウス散乱法(SAGS)を提案する。
SAGSは、最先端のレンダリング性能と、ベンチマークノベルビュー合成データセットのストレージ要件の削減を反映している。
論文 参考訳(メタデータ) (2024-04-29T23:26:30Z) - Concise Plane Arrangements for Low-Poly Surface and Volume Modelling [9.254047358707016]
複雑な物体とシーン全体に対する平面配置の構築を可能にする2つの重要なノベルティを紹介する。
提案手法は,様々なデータセットの学習ベースおよび従来のアプローチと比較することにより,最先端の結果につながることを示す。
論文 参考訳(メタデータ) (2024-04-09T09:27:54Z) - Make-A-Shape: a Ten-Million-scale 3D Shape Model [52.701745578415796]
本稿では,大規模な効率的なトレーニングを目的とした新しい3次元生成モデルであるMake-A-Shapeを紹介する。
まずウェーブレットツリー表現を革新し、サブバンド係数フィルタリングスキームを定式化して形状をコンパクトに符号化する。
我々は、粗いウェーブレット係数の生成を効果的に学習するために、我々のモデルを訓練するためのサブバンド適応型トレーニング戦略を導出する。
論文 参考訳(メタデータ) (2024-01-20T00:21:58Z) - HybridNeRF: Efficient Neural Rendering via Adaptive Volumetric Surfaces [71.1071688018433]
ニューラル放射場は、最先端のビュー合成品質を提供するが、レンダリングが遅くなる傾向がある。
本稿では,ほとんどの物体を表面としてレンダリングすることで,両表現の強みを生かしたHybridNeRFを提案する。
仮想現実分解能(2Kx2K)のリアルタイムフレームレート(少なくとも36FPS)を達成しながら、エラー率を15~30%改善する。
論文 参考訳(メタデータ) (2023-12-05T22:04:49Z) - Dynamic Frame Interpolation in Wavelet Domain [57.25341639095404]
ビデオフレームは、より流動的な視覚体験のためにフレームレートを上げることができる、重要な低レベルな計算ビジョンタスクである。
既存の手法は、高度なモーションモデルと合成ネットワークを利用することで大きな成功を収めた。
WaveletVFIは、同様の精度を維持しながら最大40%の計算を削減できるため、他の最先端技術に対してより効率的に処理できる。
論文 参考訳(メタデータ) (2023-09-07T06:41:15Z) - Neural Wavelet-domain Diffusion for 3D Shape Generation, Inversion, and
Manipulation [54.09274684734721]
本稿では,ウェーブレット領域における連続的な暗黙表現の直接生成モデルを用いて,3次元形状の生成,反転,操作を行う新しい手法を提案する。
具体的には、1対の粗い係数と細部係数の体積を持つコンパクトなウェーブレット表現を提案し、トランケートされた符号付き距離関数とマルチスケールの生体直交ウェーブレットを介して3次元形状を暗黙的に表現する。
エンコーダネットワークを共同でトレーニングすることで,形状を反転させる潜在空間を学習することができる。
論文 参考訳(メタデータ) (2023-02-01T02:47:53Z) - aiWave: Volumetric Image Compression with 3-D Trained Affine
Wavelet-like Transform [43.984890290691695]
最も一般的なボリューム画像圧縮法はJP3Dのようなウェーブレット変換に基づいている。
本稿では,信号依存型および非分離型変換を実現するために,まず3次元トレーニングウェーブレット様変換を設計する。
次に、アフィンウェーブレットベースを導入し、ボリューム画像の異なる領域における様々な局所的相関をキャプチャする。
論文 参考訳(メタデータ) (2022-03-11T10:02:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。