論文の概要: Expansive Supervision for Neural Radiance Field
- arxiv url: http://arxiv.org/abs/2409.08056v1
- Date: Thu, 12 Sep 2024 14:05:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-13 16:17:53.660523
- Title: Expansive Supervision for Neural Radiance Field
- Title(参考訳): ニューラル・ラジアンス・フィールドのための拡張的スーパービジョン
- Authors: Weixiang Zhang, Shuzhao Xie, Shijia Ge, Wei Yao, Chen Tang, Zhi Wang,
- Abstract要約: 我々は,ニューラルネットワーク分野のトレーニングにおいて,計算負荷,レンダリング品質,柔軟性を効率的にバランスさせる,拡張的な監視機構を導入する。
従来の監視手法と比較して冗長なレンダリング処理を効果的に回避し,時間とメモリ消費の双方で顕著な削減を実現している。
- 参考スコア(独自算出の注目度): 12.510474224361504
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural Radiance Fields have achieved success in creating powerful 3D media representations with their exceptional reconstruction capabilities. However, the computational demands of volume rendering pose significant challenges during model training. Existing acceleration techniques often involve redesigning the model architecture, leading to limitations in compatibility across different frameworks. Furthermore, these methods tend to overlook the substantial memory costs incurred. In response to these challenges, we introduce an expansive supervision mechanism that efficiently balances computational load, rendering quality and flexibility for neural radiance field training. This mechanism operates by selectively rendering a small but crucial subset of pixels and expanding their values to estimate the error across the entire area for each iteration. Compare to conventional supervision, our method effectively bypasses redundant rendering processes, resulting in notable reductions in both time and memory consumption. Experimental results demonstrate that integrating expansive supervision within existing state-of-the-art acceleration frameworks can achieve 69% memory savings and 42% time savings, with negligible compromise in visual quality.
- Abstract(参考訳): ニューラル・ラジアンス・フィールズ(Neural Radiance Fields)は、強力な3Dメディア表現を、例外的な再構成能力で実現した。
しかし、ボリュームレンダリングの計算要求は、モデルトレーニングにおいて大きな課題を生んでいる。
既存のアクセラレーション技術は、しばしばモデルアーキテクチャの再設計を伴い、異なるフレームワーク間の互換性が制限される。
さらに、これらの手法はメモリコストを大幅に上回る傾向にある。
これらの課題に対応するため、我々は、ニューラルネットワーク分野のトレーニングにおいて、計算負荷、レンダリング品質、柔軟性を効率的にバランスさせる拡張的な監視機構を導入する。
このメカニズムは、小さなが重要なピクセルのサブセットを選択的にレンダリングし、その値を拡張して各イテレーションの領域全体にわたって誤差を見積もることによって機能する。
従来の監視手法と比較して、冗長なレンダリング処理を効果的に回避し、時間とメモリ消費の両方において顕著な削減をもたらす。
実験により、既存の最先端アクセラレーションフレームワークに広範囲の監視を組み込むことで、69%のメモリ節約と42%の時間節約を達成でき、視覚的品質を損なうことが実証された。
関連論文リスト
- Efficient Diffusion as Low Light Enhancer [63.789138528062225]
RATR(Reflectance-Aware Trajectory Refinement)は、イメージの反射成分を用いて教師の軌跡を洗練するための、シンプルで効果的なモジュールである。
textbfReDDiT (textbfDistilled textbfTrajectory) は低照度画像強調(LLIE)に適した効率的で柔軟な蒸留フレームワークである。
論文 参考訳(メタデータ) (2024-10-16T08:07:18Z) - Multi-scale Restoration of Missing Data in Optical Time-series Images with Masked Spatial-Temporal Attention Network [0.6675733925327885]
リモートセンシング画像に欠落した値を出力する既存の方法は、補助情報を完全に活用できない。
本稿では,時系列リモートセンシング画像の再構成のためのMS2という,深層学習に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2024-06-19T09:05:05Z) - Oblique-MERF: Revisiting and Improving MERF for Oblique Photography [32.864777068264665]
ボリュームレンダリングの過程で最適化された革新的適応占有面と、これらの問題に対処するビュー依存色に対する滑らかな正規化項を導入する。
我々のアプローチは斜めMERFと呼ばれ、最先端のリアルタイム手法を約0.7dBで超過し、VRAM使用率を約40%削減し、多くの視点でよりリアルなレンダリング結果が得られる高いレンダリングフレームレートを実現している。
論文 参考訳(メタデータ) (2024-04-15T07:51:29Z) - Efficient Diffusion Model for Image Restoration by Residual Shifting [63.02725947015132]
本研究では,画像復元のための新しい,効率的な拡散モデルを提案する。
提案手法は,推論中の後処理の高速化を回避し,関連する性能劣化を回避する。
提案手法は,3つの古典的IRタスクにおける現在の最先端手法よりも優れた,あるいは同等の性能を実現する。
論文 参考訳(メタデータ) (2024-03-12T05:06:07Z) - Compensation Sampling for Improved Convergence in Diffusion Models [12.311434647047427]
拡散モデルは画像生成において顕著な品質を達成するが、コストはかかる。
反復 denoising は高忠実度画像を生成するために多くの時間ステップを必要とする。
対象データの初期的不正確な再構成による復元誤差の蓄積により,復調過程が著しく制限されていることを論じる。
論文 参考訳(メタデータ) (2023-12-11T10:39:01Z) - Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - Weakly Supervised Face and Whole Body Recognition in Turbulent
Environments [2.2263723609685773]
本稿では, 領域表現を生成し, 乱流像と原始像を共通部分空間に整列する, 弱教師付きフレームワークを提案する。
また、乱流画像で観測される幾何歪みを予測する新しい傾きマップ推定器も導入した。
提案手法では, 乱流のない画像や地対画像の合成は必要とせず, 注釈付きサンプルを著しく少なくする。
論文 参考訳(メタデータ) (2023-08-22T19:58:02Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - MERF: Memory-Efficient Radiance Fields for Real-time View Synthesis in
Unbounded Scenes [61.01853377661283]
本稿では,ブラウザにおける大規模シーンのリアルタイムレンダリングを実現するメモリ効率のよいレイディアンスフィールド表現を提案する。
我々は,シーン座標を効率の良いレイボックス交叉を実現しつつ,境界体積にマッピングする新しい収縮関数を提案する。
論文 参考訳(メタデータ) (2023-02-23T18:59:07Z) - UNeRF: Time and Memory Conscious U-Shaped Network for Training Neural
Radiance Fields [16.826691448973367]
ニューラル・ラジアンス・フィールド(NeRF)は、新しいビュー合成とシーン再構成のための再構築の詳細を増大させる。
しかし、そのようなニューラルネットワークの解像度とモデルフリー性の向上は、高いトレーニング時間と過剰なメモリ要求のコストが伴う。
本研究では,近隣のサンプル点間で評価を部分的に共有することで,NeRFのサンプルベース計算の冗長性を利用する手法を提案する。
論文 参考訳(メタデータ) (2022-06-23T19:57:07Z) - Investigating Tradeoffs in Real-World Video Super-Resolution [90.81396836308085]
実世界のビデオ超解像(VSR)モデルは、一般化性を改善するために様々な劣化で訓練されることが多い。
最初のトレードオフを軽減するために,性能を犠牲にすることなく,最大40%のトレーニング時間を削減できる劣化手法を提案する。
そこで本研究では,多種多様な実世界の低品質映像系列を含むビデオLQデータセットを提案する。
論文 参考訳(メタデータ) (2021-11-24T18:58:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。