論文の概要: N-BVH: Neural ray queries with bounding volume hierarchies
- arxiv url: http://arxiv.org/abs/2405.16237v1
- Date: Sat, 25 May 2024 13:54:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 00:21:21.725036
- Title: N-BVH: Neural ray queries with bounding volume hierarchies
- Title(参考訳): N-BVH:境界体積階層を持つニューラルレイクエリ
- Authors: Philippe Weier, Alexander Rath, Élie Michel, Iliyan Georgiev, Philipp Slusallek, Tamy Boubekeur,
- Abstract要約: 3Dコンピュータグラフィックスでは、シーンのメモリ使用量の大部分がポリゴンとテクスチャによるものである。
N-BVHは3次元の任意の光線クエリに応答するように設計されたニューラル圧縮アーキテクチャである。
本手法は, 視認性, 深度, 外観特性を忠実に近似する。
- 参考スコア(独自算出の注目度): 51.430495562430565
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural representations have shown spectacular ability to compress complex signals in a fraction of the raw data size. In 3D computer graphics, the bulk of a scene's memory usage is due to polygons and textures, making them ideal candidates for neural compression. Here, the main challenge lies in finding good trade-offs between efficient compression and cheap inference while minimizing training time. In the context of rendering, we adopt a ray-centric approach to this problem and devise N-BVH, a neural compression architecture designed to answer arbitrary ray queries in 3D. Our compact model is learned from the input geometry and substituted for it whenever a ray intersection is queried by a path-tracing engine. While prior neural compression methods have focused on point queries, ours proposes neural ray queries that integrate seamlessly into standard ray-tracing pipelines. At the core of our method, we employ an adaptive BVH-driven probing scheme to optimize the parameters of a multi-resolution hash grid, focusing its neural capacity on the sparse 3D occupancy swept by the original surfaces. As a result, our N-BVH can serve accurate ray queries from a representation that is more than an order of magnitude more compact, providing faithful approximations of visibility, depth, and appearance attributes. The flexibility of our method allows us to combine and overlap neural and non-neural entities within the same 3D scene and extends to appearance level of detail.
- Abstract(参考訳): ニューラルネットワークの表現は、生のデータサイズのごく一部で複雑な信号を圧縮する素晴らしい能力を示している。
3Dコンピュータグラフィックスでは、シーンのメモリ使用の大部分はポリゴンとテクスチャによるもので、ニューラル圧縮の理想的な候補となっている。
ここでの大きな課題は、トレーニング時間を最小化しながら、効率的な圧縮と安価な推論の間に良いトレードオフを見つけることである。
レンダリングの文脈では、この問題に対してレイ中心のアプローチを採用し、3Dで任意のレイクエリに応答するように設計されたニューラル圧縮アーキテクチャであるN-BVHを考案する。
我々のコンパクトモデルは入力幾何から学習され、路面追跡エンジンによって線交叉がクエリされるたびにその代用となる。
従来のニューラル圧縮手法ではポイントクエリに重点を置いていたが,我々は標準のレイトレーシングパイプラインにシームレスに統合するニューラルレイクエリを提案する。
提案手法のコアとなるのは, 適応的なBVH駆動型探索手法を用いて, 多分解能ハッシュグリッドのパラメータを最適化し, そのニューラルキャパシティを, 元の表面のスパース3D占有率に焦点を絞った。
結果として、我々のN-BVHは、桁違いにコンパクトな表現から正確な光線クエリを提供することができ、可視性、深さ、外観特性の忠実な近似を提供する。
この手法の柔軟性により、同じ3Dシーン内で神経と非神経の実体を結合し、重なり合うことができ、外観レベルまで拡張できる。
関連論文リスト
- NeRFCodec: Neural Feature Compression Meets Neural Radiance Fields for Memory-Efficient Scene Representation [22.151167286623416]
メモリ効率のよいシーン表現のための非線形変換,量子化,エントロピー符号化を統合したエンドツーエンドのNeRF圧縮フレームワークを提案する。
提案手法は既存のNeRF圧縮法より優れており、0.5MBのメモリ予算で高品質な新規ビュー合成を可能にする。
論文 参考訳(メタデータ) (2024-04-02T15:49:00Z) - Learning Personalized High Quality Volumetric Head Avatars from
Monocular RGB Videos [47.94545609011594]
本研究では,野生で撮影されたモノクロRGBビデオから高品質な3次元頭部アバターを学習する方法を提案する。
我々のハイブリッドパイプラインは、3DMMの幾何学的先行と動的追跡とニューラルラディアンス場を組み合わせることで、きめ細かい制御とフォトリアリズムを実現する。
論文 参考訳(メタデータ) (2023-04-04T01:10:04Z) - Interactive Volume Visualization via Multi-Resolution Hash Encoding
based Neural Representation [29.797933404619606]
我々は、最新のGPUコアとよく設計されたレンダリングアルゴリズムを用いて、インタラクティブにトレースボリュームニューラル表現(10-60fps)を描画できることを示します。
我々の神経表現は、高忠実性テラセル (PSNR > 30dB) とコンパクト (10-1000倍小さい) でもある。
極端に大規模なボリュームデータをサポートするために、我々は、私たちの神経表現トレーニングをテラスケールにスケールアップできる効率的なコア外のトレーニング戦略も開発しています。
論文 参考訳(メタデータ) (2022-07-23T23:04:19Z) - Variable Bitrate Neural Fields [75.24672452527795]
本稿では,特徴格子を圧縮し,メモリ消費を最大100倍に削減する辞書手法を提案する。
辞書の最適化をベクトル量子化オートデコーダ問題として定式化し、直接監督できない空間において、エンドツーエンドの離散神経表現を学習する。
論文 参考訳(メタデータ) (2022-06-15T17:58:34Z) - InfoNeRF: Ray Entropy Minimization for Few-Shot Neural Volume Rendering [55.70938412352287]
ニューラルな暗黙表現に基づく数ショットの新規ビュー合成のための情報理論正規化手法を提案する。
提案手法は,不十分な視点で発生する潜在的な復元の不整合を最小化する。
複数の標準ベンチマークにおいて,既存のニューラルビュー合成手法と比較して一貫した性能向上を実現している。
論文 参考訳(メタデータ) (2021-12-31T11:56:01Z) - Learning Neural Light Fields with Ray-Space Embedding Networks [51.88457861982689]
我々は、コンパクトで、光線に沿った統合放射率を直接予測する新しいニューラル光場表現を提案する。
提案手法は,Stanford Light Field データセットのような,高密度の前方向きデータセットの最先端品質を実現する。
論文 参考訳(メタデータ) (2021-12-02T18:59:51Z) - H3D-Net: Few-Shot High-Fidelity 3D Head Reconstruction [27.66008315400462]
表面形状を暗黙的に表現する最近の学習手法は、多視点3次元再構成の問題において顕著な結果を示している。
我々はこれらの制限を,数発のフル3次元頭部再構成の特定の問題に対処する。
暗黙の表現を用いて,数千個の不完全な生スキャンから3次元頭部形状モデルを学習する。
論文 参考訳(メタデータ) (2021-07-26T23:04:18Z) - Light Field Networks: Neural Scene Representations with
Single-Evaluation Rendering [60.02806355570514]
2次元観察から3Dシーンの表現を推定することは、コンピュータグラフィックス、コンピュータビジョン、人工知能の基本的な問題である。
そこで我々は,360度4次元光場における基礎となる3次元シーンの形状と外観の両面を表現した新しいニューラルシーン表現,光場ネットワーク(LFN)を提案する。
LFNからレイをレンダリングするには*single*ネットワークの評価しか必要としない。
論文 参考訳(メタデータ) (2021-06-04T17:54:49Z) - Learning Deformable Tetrahedral Meshes for 3D Reconstruction [78.0514377738632]
学習に基づく3次元再構成に対応する3次元形状表現は、機械学習とコンピュータグラフィックスにおいてオープンな問題である。
ニューラル3D再構成に関するこれまでの研究は、利点だけでなく、ポイントクラウド、ボクセル、サーフェスメッシュ、暗黙の関数表現といった制限も示していた。
Deformable Tetrahedral Meshes (DefTet) を, ボリューム四面体メッシュを再構成問題に用いるパラメータ化として導入する。
論文 参考訳(メタデータ) (2020-11-03T02:57:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。