論文の概要: MonoPatchNeRF: Improving Neural Radiance Fields with Patch-based Monocular Guidance
- arxiv url: http://arxiv.org/abs/2404.08252v2
- Date: Thu, 22 Aug 2024 07:42:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-23 19:25:36.524332
- Title: MonoPatchNeRF: Improving Neural Radiance Fields with Patch-based Monocular Guidance
- Title(参考訳): MonoPatchNeRF: パッチに基づく単眼誘導による神経放射場の改善
- Authors: Yuqun Wu, Jae Yong Lee, Chuhang Zou, Shenlong Wang, Derek Hoiem,
- Abstract要約: 最新の正規化ニューラルラジアンス・フィールド(NeRF)アプローチは、大規模なスパース・ビュー・シーンの幾何学とビュー外挿を損なう。
我々は密度に基づくアプローチを採り、個々の光線の代わりにパッチをサンプリングし、単分子深度と通常の推定値をよりよく組み込む。
提案手法はETH3Dベンチマークの幾何精度を大幅に向上させる。
- 参考スコア(独自算出の注目度): 29.267039546199094
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The latest regularized Neural Radiance Field (NeRF) approaches produce poor geometry and view extrapolation for large scale sparse view scenes, such as ETH3D. Density-based approaches tend to be under-constrained, while surface-based approaches tend to miss details. In this paper, we take a density-based approach, sampling patches instead of individual rays to better incorporate monocular depth and normal estimates and patch-based photometric consistency constraints between training views and sampled virtual views. Loosely constraining densities based on estimated depth aligned to sparse points further improves geometric accuracy. While maintaining similar view synthesis quality, our approach significantly improves geometric accuracy on the ETH3D benchmark, e.g. increasing the F1@2cm score by 4x-8x compared to other regularized density-based approaches, with much lower training and inference time than other approaches.
- Abstract(参考訳): 最新の正規化ニューラルラジアンス・フィールド(NeRF)アプローチは、ETH3Dのような大規模なスパース・ビュー・シーンに対して、ジオメトリーとビューの外挿が貧弱である。
密度ベースのアプローチは制約下にある傾向があり、表面ベースのアプローチは詳細を見逃す傾向にある。
本稿では、密度に基づくアプローチ、個々の光線の代わりにパッチをサンプリングし、単眼深度と通常の推定値、およびトレーニングビューとサンプル仮想ビュー間のパッチベースの光度整合性制約をよりよく組み込む。
スパース点に整合した推定深度に基づく粗く制約された密度は、幾何学的精度をさらに向上させる。
ETH3Dベンチマークでは,他の正規化密度に基づく手法に比べてF1@2cmのスコアを4x-8倍増加させ,トレーニングや推論時間を大幅に短縮する。
関連論文リスト
- SplatMAP: Online Dense Monocular SLAM with 3D Gaussian Splatting [7.2305711760924085]
本稿では,高忠実度3DGSに高密度SLAMを組み込むことにより,リアルタイム・高密度化を実現するフレームワークを提案する。
本手法では,SLAMから高密度点雲を利用することにより,ガウスモデルを動的に更新・密度化するSLAM-Informed Adaptive Densificationを導入する。
ReplicaとTUM-RGBDデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2025-01-13T02:28:13Z) - Relative Pose Estimation through Affine Corrections of Monocular Depth Priors [69.59216331861437]
本研究では,独立なアフィン(スケールとシフト)のあいまいさを明示的に考慮した相対ポーズ推定のための3つの解法を開発した。
提案する解法と古典的点ベース解法とエピポーラ制約を組み合わせたハイブリッド推定パイプラインを提案する。
論文 参考訳(メタデータ) (2025-01-09T18:58:30Z) - AGS-Mesh: Adaptive Gaussian Splatting and Meshing with Geometric Priors for Indoor Room Reconstruction Using Smartphones [19.429461194706786]
室内シーンの正確な3次元再構成のためのガウススメッティング法における接合面深度と正規化のアプローチを提案する。
我々のフィルタリング戦略と最適化設計は、メッシュ推定と新規ビュー合成の両方において大きな改善を示す。
論文 参考訳(メタデータ) (2024-11-28T17:04:32Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - Binocular-Guided 3D Gaussian Splatting with View Consistency for Sparse View Synthesis [53.702118455883095]
本稿では,ガウススプラッティングを用いたスパースビューから新しいビューを合成する新しい手法を提案する。
私たちのキーとなるアイデアは、両眼画像間の両眼立体的一貫性に固有の自己超越を探索することにあります。
我々の手法は最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2024-10-24T15:10:27Z) - Uncertainty-guided Optimal Transport in Depth Supervised Sparse-View 3D Gaussian [49.21866794516328]
3次元ガウシアンスプラッティングは、リアルタイムな新規ビュー合成において顕著な性能を示した。
これまでのアプローチでは、3Dガウスの訓練に奥行き監視を取り入れ、オーバーフィッティングを軽減してきた。
本研究では,3次元ガウスの深度分布を可視化する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-30T03:18:30Z) - A Neural Height-Map Approach for the Binocular Photometric Stereo
Problem [36.404880059833324]
双眼鏡測光ステレオ(PS)フレームワークは単視PSと同じ取得速度を持つが、推定幾何の質は著しく向上する。
本手法は両眼立体装置に適応したDiLiGenT-MVデータセットの最先端性能と新しい両眼測光ステレオデータセットLUCES-STを実現する。
論文 参考訳(メタデータ) (2023-11-10T09:45:53Z) - Investigating Spherical Epipolar Rectification for Multi-View Stereo 3D
Reconstruction [1.0152838128195467]
主線の違いによる歪みを最小限に抑えるために, エピポーラ補正のための球面モデルを提案する。
提案手法がフレームベースのエピポーラ補正よりも優れていることを示す定性的,定量的評価を行った。
論文 参考訳(メタデータ) (2022-04-08T15:50:20Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。