論文の概要: MonoPatchNeRF: Improving Neural Radiance Fields with Patch-based Monocular Guidance
- arxiv url: http://arxiv.org/abs/2404.08252v2
- Date: Thu, 22 Aug 2024 07:42:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-23 19:25:36.524332
- Title: MonoPatchNeRF: Improving Neural Radiance Fields with Patch-based Monocular Guidance
- Title(参考訳): MonoPatchNeRF: パッチに基づく単眼誘導による神経放射場の改善
- Authors: Yuqun Wu, Jae Yong Lee, Chuhang Zou, Shenlong Wang, Derek Hoiem,
- Abstract要約: 最新の正規化ニューラルラジアンス・フィールド(NeRF)アプローチは、大規模なスパース・ビュー・シーンの幾何学とビュー外挿を損なう。
我々は密度に基づくアプローチを採り、個々の光線の代わりにパッチをサンプリングし、単分子深度と通常の推定値をよりよく組み込む。
提案手法はETH3Dベンチマークの幾何精度を大幅に向上させる。
- 参考スコア(独自算出の注目度): 29.267039546199094
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The latest regularized Neural Radiance Field (NeRF) approaches produce poor geometry and view extrapolation for large scale sparse view scenes, such as ETH3D. Density-based approaches tend to be under-constrained, while surface-based approaches tend to miss details. In this paper, we take a density-based approach, sampling patches instead of individual rays to better incorporate monocular depth and normal estimates and patch-based photometric consistency constraints between training views and sampled virtual views. Loosely constraining densities based on estimated depth aligned to sparse points further improves geometric accuracy. While maintaining similar view synthesis quality, our approach significantly improves geometric accuracy on the ETH3D benchmark, e.g. increasing the F1@2cm score by 4x-8x compared to other regularized density-based approaches, with much lower training and inference time than other approaches.
- Abstract(参考訳): 最新の正規化ニューラルラジアンス・フィールド(NeRF)アプローチは、ETH3Dのような大規模なスパース・ビュー・シーンに対して、ジオメトリーとビューの外挿が貧弱である。
密度ベースのアプローチは制約下にある傾向があり、表面ベースのアプローチは詳細を見逃す傾向にある。
本稿では、密度に基づくアプローチ、個々の光線の代わりにパッチをサンプリングし、単眼深度と通常の推定値、およびトレーニングビューとサンプル仮想ビュー間のパッチベースの光度整合性制約をよりよく組み込む。
スパース点に整合した推定深度に基づく粗く制約された密度は、幾何学的精度をさらに向上させる。
ETH3Dベンチマークでは,他の正規化密度に基づく手法に比べてF1@2cmのスコアを4x-8倍増加させ,トレーニングや推論時間を大幅に短縮する。
関連論文リスト
- PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - Binocular-Guided 3D Gaussian Splatting with View Consistency for Sparse View Synthesis [53.702118455883095]
本稿では,ガウススプラッティングを用いたスパースビューから新しいビューを合成する新しい手法を提案する。
私たちのキーとなるアイデアは、両眼画像間の両眼立体的一貫性に固有の自己超越を探索することにあります。
我々の手法は最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2024-10-24T15:10:27Z) - RaNeuS: Ray-adaptive Neural Surface Reconstruction [87.20343320266215]
微分可能放射場 eg NeRF を利用して、新しいビューレンダリングを生成するとともに、詳細な3次元表面を再構成する。
本研究では,SDFから放射場への射影を一様等間隔のアイコニカル正規化で定式化し,最適化することを考えると,光度重み付け係数を改良する。
提案する textitRaNeuS は,合成データと実データの両方で広く評価されている。
論文 参考訳(メタデータ) (2024-06-14T07:54:25Z) - Uncertainty-guided Optimal Transport in Depth Supervised Sparse-View 3D Gaussian [49.21866794516328]
3次元ガウシアンスプラッティングは、リアルタイムな新規ビュー合成において顕著な性能を示した。
これまでのアプローチでは、3Dガウスの訓練に奥行き監視を取り入れ、オーバーフィッティングを軽減してきた。
本研究では,3次元ガウスの深度分布を可視化する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-30T03:18:30Z) - $ν$-DBA: Neural Implicit Dense Bundle Adjustment Enables Image-Only Driving Scene Reconstruction [31.64067619807023]
$nu$-DBAは、地図パラメトリゼーションのための3次元暗黙曲面を用いた幾何学的密集束調整(DBA)を実装している。
我々は、高密度マッピングの品質をさらに向上するために、シーンごとの自己スーパービジョンで光学フローモデルを微調整する。
論文 参考訳(メタデータ) (2024-04-29T05:29:26Z) - A Neural Height-Map Approach for the Binocular Photometric Stereo
Problem [36.404880059833324]
双眼鏡測光ステレオ(PS)フレームワークは単視PSと同じ取得速度を持つが、推定幾何の質は著しく向上する。
本手法は両眼立体装置に適応したDiLiGenT-MVデータセットの最先端性能と新しい両眼測光ステレオデータセットLUCES-STを実現する。
論文 参考訳(メタデータ) (2023-11-10T09:45:53Z) - GARF:Geometry-Aware Generalized Neural Radiance Field [47.76524984421343]
本稿では,GADS(Geometry-Aware Generalized Neural Radiance Field)戦略を用いたGARF(Geometry-Aware Generalized Neural Radiance Field)を提案する。
筆者らのフレームワークは,画素スケールと幾何学スケールの両方において,わずかに入力画像で見えないシーンを推測する。
屋内および屋外のデータセットの実験では、GARFはレンダリング品質と3次元幾何推定を改善しながら、サンプルを25%以上削減している。
論文 参考訳(メタデータ) (2022-12-05T14:00:59Z) - Investigating Spherical Epipolar Rectification for Multi-View Stereo 3D
Reconstruction [1.0152838128195467]
主線の違いによる歪みを最小限に抑えるために, エピポーラ補正のための球面モデルを提案する。
提案手法がフレームベースのエピポーラ補正よりも優れていることを示す定性的,定量的評価を行った。
論文 参考訳(メタデータ) (2022-04-08T15:50:20Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。