論文の概要: PCM-NeRF: Probabilistic Camera Modeling for Neural Radiance Fields under Pose Uncertainty
- arxiv url: http://arxiv.org/abs/2604.17831v1
- Date: Mon, 20 Apr 2026 05:34:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.713002
- Title: PCM-NeRF: Probabilistic Camera Modeling for Neural Radiance Fields under Pose Uncertainty
- Title(参考訳): PCM-NeRF:不確実性を考慮したニューラルラジアンス場の確率論的カメラモデリング
- Authors: Shravan Venkatraman, Rakesh Raj Madavan, Pavan Kumar Sathya Venkatesh,
- Abstract要約: 我々は,脳表面の再構成をカメラごとの学習不確実性で強化する確率的フレームワークであるPCM-NeRFを提案する。
厳密なポーズオフレイアを持つ挑戦シーンの実験は、PCM-NeRFが常に最先端の手法より優れていることを示した。
- 参考スコア(独自算出の注目度): 1.529342790344802
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural surface reconstruction methods typically treat camera poses as fixed values, assuming perfect accuracy from Structure-from-Motion (SfM) systems. This assumption breaks down with imperfect pose estimates, leading to distorted or incomplete reconstructions. We present PCM-NeRF, a probabilistic framework that augments neural surface reconstruction with per-camera learnable uncertainty, built on top of SG-NeRF. Rather than treating all cameras equally throughout optimization, we represent each pose as a distribution with a learnable mean and variance, initialized from SfM correspondence quality. An uncertainty regularization loss couples the learned variance to view confidence, and the resulting uncertainty directly modulates the effective pose learning rate: uncertain cameras receive damped gradient updates, preventing poorly initialized views from corrupting the reconstruction. This lightweight mechanism requires no changes to the rendering pipeline and adds negligible overhead. Experiments on challenging scenes with severe pose outliers demonstrate that PCM-NeRF consistently outperforms state-of-the-art methods in both Chamfer Distance and F-Score, particularly for geometrically complex structures, without requiring foreground masks.
- Abstract(参考訳): 神経表面再構成法は通常、Structure-from-Motion (SfM)システムから完全な精度を仮定して、カメラのポーズを固定値として扱う。
この仮定は不完全なポーズ推定によって崩壊し、歪んだり不完全な再構築につながる。
本稿では,SG-NeRF上に構築したPCM-NeRFについて述べる。
最適化を通して全てのカメラを等しく扱うのではなく、SfM対応品質から初期化した学習可能な平均と分散の分布として、各ポーズを表現している。
不確実性正規化損失は、学習した分散と信頼を一致させ、結果として生じる不確実性は、効果的なポーズ学習率を直接調節する:不確実性カメラは減衰した勾配更新を受け、初期化されていないビューが再構成を損なうのを防ぐ。
この軽量なメカニズムはレンダリングパイプラインの変更を必要とせず、無視可能なオーバーヘッドを追加する。
PCM-NeRFは、前景マスクを必要とせず、特に幾何学的に複雑な構造において、シャンファー距離とFスコアの両方において、常に最先端の手法よりも優れていることを示す。
関連論文リスト
- Spinverse: Differentiable Physics for Permeability-Aware Microstructure Reconstruction from Diffusion MRI [1.6863755729554886]
我々は,dMRI計測を反転させる透過性を考慮した再構成手法であるSpinverseを提案する。
スピンバースは固定された四面体格子上の組織を表し、各内面透過性を学習可能なパラメータとして扱う。
多様な測地を再構成し、配列スケジューリングと正規化がアウトラインのみの解を避けるために重要であることを示す。
論文 参考訳(メタデータ) (2026-03-04T21:57:40Z) - LensNet: An End-to-End Learning Framework for Empirical Point Spread Function Modeling and Lensless Imaging Reconstruction [32.85180149439811]
レンズレスイメージングは、従来のレンズベースのシステムに代わる有望な選択肢である。
従来のレンズレス技術は、しばしば明示的な校正と広範な前処理を必要とする。
本研究では,空間領域と周波数領域の表現を統合したエンドツーエンドのディープラーニングフレームワークであるLensNetを提案する。
論文 参考訳(メタデータ) (2025-05-03T09:11:52Z) - Perceptual-Distortion Balanced Image Super-Resolution is a Multi-Objective Optimization Problem [23.833099288826045]
画素ベースの回帰損失を用いた単一画像超解法(SISR)モデルのトレーニングは、高い歪みメトリクススコアを得ることができる。
しかし、高周波の詳細の回復が不十分なため、しばしばぼやけた画像が生じる。
本稿では,Multi-Objective Optimization(MOO)をSISRモデルのトレーニングプロセスに組み込んで,知覚品質と歪みのバランスをとる手法を提案する。
論文 参考訳(メタデータ) (2024-09-05T02:14:04Z) - Indoor Scene Reconstruction with Fine-Grained Details Using Hybrid Representation and Normal Prior Enhancement [50.56517624931987]
多視点RGB画像からの室内シーンの再構成は、平坦領域とテクスチャレス領域の共存により困難である。
近年の手法では、予測された表面正規化によって支援されたニューラルラジアンス場を利用してシーン形状を復元している。
本研究は, 上記の制限に対処して, 高忠実度表面を細かな詳細で再構築することを目的とする。
論文 参考訳(メタデータ) (2023-09-14T12:05:29Z) - CamP: Camera Preconditioning for Neural Radiance Fields [56.46526219931002]
NeRFは、オブジェクトと大規模シーンの高忠実度3Dシーン再構成を得るために最適化することができる。
外部および固有のカメラパラメータは通常、NeRFの前処理ステップとしてStructure-from-Motion (SfM)法を用いて推定される。
本稿では,カメラパラメータ間の相関をなくし,その効果を正規化するホワイトニング変換を代用問題として提案する。
論文 参考訳(メタデータ) (2023-08-21T17:59:54Z) - MELON: NeRF with Unposed Images in SO(3) [35.093700416540436]
ニューラルネットワークは、非提示画像から最先端の精度でニューラルラジアンス場を再構築でき、対向的アプローチの10倍のビューを必要とすることを示す。
ニューラルネットを用いてポーズ推定を正則化することにより,提案手法は非ポーズ画像から最先端の精度でニューラルレイディアンス場を再構築し,敵のアプローチの10倍のビューを要求できることを示した。
論文 参考訳(メタデータ) (2023-03-14T17:33:39Z) - Robustifying the Multi-Scale Representation of Neural Radiance Fields [86.69338893753886]
実世界の画像の両問題を克服するために,頑健なマルチスケールニューラルラジアンス場表現手法を提案する。
提案手法は,NeRFにインスパイアされたアプローチを用いて,マルチスケール画像効果とカメラ位置推定問題に対処する。
例えば、日常的に取得したマルチビュー画像からオブジェクトの正確な神経表現を行うためには、カメラの正確な位置推定が不可欠であることを示す。
論文 参考訳(メタデータ) (2022-10-09T11:46:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。