論文の概要: Parallel Inversion of Neural Radiance Fields for Robust Pose Estimation
- arxiv url: http://arxiv.org/abs/2210.10108v1
- Date: Tue, 18 Oct 2022 19:09:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 15:23:06.334944
- Title: Parallel Inversion of Neural Radiance Fields for Robust Pose Estimation
- Title(参考訳): ロバストポーズ推定のためのニューラルラジアンス場の並列インバージョン
- Authors: Yunzhi Lin, Thomas M\"uller, Jonathan Tremblay, Bowen Wen, Stephen
Tyree, Alex Evans, Patricio A. Vela, Stan Birchfield
- Abstract要約: 6-DoFターゲットのポーズを推定するための高速ニューラルネットワーク場(NeRF)に基づく並列最適化手法を提案する。
高速NeRFモデルから描画された画素と観測画像中の画素との残差を最小化することにより、カメラの変換と回転を予測できる。
実験により,本手法は,合成ベンチマークと実世界のベンチマークの両方において,一般化とロバスト性を向上できることを示した。
- 参考スコア(独自算出の注目度): 26.987638406423123
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a parallelized optimization method based on fast Neural Radiance
Fields (NeRF) for estimating 6-DoF target poses. Given a single observed RGB
image of the target, we can predict the translation and rotation of the camera
by minimizing the residual between pixels rendered from a fast NeRF model and
pixels in the observed image. We integrate a momentum-based camera extrinsic
optimization procedure into Instant Neural Graphics Primitives, a recent
exceptionally fast NeRF implementation. By introducing parallel Monte Carlo
sampling into the pose estimation task, our method overcomes local minima and
improves efficiency in a more extensive search space. We also show the
importance of adopting a more robust pixel-based loss function to reduce error.
Experiments demonstrate that our method can achieve improved generalization and
robustness on both synthetic and real-world benchmarks.
- Abstract(参考訳): 6-DoFターゲットポーズを推定するための高速ニューラルネットワーク場(NeRF)に基づく並列最適化手法を提案する。
観測対象の1枚のRGB画像から、高速NeRFモデルから描画された画素と観測画像中の画素との残差を最小化することにより、カメラの変換と回転を予測できる。
Instant Neural Graphics Primitivesには,運動量に基づくカメラの外部最適化手法が組み込まれている。
ポーズ推定タスクに並列モンテカルロサンプリングを導入することで,局所的ミニマを克服し,より広範囲な探索空間における効率を向上させる。
また,よりロバストな画素ベース損失関数を採用し,誤差を低減することの重要性を示す。
実験により,本手法は,合成ベンチマークと実世界のベンチマークの両方において,一般化と堅牢性を向上できることを示した。
関連論文リスト
- BID-NeRF: RGB-D image pose estimation with inverted Neural Radiance
Fields [0.0]
Inverted Neural Radiance Fields (iNeRF) アルゴリズムの改良を目標とし、画像ポーズ推定問題をNeRFに基づく反復線形最適化として定義する。
NeRFは、現実世界のシーンやオブジェクトのフォトリアリスティックな新しいビューを合成できる新しい空間表現モデルである。
論文 参考訳(メタデータ) (2023-10-05T14:27:06Z) - ACDMSR: Accelerated Conditional Diffusion Models for Single Image
Super-Resolution [84.73658185158222]
本稿では,ACDMSRと呼ばれる拡散モデルに基づく超解像法を提案する。
提案手法は, 決定論的反復分解過程を通じて超解像を行うために, 標準拡散モデルに適応する。
提案手法は,低解像度画像に対してより視覚的に現実的な表現を生成し,現実的なシナリオにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2023-07-03T06:49:04Z) - NerfingMVS: Guided Optimization of Neural Radiance Fields for Indoor
Multi-view Stereo [97.07453889070574]
本稿では,従来のSfM再構成と学習に基づく先行手法を併用した多視点深度推定手法を提案する。
提案手法は室内シーンにおける最先端手法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2021-09-02T17:54:31Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - ROSEFusion: Random Optimization for Online Dense Reconstruction under
Fast Camera Motion [15.873973449155313]
RGB-Dシーケンスに基づく再構成は、これまで比較的遅いカメラ動作(1m/s)に抑制されてきた。
高速モーションは深度融合に2つの課題をもたらす:1)フレーム間の大きな回転によるカメラポーズ最適化の非線形性、2)動きのぼかしによる確実に追跡可能な特徴の欠如。
ランダム最適化による慣性測定がない場合の高速移動カメラ追跡の難しさに対処することを提案する。
効率的なテンプレートベースパーティクルセットの進化と効果的なフィットネス機能により,高速カメラ動作(最大4m/s)下での良好な姿勢追跡を実現する。
論文 参考訳(メタデータ) (2021-05-12T11:37:34Z) - Robust 360-8PA: Redesigning The Normalized 8-point Algorithm for 360-FoV
Images [53.11097060367591]
球面投影における360-fov画像から本質行列を推定する新しい手法を提案する。
我々の正規化は、時間を大幅に上回ることなく、カメラの精度を約20%向上させることができることを示す。
論文 参考訳(メタデータ) (2021-04-22T07:23:11Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - Deep Generative Adversarial Residual Convolutional Networks for
Real-World Super-Resolution [31.934084942626257]
我々は,超解像残差畳み込み生成共役ネットワーク(SRResCGAN)を提案する。
これは、生成したLRドメインからHRドメインの画素単位の監督でモデルを逆トレーニングすることで、現実世界の劣化設定に従う。
提案するネットワークは,画像の高精細化と凸最適化によるエネルギーベース目的関数の最小化により,残差学習を利用する。
論文 参考訳(メタデータ) (2020-05-03T00:12:38Z) - Single-Image HDR Reconstruction by Learning to Reverse the Camera
Pipeline [100.5353614588565]
本稿では,LDR画像形成パイプラインの領域知識をモデルに組み込むことを提案する。
我々は,HDRto-LDR画像形成パイプラインを(1)ダイナミックレンジクリッピング,(2)カメラ応答関数からの非線形マッピング,(3)量子化としてモデル化する。
提案手法は,最先端の単一画像HDR再構成アルゴリズムに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2020-04-02T17:59:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。