論文の概要: Refinement for Absolute Pose Regression with Neural Feature Synthesis
- arxiv url: http://arxiv.org/abs/2303.10087v1
- Date: Fri, 17 Mar 2023 16:10:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-20 14:00:19.550246
- Title: Refinement for Absolute Pose Regression with Neural Feature Synthesis
- Title(参考訳): 神経特徴合成による絶対ポーズ回帰の精密化
- Authors: Shuai Chen, Yash Bhalgat, Xinghui Li, Jiawang Bian, Kejie Li, Zirui
Wang, Victor Adrian Prisacariu
- Abstract要約: ニューラル・フィーチャー・シンセサイザー(NeFeS)と呼ばれる新しいモデルを提案する。
提案手法は, トレーニング中に3次元幾何学的特徴を符号化し, テスト時に高密度な新しいビュー特徴をレンダリングすることにより, 推定カメラのポーズを精査する。
提案手法は,室内および屋外のベンチマークデータセットにおいて,最先端のシングルイメージAPR精度を54.9%向上させる。
- 参考スコア(独自算出の注目度): 24.146438286231852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Absolute Pose Regression (APR) methods use deep neural networks to directly
regress camera poses from RGB images. Despite their advantages in inference
speed and simplicity, these methods still fall short of the accuracy achieved
by geometry-based techniques. To address this issue, we propose a new model
called the Neural Feature Synthesizer (NeFeS). Our approach encodes 3D
geometric features during training and renders dense novel view features at
test time to refine estimated camera poses from arbitrary APR methods. Unlike
previous APR works that require additional unlabeled training data, our method
leverages implicit geometric constraints during test time using a robust
feature field. To enhance the robustness of our NeFeS network, we introduce a
feature fusion module and a progressive training strategy. Our proposed method
improves the state-of-the-art single-image APR accuracy by as much as 54.9% on
indoor and outdoor benchmark datasets without additional time-consuming
unlabeled data training.
- Abstract(参考訳): APR(Absolute Pose Regression)メソッドは、ディープニューラルネットワークを使用して、RGBイメージからカメラのポーズを直接回帰する。
推論速度と単純さの利点にもかかわらず、これらの手法は幾何に基づく手法によって達成された正確さに欠ける。
この問題に対処するため,ニューラル・フィーチャー・シンセサイザー (NeFeS) と呼ばれる新しいモデルを提案する。
提案手法は, トレーニング中の3次元幾何学的特徴を符号化し, 任意のAPR手法から推定カメラのポーズを精査する。
ラベルなしのトレーニングデータを必要とする以前のAPR作業とは異なり、ロバストな機能フィールドを使用してテスト時間中に暗黙的な幾何的制約を利用する。
NeFeSネットワークの堅牢性を高めるために,機能融合モジュールとプログレッシブトレーニング戦略を導入する。
提案手法は,非ラベルデータトレーニングに要しない屋内および屋外ベンチマークデータセットにおいて,最先端のシングルイメージAPR精度を54.9%向上させる。
関連論文リスト
- 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - SG-NeRF: Neural Surface Reconstruction with Scene Graph Optimization [16.460851701725392]
本稿では,外乱ポーズの影響を軽減するため,シーングラフを用いた放射場最適化手法を提案する。
本手法では,シーングラフに基づく適応型不整合・不整合信頼度推定手法を取り入れた。
また、カメラのポーズと表面形状を最適化するために、効果的な交叉結合(IoU)損失を導入する。
論文 参考訳(メタデータ) (2024-07-17T15:50:17Z) - DFNet: Enhance Absolute Pose Regression with Direct Feature Matching [16.96571417692014]
絶対ポーズ回帰(APR)と直接特徴マッチングを組み合わせたカメラ再局在パイプラインを導入する。
提案手法は,既存の1画像のAPR手法を最大56%上回る精度で3次元構造法に匹敵する精度を実現する。
論文 参考訳(メタデータ) (2022-04-01T16:39:16Z) - LENS: Localization enhanced by NeRF synthesis [3.4386226615580107]
アルゴリズムのNeRFクラスによって描画された追加の合成データセットにより、カメラポーズの回帰が向上することを示す。
我々はさらに、トレーニング中のデータ拡張として、合成現実的および幾何学的一貫した画像を用いて、ポーズ回帰器の局所化精度を向上した。
論文 参考訳(メタデータ) (2021-10-13T08:15:08Z) - Scene Synthesis via Uncertainty-Driven Attribute Synchronization [52.31834816911887]
本稿では,3次元シーンの多様な特徴パターンを捉えるニューラルシーン合成手法を提案する。
提案手法は,ニューラルネットワークと従来のシーン合成手法の双方の長所を結合する。
論文 参考訳(メタデータ) (2021-08-30T19:45:07Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Neural Descent for Visual 3D Human Pose and Shape [67.01050349629053]
入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。
我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。
我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
論文 参考訳(メタデータ) (2020-08-16T13:38:41Z) - PaMIR: Parametric Model-Conditioned Implicit Representation for
Image-based Human Reconstruction [67.08350202974434]
本研究では,パラメトリックボディモデルと自由形深部暗黙関数を組み合わせたパラメトリックモデル記述型暗黙表現(PaMIR)を提案する。
本手法は, 挑戦的なポーズや衣料品のタイプにおいて, 画像に基づく3次元再構築のための最先端性能を実現する。
論文 参考訳(メタデータ) (2020-07-08T02:26:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。