論文の概要: FAR: Flexible, Accurate and Robust 6DoF Relative Camera Pose Estimation
- arxiv url: http://arxiv.org/abs/2403.03221v1
- Date: Tue, 5 Mar 2024 18:59:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 13:45:00.138057
- Title: FAR: Flexible, Accurate and Robust 6DoF Relative Camera Pose Estimation
- Title(参考訳): FAR: フレキシブルで高精度でロバストな6DoF相対カメラ
- Authors: Chris Rockwell, Nilesh Kulkarni, Linyi Jin, Jeong Joon Park, Justin
Johnson, David F. Fouhey
- Abstract要約: 画像間の相対的なカメラのポーズを推定することは、コンピュータビジョンにおいて中心的な問題となっている。
私たちのアプローチは、正確かつ堅牢な結果をもたらします。
包括的解析は設計選択をサポートし,提案手法が様々な特徴抽出器や対応推定器に柔軟に適用可能であることを示す。
- 参考スコア(独自算出の注目度): 30.710296843150832
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating relative camera poses between images has been a central problem in
computer vision. Methods that find correspondences and solve for the
fundamental matrix offer high precision in most cases. Conversely, methods
predicting pose directly using neural networks are more robust to limited
overlap and can infer absolute translation scale, but at the expense of reduced
precision. We show how to combine the best of both methods; our approach yields
results that are both precise and robust, while also accurately inferring
translation scales. At the heart of our model lies a Transformer that (1)
learns to balance between solved and learned pose estimations, and (2) provides
a prior to guide a solver. A comprehensive analysis supports our design choices
and demonstrates that our method adapts flexibly to various feature extractors
and correspondence estimators, showing state-of-the-art performance in 6DoF
pose estimation on Matterport3D, InteriorNet, StreetLearn, and Map-free
Relocalization.
- Abstract(参考訳): 画像間の相対的なカメラのポーズを推定することは、コンピュータビジョンの中心的な問題である。
対応を見つけ、基本行列を解く手法は、ほとんどの場合、高い精度をもたらす。
逆に、ニューラルネットワークを直接使用するポーズを予測する手法は、重複が制限されるほど堅牢であり、絶対的な翻訳スケールを推定できるが、精度の低下を犠牲にすることができる。
私たちのアプローチは、正確かつ堅牢な結果をもたらすと同時に、翻訳スケールを正確に推測します。
モデルの中心にあるトランスフォーマーは,(1)解くポーズ推定と学習したポーズ推定のバランスをとることを学び,(2)解法を導く前に提示する。
総合分析により,提案手法は様々な特徴抽出器や対応推定器に柔軟に対応し,matterport3d,insidenet,streetlearn,map-free relocalizationにおける6dofポーズ推定における最先端の性能を示す。
関連論文リスト
- Cameras as Rays: Pose Estimation via Ray Diffusion [57.32374715650491]
カメラのポーズを推定することは3D再構築の基本的な課題であり、まばらな視点では依然として挑戦的である。
本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。
提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-22T18:59:56Z) - iComMa: Inverting 3D Gaussians Splatting for Camera Pose Estimation via
Comparing and Matching [15.47627732847216]
コンピュータビジョンにおける6次元ポーズ推定問題に対処するため,iComMaという手法を提案する。
ポーズ推定を3次元ガウススティング(3DGS)の逆転問題としてモデル化する。
このフレームワークは、レンダリング・アンド・コンパレートとマッチングベースのアプローチの特徴的な特徴と固有の理論的根拠を体系的に取り入れている。
論文 参考訳(メタデータ) (2023-12-14T15:31:33Z) - ImPosIng: Implicit Pose Encoding for Efficient Camera Pose Estimation [2.6808541153140077]
暗黙の詩。
(ImPosing)はイメージとカメラのポーズを2つの別々のニューラルネットワークで共通の潜在表現に埋め込む。
階層的な方法で潜在空間を通して候補を評価することにより、カメラの位置と向きを直接回帰するのではなく、洗練する。
論文 参考訳(メタデータ) (2022-05-05T13:33:25Z) - RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust
Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。
この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。
各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文 参考訳(メタデータ) (2022-03-24T06:24:55Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z) - TransPose: Real-time 3D Human Translation and Pose Estimation with Six
Inertial Sensors [7.565581566766422]
今回紹介するTransPoseは、わずか6つの慣性測定ユニット(IMU)から90fps以上でフルモーションキャプチャを実行するDNNベースのアプローチです。
身体のポーズ推定には, 葉間関節位置を中間結果として推定する多段階ネットワークを提案する。
グローバル翻訳推定のために,グローバル翻訳を頑健に解くためのサポートフット法とRNN法を提案する。
論文 参考訳(メタデータ) (2021-05-10T18:41:42Z) - Learning Accurate Dense Correspondences and When to Trust Them [161.76275845530964]
2つの画像に関連する密度の高い流れ場と、堅牢な画素方向の信頼度マップの推定を目指しています。
フロー予測とその不確実性を共同で学習するフレキシブルな確率的アプローチを開発する。
本手法は,幾何学的マッチングと光フローデータセットに挑戦する最新の結果を得る。
論文 参考訳(メタデータ) (2021-01-05T18:54:11Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。