論文の概要: ImPosIng: Implicit Pose Encoding for Efficient Camera Pose Estimation
- arxiv url: http://arxiv.org/abs/2205.02638v1
- Date: Thu, 5 May 2022 13:33:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-06 15:37:29.263201
- Title: ImPosIng: Implicit Pose Encoding for Efficient Camera Pose Estimation
- Title(参考訳): 効率的なカメラポーズ推定のための暗黙的ポーズ符号化
- Authors: Arthur Moreau, Thomas Gilles, Nathan Piasco, Dzmitry Tsishkou, Bogdan
Stanciulescu, Arnaud de La Fortelle
- Abstract要約: 暗黙の詩。
(ImPosing)はイメージとカメラのポーズを2つの別々のニューラルネットワークで共通の潜在表現に埋め込む。
階層的な方法で潜在空間を通して候補を評価することにより、カメラの位置と向きを直接回帰するのではなく、洗練する。
- 参考スコア(独自算出の注目度): 2.6808541153140077
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We propose a novel learning-based formulation for camera pose estimation that
can perform relocalization accurately and in real-time in city-scale
environments. Camera pose estimation algorithms determine the position and
orientation from which an image has been captured, using a set of
geo-referenced images or 3D scene representation. Our new localization
paradigm, named Implicit Pose Encoding (ImPosing), embeds images and camera
poses into a common latent representation with 2 separate neural networks, such
that we can compute a similarity score for each image-pose pair. By evaluating
candidates through the latent space in a hierarchical manner, the camera
position and orientation are not directly regressed but incrementally refined.
Compared to the representation used in structure-based relocalization methods,
our implicit map is memory bounded and can be properly explored to improve
localization performances against learning-based regression approaches. In this
paper, we describe how to effectively optimize our learned modules, how to
combine them to achieve real-time localization, and demonstrate results on
diverse large scale scenarios that significantly outperform prior work in
accuracy and computational efficiency.
- Abstract(参考訳): 本研究では,都市環境下でのリアルタイムかつ正確な位置推定が可能なカメラポーズ推定のための新しい学習型定式化を提案する。
カメラポーズ推定アルゴリズムは、ジオリファレンス画像のセットまたは3Dシーン表現を用いて、画像がキャプチャされた位置と向きを決定する。
新たなローカライゼーションパラダイムであるImplicit Pose Encoding(ImPosing)は、イメージとカメラのポーズを2つの別々のニューラルネットワークで共通潜伏表現に埋め込むことで、各画像配置ペアの類似度スコアを計算することができる。
潜在空間を階層的に評価することにより、カメラの位置と向きは直接後退するのではなく、段階的に洗練される。
構造に基づく再ローカライズ手法で用いられる表現と比較して、暗黙マップはメモリ境界であり、学習に基づく回帰アプローチに対するローカライズ性能を改善するために適切に検討することができる。
本稿では,学習モジュールを効果的に最適化する方法と,それらを組み合わせてリアルタイムなローカライゼーションを実現する方法について述べる。
関連論文リスト
- Cameras as Rays: Pose Estimation via Ray Diffusion [57.32374715650491]
カメラのポーズを推定することは3D再構築の基本的な課題であり、まばらな視点では依然として挑戦的である。
本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。
提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-22T18:59:56Z) - PoseMatcher: One-shot 6D Object Pose Estimation by Deep Feature Matching [51.142988196855484]
本稿では,PoseMatcherを提案する。
3ビューシステムに基づくオブジェクトと画像のマッチングのための新しいトレーニングパイプラインを作成します。
PoseMatcherは、画像とポイントクラウドの異なる入力モダリティに対応できるように、IO-Layerを導入します。
論文 参考訳(メタデータ) (2023-04-03T21:14:59Z) - RelPose: Predicting Probabilistic Relative Rotation for Single Objects
in the Wild [73.1276968007689]
本稿では、任意のオブジェクトの複数の画像からカメラ視点を推定するデータ駆動手法について述べる。
本手法は, 画像の鮮明さから, 最先端のSfM法とSLAM法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-11T17:59:59Z) - Deep Metric Learning for Ground Images [4.864819846886142]
我々は,現在のロボットの位置決めについて事前の知識がない初期位置決めタスクに対処する。
本稿では,クエリ画像に最もよく似た参照画像を取得するディープメトリック学習手法を提案する。
地上画像の既存の画像検索手法とは対照的に,提案手法はリコール性能が大幅に向上し,最先端のテクスチャベースローカライゼーション手法のローカライズ性能が向上する。
論文 参考訳(メタデータ) (2021-09-03T14:43:59Z) - On the Limits of Pseudo Ground Truth in Visual Camera Re-localisation [83.29404673257328]
再ローカライゼーションベンチマークは、各メソッドが参照アルゴリズムの結果をいかにうまく再現するかを測定する。
このことは、参照アルゴリズムの選択がある種の再ローカライゼーション手法を好むかどうかを問うものである。
本稿では、広く使われている2つの再ローカライゼーションデータセットを分析し、参照アルゴリズムの選択によって評価結果が実際に異なることを示す。
論文 参考訳(メタデータ) (2021-09-01T12:01:08Z) - Visual Camera Re-Localization Using Graph Neural Networks and Relative
Pose Supervision [31.947525258453584]
視覚再局在化とは、単一の画像を入力として、予め記録された環境に対してカメラの位置と向きを推定する手段である。
提案手法は特別な仮定をほとんど行わず,訓練やテストでは極めて軽量である。
標準の屋内(7-Scenes)と屋外(Cambridge Landmarks)のカメラ再ローカリゼーションベンチマークに対するアプローチの有効性を検証する。
論文 参考訳(メタデータ) (2021-04-06T14:29:03Z) - End-to-end learning of keypoint detection and matching for relative pose
estimation [1.8352113484137624]
2つの画像間の相対的なポーズを推定する新しい手法を提案する。
キーポイント検出,説明抽出,マッチング,ロバストなポーズ推定を共同で学習する。
本研究では,既知のポーズを持つ画像データベース内でのクエリ画像の視覚的局在化の手法を示す。
論文 参考訳(メタデータ) (2021-04-02T15:16:17Z) - Paying Attention to Activation Maps in Camera Pose Regression [4.232614032390374]
カメラポーズ回帰手法は、クエリ画像に単一のフォワードパスを適用してカメラポーズを推定する。
畳み込みアクティベーションマップをシーケンシャル入力として使用するポーズ回帰のための注意に基づくアプローチを提案する。
提案手法は,現代のポーズレグレッサー方式に好適に比較し,複数のベンチマークにまたがる最先端の精度を実現する。
論文 参考訳(メタデータ) (2021-03-21T20:10:15Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。