論文の概要: Improving Feature-based Visual Localization by Geometry-Aided Matching
- arxiv url: http://arxiv.org/abs/2211.08712v1
- Date: Wed, 16 Nov 2022 07:02:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 15:30:47.752872
- Title: Improving Feature-based Visual Localization by Geometry-Aided Matching
- Title(参考訳): 幾何マッチングによる特徴量に基づく視覚定位の改善
- Authors: Hailin Yu, Youji Feng, Weicai Ye, Mingxuan Jiang, Hujun Bao, Guofeng
Zhang
- Abstract要約: 外観情報と幾何学的文脈の両方を用いて2D-3D特徴マッチングを改善する新しい2D-3Dマッチング手法であるGeometry-Aided Matching (GAM)を導入する。
GAMは高精度を維持しながら2D-3Dマッチのリコールを大幅に強化することができる。
提案手法は,複数の視覚的ローカライゼーションデータセットの最先端結果を実現する。
- 参考スコア(独自算出の注目度): 21.1967752160412
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature matching is an essential step in visual localization, where the
accuracy of camera pose is mainly determined by the established 2D-3D
correspondence. Due to the noise, solving the camera pose accurately requires a
sufficient number of well-distributed 2D-3D correspondences. Existing 2D-3D
feature matching is typically achieved by finding the nearest neighbors in the
feature space, and then removing the outliers by some hand-crafted heuristics.
However, this may lead to a large number of potentially true matches being
missed or the established correct matches being filtered out. In this work, we
introduce a novel 2D-3D matching method, Geometry-Aided Matching (GAM), which
uses both appearance information and geometric context to improve 2D-3D feature
matching. GAM can greatly strengthen the recall of 2D-3D matches while
maintaining high precision. We insert GAM into a hierarchical visual
localization pipeline and show that GAM can effectively improve the robustness
and accuracy of localization. Extensive experiments show that GAM can find more
correct matches than hand-crafted heuristics and learning baselines. Our
proposed localization method achieves state-of-the-art results on multiple
visual localization datasets. Experiments on Cambridge Landmarks dataset show
that our method outperforms the existing state-of-the-art methods and is six
times faster than the top-performed method.
- Abstract(参考訳): 特徴マッチングは、カメラポーズの精度が確立された2D-3D対応によって決定される、視覚的位置決めにおける重要なステップである。
ノイズのため、カメラのポーズを正確に解くには十分な数の2D-3D対応が必要である。
既存の2d-3d特徴マッチングは、通常、特徴空間に最も近い隣接点を見つけ、手作りのヒューリスティックによって外れ値を取り除くことで達成される。
しかし、これは多くの真のマッチを見逃したり、確立された正しいマッチをフィルターアウトしたりする可能性がある。
本研究では,外観情報と幾何学的文脈の両方を用いて2D-3D特徴マッチングを改善する新しい2D-3Dマッチング手法であるGeometry-Aided Matching (GAM)を提案する。
GAMは高精度を維持しながら2D-3Dマッチのリコールを大幅に強化することができる。
我々はGAMを階層的な視覚的ローカライゼーションパイプラインに挿入し、GAMがローカライゼーションの堅牢性と精度を効果的に向上できることを示す。
大規模な実験により、GAMは手作りのヒューリスティックや学習ベースラインよりも正確な一致を見出すことができた。
提案手法は,複数の視覚的ローカライゼーションデータセットの最先端結果を実現する。
ケンブリッジランドマークデータセットにおける実験により,本手法は既存の最先端手法よりも優れており,トップパーフォーミング法よりも6倍高速であることが示された。
関連論文リスト
- Grounding Image Matching in 3D with MASt3R [8.14650201701567]
本稿では,トランスフォーマーをベースとした強力な3次元再構成フレームワークであるDUSt3Rによる3Dタスクのキャストマッチングを提案する。
我々は,DUSt3Rネットワークを高密度な局所的特徴を出力する新しいヘッドで拡張することを提案する。
提案手法はMASt3Rとよばれる手法で,複数のマッチングタスクにおいて技量を著しく上回っている。
論文 参考訳(メタデータ) (2024-06-14T06:46:30Z) - Learning to Produce Semi-dense Correspondences for Visual Localization [11.415451542216559]
本研究は,夜間シナリオ,悪天候,季節変化などの要求条件下で視覚的局所化を行うことの課題に対処する。
本稿では,高密度なキーポイントマッチングに基づいて,信頼性の高い半高密度2D-3Dマッチングポイントを抽出する手法を提案する。
ネットワークは幾何学的および視覚的な手がかりを用いて、観測されたキーポイントから観測されていないキーポイントの3D座標を効果的に推測する。
論文 参考訳(メタデータ) (2024-02-13T10:40:10Z) - EP2P-Loc: End-to-End 3D Point to 2D Pixel Localization for Large-Scale
Visual Localization [44.05930316729542]
本稿では,3次元点雲の大規模可視化手法EP2P-Locを提案する。
画像中の見えない3D点を除去する簡単なアルゴリズムを提案する。
このタスクで初めて、エンドツーエンドのトレーニングに差別化可能なツールを使用します。
論文 参考訳(メタデータ) (2023-09-14T07:06:36Z) - CheckerPose: Progressive Dense Keypoint Localization for Object Pose
Estimation with Graph Neural Network [66.24726878647543]
単一のRGB画像から固い物体の6-DoFのポーズを推定することは、非常に難しい課題である。
近年の研究では、高密度対応型解の大きな可能性を示している。
そこで本研究では,CheckerPoseというポーズ推定アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-29T17:30:53Z) - LFM-3D: Learnable Feature Matching Across Wide Baselines Using 3D
Signals [9.201550006194994]
学習可能なマーカは、画像ペア間のコビジュアビリティの小さな領域だけが存在する場合、しばしば性能が低下する。
グラフニューラルネットワークに基づくモデルを用いた学習可能な特徴マッチングフレームワーク LFM-3D を提案する。
その結果,画像対の相対的ポーズ精度が向上し,画像対の相対的ポーズ精度が向上することがわかった。
論文 参考訳(メタデータ) (2023-03-22T17:46:27Z) - RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。
表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文 参考訳(メタデータ) (2022-05-14T05:35:35Z) - Multi-initialization Optimization Network for Accurate 3D Human Pose and
Shape Estimation [75.44912541912252]
我々はMulti-Initialization Optimization Network(MION)という3段階のフレームワークを提案する。
第1段階では,入力サンプルの2次元キーポイントに適合する粗い3次元再構成候補を戦略的に選択する。
第2段階では, メッシュ改質トランス (MRT) を設計し, 自己保持機構を用いて粗い再構成結果をそれぞれ洗練する。
最後に,RGB画像の視覚的証拠が与えられた3次元再構成と一致するかどうかを評価することで,複数の候補から最高の結果を得るために,一貫性推定ネットワーク(CEN)を提案する。
論文 参考訳(メタデータ) (2021-12-24T02:43:58Z) - Soft Expectation and Deep Maximization for Image Feature Detection [68.8204255655161]
質問をひっくり返し、まず繰り返し可能な3Dポイントを探し、次に検出器を訓練して画像空間にローカライズする、反復的半教師付き学習プロセスSEDMを提案する。
以上の結果から,sdmを用いてトレーニングした新しいモデルでは,シーン内の下位3dポイントのローカライズが容易になった。
論文 参考訳(メタデータ) (2021-04-21T00:35:32Z) - Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled
Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。
我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。
アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文 参考訳(メタデータ) (2020-04-05T12:52:29Z) - Learning 2D-3D Correspondences To Solve The Blind Perspective-n-Point
Problem [98.92148855291363]
本稿では、6-DoFの絶対カメラポーズ2D--3D対応を同時に解決するディープCNNモデルを提案する。
実データとシミュレーションデータの両方でテストした結果,本手法は既存手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-03-15T04:17:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。