論文の概要: Patch2Pix: Epipolar-Guided Pixel-Level Correspondences
- arxiv url: http://arxiv.org/abs/2012.01909v3
- Date: Fri, 26 Mar 2021 19:54:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-23 14:54:46.320229
- Title: Patch2Pix: Epipolar-Guided Pixel-Level Correspondences
- Title(参考訳): Patch2Pix:極性誘導型Pixel-Level対応
- Authors: Qunjie Zhou, Torsten Sattler, Laura Leal-Taixe
- Abstract要約: Patch2Pixは,これらの提案によって定義された局所領域から画素レベルのマッチングを回帰することで,提案手法を洗練する新しい改良ネットワークである。
改良ネットワークは画像マッチング, ホモグラフィー推定, ローカライゼーションタスクにおいて, 対応ネットワークの性能を大幅に向上させることを示す。
- 参考スコア(独自算出の注目度): 38.38520763114715
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The classical matching pipeline used for visual localization typically
involves three steps: (i) local feature detection and description, (ii) feature
matching, and (iii) outlier rejection. Recently emerged correspondence networks
propose to perform those steps inside a single network but suffer from low
matching resolution due to the memory bottleneck. In this work, we propose a
new perspective to estimate correspondences in a detect-to-refine manner, where
we first predict patch-level match proposals and then refine them. We present
Patch2Pix, a novel refinement network that refines match proposals by
regressing pixel-level matches from the local regions defined by those
proposals and jointly rejecting outlier matches with confidence scores.
Patch2Pix is weakly supervised to learn correspondences that are consistent
with the epipolar geometry of an input image pair. We show that our refinement
network significantly improves the performance of correspondence networks on
image matching, homography estimation, and localization tasks. In addition, we
show that our learned refinement generalizes to fully-supervised methods
without re-training, which leads us to state-of-the-art localization
performance. The code is available at https://github.com/GrumpyZhou/patch2pix.
- Abstract(参考訳): 視覚的ローカライゼーションに使用される古典的なマッチングパイプラインは、(i)局所的な特徴検出と記述、(ii)特徴マッチング、(iii)外れ値拒絶の3つのステップを含む。
最近出現した通信網は、単一のネットワーク内でこれらのステップを実行することを提案しているが、メモリボトルネックのため、解像度が低い。
そこで本研究では,まずパッチレベルのマッチング提案を予測し,それらを改良する手法を提案する。
本稿では,これらの提案によって定義された局所領域から画素レベルマッチングを回帰し,信頼度スコアと外れ値マッチングを共同で拒否することにより,マッチング提案を洗練する新たな改良ネットワークであるpatch2pixを提案する。
patch2pixは、入力画像対のエピポーラ幾何と一致する対応を学習するために弱い監督を受ける。
改良ネットワークは画像マッチング, ホモグラフィー推定, ローカライゼーションタスクにおいて, 対応ネットワークの性能を大幅に向上させることを示す。
さらに,学習した洗練度が再トレーニングすることなく,完全教師あり手法に一般化し,最先端のローカライズ性能をもたらすことを示した。
コードはhttps://github.com/grumpyzhou/patch2pixで入手できる。
関連論文リスト
- Breaking the Frame: Image Retrieval by Visual Overlap Prediction [53.17564423756082]
本稿では,隠蔽や複雑なシーンを効果的に扱う新しい視覚的位置認識手法,VOPを提案する。
提案手法は,高コストな特徴検出とマッチングを必要とせず,可視画像区間の識別を可能にする。
論文 参考訳(メタデータ) (2024-06-23T20:00:20Z) - Improving Transformer-based Image Matching by Cascaded Capturing
Spatially Informative Keypoints [44.90917854990362]
変換器を用いたカスケードマッチングモデル -- Cascade Feature Matching TRansformer (CasMTR) を提案する。
我々は、信頼性マップを通じてキーポイントをフィルタリングするために、単純で効果的な非最大抑圧(NMS)後処理を使用する。
CasMTRは、室内および屋外のポーズ推定および視覚的位置推定において最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-03-06T04:32:34Z) - Feature-based Image Matching for Identifying Individual K\=ak\=a [0.0]
本報告では、個々のk=ak=aを識別する新しい用途のための教師なし特徴ベース画像マッチングパイプラインについて検討する。
クラスタリングに類似性ネットワークを適用することで、個々の鳥を識別する現在の教師付きアプローチの弱点に対処する。
機能ベースの画像マッチングは、既存の教師付きアプローチに代わる実行可能な代替手段を提供するために、類似性ネットワークで使用できると結論付けている。
論文 参考訳(メタデータ) (2023-01-17T03:43:19Z) - DDM-NET: End-to-end learning of keypoint feature Detection, Description
and Matching for 3D localization [34.66510265193038]
本稿では,キーポイント検出,記述子表現,フレーム間マッチングを共同で学習するエンドツーエンドフレームワークを提案する。
我々は特徴検出とマッチングの両方のための自己教師付き画像ワープ対応損失を設計する。
また,不整合/不整合一致と不整合一致の両方を頑健に処理する新たな損失を提案する。
論文 参考訳(メタデータ) (2022-12-08T21:43:56Z) - Guide Local Feature Matching by Overlap Estimation [9.387323456222823]
OETRというTRansformerを用いた画像ペア上でのオーバーラップ推定手法を提案する。
OETRは、特徴相関の2段階のプロセスで重なり推定を行い、次いで重なり回帰を行う。
実験の結果,OETRは局所的特徴マッチング性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-02-18T07:11:36Z) - DFM: A Performance Baseline for Deep Feature Matching [10.014010310188821]
提案手法では,事前学習したVGGアーキテクチャを特徴抽出器として使用し,マッチングを改善するために追加の訓練を必要としない。
提案アルゴリズムは,Hpatchesデータセット上で,平均マッチング精度(MMA)で0.57と0.80のスコアをそれぞれ1ピクセル,2ピクセルの閾値で達成する。
論文 参考訳(メタデータ) (2021-06-14T22:55:06Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - Deep Shells: Unsupervised Shape Correspondence with Optimal Transport [52.646396621449]
本稿では,3次元形状対応のための教師なし学習手法を提案する。
提案手法は,複数のデータセット上での最先端技術よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-10-28T22:24:07Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。