論文の概要: Local Feature Matching Using Deep Learning: A Survey
- arxiv url: http://arxiv.org/abs/2401.17592v2
- Date: Mon, 11 Mar 2024 01:32:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 14:32:37.722111
- Title: Local Feature Matching Using Deep Learning: A Survey
- Title(参考訳): 深層学習を用いた局所的特徴マッチング:サーベイ
- Authors: Shibiao Xu, Shunpeng Chen, Rongtao Xu, Changwei Wang, Peng Lu, Li Guo
- Abstract要約: 局所的な特徴マッチングは、画像検索、3D再構成、オブジェクト認識といった領域を含むコンピュータビジョンの領域において幅広い応用を享受する。
近年,深層学習モデルの導入により,局所的特徴マッチング手法の探究が盛んに行われている。
また,移動構造,リモートセンシング画像登録,医用画像登録などの多様な領域における局所的特徴マッチングの実践的応用についても検討した。
- 参考スコア(独自算出の注目度): 19.322545965903608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Local feature matching enjoys wide-ranging applications in the realm of
computer vision, encompassing domains such as image retrieval, 3D
reconstruction, and object recognition. However, challenges persist in
improving the accuracy and robustness of matching due to factors like viewpoint
and lighting variations. In recent years, the introduction of deep learning
models has sparked widespread exploration into local feature matching
techniques. The objective of this endeavor is to furnish a comprehensive
overview of local feature matching methods. These methods are categorized into
two key segments based on the presence of detectors. The Detector-based
category encompasses models inclusive of Detect-then-Describe, Joint Detection
and Description, Describe-then-Detect, as well as Graph Based techniques. In
contrast, the Detector-free category comprises CNN Based, Transformer Based,
and Patch Based methods. Our study extends beyond methodological analysis,
incorporating evaluations of prevalent datasets and metrics to facilitate a
quantitative comparison of state-of-the-art techniques. The paper also explores
the practical application of local feature matching in diverse domains such as
Structure from Motion, Remote Sensing Image Registration, and Medical Image
Registration, underscoring its versatility and significance across various
fields. Ultimately, we endeavor to outline the current challenges faced in this
domain and furnish future research directions, thereby serving as a reference
for researchers involved in local feature matching and its interconnected
domains. A comprehensive list of studies in this survey is available at
https://github.com/vignywang/Awesome-Local-Feature-Matching .
- Abstract(参考訳): 局所的特徴マッチングは、画像検索、3次元再構成、オブジェクト認識などの領域を包含するコンピュータビジョンの分野で幅広い応用を享受している。
しかしながら、視点や照明のバリエーションといった要因により、マッチングの正確さと堅牢性の向上に課題が残っている。
近年,深層学習モデルの導入により,局所的特徴マッチング手法の探究が盛んに行われている。
この取り組みの目的は,局所的な特徴マッチング手法の概要を明らかにすることである。
これらの方法は検出器の存在に基づいて2つのキーセグメントに分類される。
Detectorベースのカテゴリには、De Detect-then-Describe、Joint Detection and Description、Describe-then-Detectを含むモデルと、グラフベースのテクニックが含まれている。
対照的に、検出器フリーカテゴリは、cnnベース、トランスフォーマーベース、パッチベースメソッドを含む。
本研究は方法論分析を超えて,最先端手法の定量的比較を容易にするために,普及度の高いデータセットとメトリクスの評価を取り入れた。
本論文は,動画像認識,リモートセンシング画像登録,医用画像登録などの多様な領域における局所的特徴マッチングの実践的応用についても検討し,その多様性と意義について考察した。
最終的に、我々はこの領域で直面している現在の課題の概要を概説し、将来の研究方向性を示し、それによって、局所的な特徴マッチングとその相互接続ドメインに関わる研究者の参考となる。
この調査の総合的な研究リストはhttps://github.com/vignywang/Awesome-Local-Feature-Matching で公開されている。
関連論文リスト
- Cross-view geo-localization: a survey [1.3686993145787065]
クロスビューなジオローカライゼーションは、コンピュータビジョンの領域で注目を浴びている。
本稿では,この領域に不可欠な最先端の方法論,技法,および関連する課題について,徹底的な調査を行う。
論文 参考訳(メタデータ) (2024-06-14T05:14:54Z) - Spatial Reasoning for Few-Shot Object Detection [21.3564383157159]
本稿では,空間的推論フレームワークを提案する。
グラフ畳み込みネットワークをRoIとその関連性はそれぞれノードとエッジとして定義する。
提案手法は最先端の手法を著しく上回り, 広範囲なアブレーション研究により有効性を検証する。
論文 参考訳(メタデータ) (2022-11-02T12:38:08Z) - Point-Level Region Contrast for Object Detection Pre-Training [147.47349344401806]
本稿では,物体検出作業のための自己教師付き事前学習手法である点レベル領域コントラストを提案する。
提案手法は,異なる領域から個々の点対を直接抽出することにより,コントラスト学習を行う。
領域ごとの集約表現と比較すると,入力領域の品質の変化に対して,我々のアプローチはより堅牢である。
論文 参考訳(メタデータ) (2022-02-09T18:56:41Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Unsupervised Domain Adaption of Object Detectors: A Survey [87.08473838767235]
近年のディープラーニングの進歩は、様々なコンピュータビジョンアプリケーションのための正確で効率的なモデルの開発につながっている。
高度に正確なモデルを学ぶには、大量の注釈付きイメージを持つデータセットの可用性に依存する。
このため、ラベルスカースデータセットに視覚的に異なる画像がある場合、モデルの性能は大幅に低下する。
論文 参考訳(メタデータ) (2021-05-27T23:34:06Z) - RoRD: Rotation-Robust Descriptors and Orthographic Views for Local
Feature Matching [32.10261486751993]
本稿では,データ拡張と視点投影による不変記述子の学習を組み合わせる新しい枠組みを提案する。
提案手法の有効性をポーズ推定や視覚的位置認識などの重要課題に対して評価する。
論文 参考訳(メタデータ) (2021-03-15T17:40:25Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Cross-Domain Facial Expression Recognition: A Unified Evaluation
Benchmark and Adversarial Graph Learning [85.6386289476598]
我々は,クロスドメイン全体的特徴共適応のための新しい逆グラフ表現適応(AGRA)フレームワークを開発した。
我々は,いくつかの一般的なベンチマークで広範囲かつ公平な評価を行い,提案したAGRAフレームワークが従来の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-03T15:00:31Z) - Character Region Attention For Text Spotting [18.713194210876136]
シーンテキストスポッターは、テキスト検出および認識モジュールからなる。
典型的なアーキテクチャでは、検出モジュールと認識モジュールを別々のブランチに配置する。
これは、2つのモジュールが共通のサブタスクを共有しており、文字領域の場所を見つけるためである。
このアーキテクチャは、認識器内の検出出力を利用して、検出段階を通して認識損失を伝播することによって構成される。
論文 参考訳(メタデータ) (2020-07-19T09:12:23Z) - Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation [62.29076080124199]
本稿では,クロスドメインオブジェクト検出のための特徴適応手法を提案する。
粗粒度では、アテンション機構を採用して前景領域を抽出し、その辺縁分布に応じて整列する。
粒度の細かい段階では、同じカテゴリのグローバルプロトタイプと異なるドメインとの距離を最小化することにより、前景の条件分布アライメントを行う。
論文 参考訳(メタデータ) (2020-03-23T13:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。