論文の概要: R2FD2: Fast and Robust Matching of Multimodal Remote Sensing Image via
Repeatable Feature Detector and Rotation-invariant Feature Descriptor
- arxiv url: http://arxiv.org/abs/2212.02277v2
- Date: Tue, 6 Dec 2022 07:05:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 13:19:13.854931
- Title: R2FD2: Fast and Robust Matching of Multimodal Remote Sensing Image via
Repeatable Feature Detector and Rotation-invariant Feature Descriptor
- Title(参考訳): R2FD2:Repeatable Feature DetectorとRotation-invariant Feature Descriptorによるマルチモーダルリモートセンシング画像の高速かつロバストなマッチング
- Authors: Bai Zhu, Chao Yang, Jinkun Dai, Jianwei Fan, Yuanxin Ye
- Abstract要約: 放射・回転差に頑健な特徴マッチング法(R2FD2)を提案する。
提案したR2FD2は、5つの最先端特徴マッチング法より優れ、普遍性と適応性に優れた利点がある。
我々のR2FD2は2ピクセル以内のマッチングの精度を達成し、他の最先端手法と比較してマッチング効率に大きな利点がある。
- 参考スコア(独自算出の注目度): 3.395266574804949
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatically identifying feature correspondences between multimodal images
is facing enormous challenges because of the significant differences both in
radiation and geometry. To address these problems, we propose a novel feature
matching method (named R2FD2) that is robust to radiation and rotation
differences. Our R2FD2 is conducted in two critical contributions, consisting
of a repeatable feature detector and a rotation-invariant feature descriptor.
In the first stage, a repeatable feature detector called the Multi-channel
Auto-correlation of the Log-Gabor (MALG) is presented for feature detection,
which combines the multi-channel auto-correlation strategy with the Log-Gabor
wavelets to detect interest points (IPs) with high repeatability and uniform
distribution. In the second stage, a rotation-invariant feature descriptor is
constructed, named the Rotation-invariant Maximum index map of the Log-Gabor
(RMLG), which consists of two components: fast assignment of dominant
orientation and construction of feature representation. In the process of fast
assignment of dominant orientation, a Rotation-invariant Maximum Index Map
(RMIM) is built to address rotation deformations. Then, the proposed RMLG
incorporates the rotation-invariant RMIM with the spatial configuration of
DAISY to depict a more discriminative feature representation, which improves
RMLG's resistance to radiation and rotation variances.Experimental results show
that the proposed R2FD2 outperforms five state-of-the-art feature matching
methods, and has superior advantages in adaptability and universality.
Moreover, our R2FD2 achieves the accuracy of matching within two pixels and has
a great advantage in matching efficiency over other state-of-the-art methods.
- Abstract(参考訳): マルチモーダル画像間の特徴対応を自動的に識別することは、放射線と幾何学の両方で大きな違いがあるため、大きな課題に直面している。
これらの問題に対処するために,放射差と回転差に頑健な特徴マッチング法(R2FD2)を提案する。
我々のR2FD2は、繰り返し可能な特徴検出器と回転不変の特徴記述器からなる2つの重要なコントリビューションで行われる。
第1段階では、マルチチャネル自己相関戦略とログガボウェーブレットを組み合わせた特徴検出のために、マルチチャネル自己相関(malg)と呼ばれる繰り返し可能な特徴検出器が提示され、高い繰り返し可能性と均一分布を有する関心点(ips)を検出する。
第2段階では、log-gabor(rmlg)の回転不変最大インデックスマップ(英語版)と呼ばれる回転不変特徴記述子(英語版)が構築される。
支配方向を高速に割り当てる過程で、回転不変な最大指数写像 (RMIM) が回転変形に対処するために構築される。
次に,RMLGは,回転不変RMIMをDAISYの空間的構成に組み込んで,より識別的な特徴表現を表現し,RMLGの放射・回転分散に対する抵抗性を向上させる。実験結果から,提案したR2FD2は5つの最先端特徴マッチング法より優れ,適応性と普遍性に優れた優位性を有することが示された。
さらに,我々のR2FD2は,2画素以内のマッチングの精度を実現し,他の最先端手法と比較して,マッチング効率に大きな利点がある。
関連論文リスト
- Exploring Invariant Representation for Visible-Infrared Person
Re-Identification [77.06940947765406]
異なるスペクトルを横断する歩行者にアイデンティティを関連付けることを目的とした、クロススペクトルの人物再識別は、モダリティの相違の主な課題に直面している。
本稿では、ロバスト機能マイニングネットワーク(RFM)と呼ばれるエンドツーエンドのハイブリッド学習フレームワークにおいて、画像レベルと特徴レベルの両方の問題に対処する。
RegDBとSYSU-MM01という2つの標準的なクロススペクトル人物識別データセットの実験結果により,最先端の性能が示された。
論文 参考訳(メタデータ) (2023-02-02T05:24:50Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - Look Back and Forth: Video Super-Resolution with Explicit Temporal
Difference Modeling [105.69197687940505]
本稿では,LR空間とHR空間における時間差の明示的モデル化の役割について検討する。
超解像結果をさらに高めるために、空間残留特徴を抽出するだけでなく、高周波領域における連続フレーム間の差も計算する。
論文 参考訳(メタデータ) (2022-04-14T17:07:33Z) - A Robust Multimodal Remote Sensing Image Registration Method and System
Using Steerable Filters with First- and Second-order Gradients [7.813406811407584]
非線形ラジオメトリック差(NRD)と有意な幾何学的歪みのため,マルチモーダルリモートセンシング画像の同時登録は現在も進行中の課題である。
本稿では,2つの重要なステップからなるステアブルフィルタに基づくロバストマッチング手法を提案する。
提案手法の性能を多種類のマルチモーダルRS画像を用いて評価した。
論文 参考訳(メタデータ) (2022-02-27T12:22:42Z) - Cross-Modality Attentive Feature Fusion for Object Detection in
Multispectral Remote Sensing Imagery [0.6853165736531939]
マルチスペクトルリモートセンシング画像ペアの相補的な情報を融合するクロスモダリティは、検出アルゴリズムの知覚能力を向上させることができる。
本稿では,共通モダリティと差分モダリティを併用した,新規で軽量なマルチスペクトル特徴融合法を提案する。
提案手法は,最先端の性能を低コストで実現することができる。
論文 参考訳(メタデータ) (2021-12-06T13:12:36Z) - BAANet: Learning Bi-directional Adaptive Attention Gates for
Multispectral Pedestrian Detection [14.672188805059744]
本研究は、双方向適応ゲート(BAA-Gate)と呼ばれる効率的かつ効率的な相互モード融合モジュールを提案する。
注意機構に基づいて、BAA-ゲイトは情報的特徴を蒸留し、表現を再検討するために考案された。
挑戦的なKAISTデータセットに関する検討実験により,本手法の優れた性能を満足な速さで実証した。
論文 参考訳(メタデータ) (2021-12-04T08:30:54Z) - Transformer-based Network for RGB-D Saliency Detection [82.6665619584628]
RGB-Dサリエンシ検出の鍵は、2つのモードにわたる複数のスケールで情報を完全なマイニングとヒューズすることである。
コンバータは機能融合と機能拡張の両面において高い有効性を示す一様操作であることを示す。
提案するネットワークは,最先端のRGB-D値検出手法に対して良好に動作する。
論文 参考訳(メタデータ) (2021-12-01T15:53:58Z) - Robust Reference-based Super-Resolution via C2-Matching [77.51610726936657]
超解像(Ref-SR)は、最近、高分解能(HR)参照画像を導入して、低分解能(LR)入力画像を強化するための有望なパラダイムとして登場した。
既存のRef-SR法は主に暗黙の対応に頼り、参照画像からHRテクスチャを借用し、入力画像の情報損失を補う。
本稿では,C2-Matchingを提案する。
論文 参考訳(メタデータ) (2021-06-03T16:40:36Z) - AFD-Net: Adaptive Fully-Dual Network for Few-Shot Object Detection [8.39479809973967]
Few-shot Object Detection (FSOD) は、未確認の物体に迅速に適応できる検出器の学習を目的としている。
既存の方法では、共有コンポーネントを用いて分類と局所化のサブタスクを実行することで、この問題を解決している。
本稿では,2つのサブタスクの明示的な分解を考慮し,両者の情報を活用して特徴表現の強化を図ることを提案する。
論文 参考訳(メタデータ) (2020-11-30T10:21:32Z) - Directional ASR: A New Paradigm for E2E Multi-Speaker Speech Recognition
with Source Localization [73.62550438861942]
本稿では、指向性自動音声認識(D-ASR)と呼ばれる、エンドツーエンドのニューラルネットワーク方式で遠距離場マルチスピーカデータを処理するための新しいパラダイムを提案する。
D-ASRでは、マイクロホンアレイに対するソースの方位角を潜時変数として定義する。
論文 参考訳(メタデータ) (2020-10-30T20:26:28Z) - A Dual Iterative Refinement Method for Non-rigid Shape Matching [16.03666555216332]
2つのほぼ等尺形状間の密接な対応のために、単純で効率的な二重反復精製法(DIR)を提案する。
鍵となる考え方は、空間的・スペクトル的・局所的・グローバル的特徴などの二重情報を補完的で効果的な方法で使うことである。
様々なデータセットの実験は、精度と効率の両面で、他の最先端手法よりもDIRの方が優れていることを示した。
論文 参考訳(メタデータ) (2020-07-26T03:35:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。