論文の概要: Scale-Net: Learning to Reduce Scale Differences for Large-Scale
Invariant Image Matching
- arxiv url: http://arxiv.org/abs/2112.10485v1
- Date: Mon, 20 Dec 2021 12:35:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-21 17:24:20.700005
- Title: Scale-Net: Learning to Reduce Scale Differences for Large-Scale
Invariant Image Matching
- Title(参考訳): スケールネット:大規模不変画像マッチングにおけるスケール差低減学習
- Authors: Yujie Fu, Yihong Wu
- Abstract要約: 局所特徴抽出に先立って画像スケールの差を小さくするSDAIM(Scale-Difference-Aware Image matching method)を提案する。
スケール比を正確に推定するために,CVARM (Comvisibility-attention-reinforceed matching module) を提案し,その後,スケールネットと呼ばれる新しいニューラルネットワークを設計する。
- 参考スコア(独自算出の注目度): 7.297352404640492
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most image matching methods perform poorly when encountering large scale
changes in images. To solve this problem, firstly, we propose a
scale-difference-aware image matching method (SDAIM) that reduces image scale
differences before local feature extraction, via resizing both images of an
image pair according to an estimated scale ratio. Secondly, in order to
accurately estimate the scale ratio, we propose a
covisibility-attention-reinforced matching module (CVARM) and then design a
novel neural network, termed as Scale-Net, based on CVARM. The proposed CVARM
can lay more stress on covisible areas within the image pair and suppress the
distraction from those areas visible in only one image. Quantitative and
qualitative experiments confirm that the proposed Scale-Net has higher scale
ratio estimation accuracy and much better generalization ability compared with
all the existing scale ratio estimation methods. Further experiments on image
matching and relative pose estimation tasks demonstrate that our SDAIM and
Scale-Net are able to greatly boost the performance of representative local
features and state-of-the-art local feature matching methods.
- Abstract(参考訳): ほとんどの画像マッチング手法は、画像の大規模な変化に遭遇すると性能が低下する。
この問題を解決するために,まず,推定スケール比に応じて画像対の両画像のサイズを縮小することにより,局所特徴抽出前の画像スケール差を低減するスケール差認識画像マッチング法(SDAIM)を提案する。
第2に,スケール比を正確に推定するために,可視性強化マッチングモジュール(CVARM)を提案し,CVARMに基づく新しいニューラルネットワークであるスケールネットを設計する。
提案するcvarmでは,画像ペア内の可視領域に対するストレスが増大し,画像の可視領域からの邪魔が抑制される。
定量的・定性的な実験により,既存のスケール比推定法に比べ,スケール比推定精度が高く,一般化能もはるかに高いことが確認された。
画像マッチングおよび相対ポーズ推定タスクに関するさらなる実験により、SDAIMとScale-Netは、代表的局所特徴と最先端の局所特徴マッチング法の性能を大幅に向上させることができることを示した。
関連論文リスト
- PRISM: PRogressive dependency maxImization for Scale-invariant image Matching [4.9521269535586185]
スケール不変画像マッチング(PRISM)のためのPRogressive dependency maximizationを提案する。
提案手法は,各種評価ベンチマークや下流タスクの精度向上により,より優れたマッチング性能と一般化能力を確認した。
論文 参考訳(メタデータ) (2024-08-07T07:35:17Z) - AMSA-UNet: An Asymmetric Multiple Scales U-net Based on Self-attention for Deblurring [7.00986132499006]
asymmetric multiple scales U-net based on self-attention (AMSA-UNet) was proposed to improve the accuracy and compute complexity。
マルチスケールなU字型アーキテクチャを導入することで、ネットワークはグローバルレベルでぼやけた領域に集中でき、ローカルレベルで画像の詳細を回復することができる。
論文 参考訳(メタデータ) (2024-06-13T11:39:02Z) - Multi-scale Unified Network for Image Classification [33.560003528712414]
CNNは、実世界のマルチスケール画像入力を扱う際に、性能と計算効率において顕著な課題に直面している。
本稿では,マルチスケール,統一ネットワーク,スケール不変制約からなるMultiscale Unified Network(MUSN)を提案する。
MUSNは精度が44.53%向上し、マルチスケールシナリオではFLOPを7.01-16.13%減少させる。
論文 参考訳(メタデータ) (2024-03-27T06:40:26Z) - Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。
本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-02-25T04:48:11Z) - Scale-MAE: A Scale-Aware Masked Autoencoder for Multiscale Geospatial
Representation Learning [55.762840052788945]
本研究では,異なるスケールでデータ間の関係を明示的に学習する事前学習手法であるScale-MAEを提案する。
その結果,低周波画像と高周波画像の両方を再構成することで,リモートセンシング画像のマルチスケール表現が堅牢になることがわかった。
論文 参考訳(メタデータ) (2022-12-30T03:15:34Z) - Effective Invertible Arbitrary Image Rescaling [77.46732646918936]
Invertible Neural Networks (INN)は、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することにより、アップスケーリングの精度を大幅に向上させることができる。
本研究の1つのモデルのみをトレーニングすることにより、任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。
LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-09-26T22:22:30Z) - Scale Attention for Learning Deep Face Representation: A Study Against
Visual Scale Variation [69.45176408639483]
我々はスケール空間理論に頼って凸層を再構築する。
我々はSCale AttentioN Conv Neural Network(textbfSCAN-CNN)という新しいスタイルを構築した。
単発方式として、推論はマルチショット融合よりも効率的である。
論文 参考訳(メタデータ) (2022-09-19T06:35:04Z) - Self-Supervised Learning of Image Scale and Orientation [35.94215211409985]
本研究では,興味のある画像領域に対して特徴的ポーズ,すなわちスケールと向きを割り当てる学習の課題について検討する。
モデルが直接学習する明示的なポーズアノテーションを持つ画像領域の大規模な集合を得ることは困難である。
ヒストグラムアライメント技術を用いた自己教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-15T02:43:39Z) - ScaleNet: A Shallow Architecture for Scale Estimation [25.29257353644138]
我々は、画像間のスケールを予測するために、拡張畳み込みと自己および相互相関レイヤを利用する新しいアーキテクチャであるScaleNetを設計する。
本研究では, カメラポーズ推定, 3次元再構成, あるいは密度幾何マッチングを改善するために, 局所的特徴と密接な通信網を組み合わせる方法を示す。
論文 参考訳(メタデータ) (2021-12-09T11:32:01Z) - Image Matching with Scale Adjustment [57.18604132027697]
可変スケールでの関心点の表現と抽出方法を示す。
2つの異なる解像度で2つの画像を比較する方法を提案する。
論文 参考訳(メタデータ) (2020-12-10T11:03:25Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。