論文の概要: TransforMatcher: Match-to-Match Attention for Semantic Correspondence
- arxiv url: http://arxiv.org/abs/2205.11634v1
- Date: Mon, 23 May 2022 21:02:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-25 14:29:02.822496
- Title: TransforMatcher: Match-to-Match Attention for Semantic Correspondence
- Title(参考訳): TransforMatcher:意味的対応のためのMatch-to-Matchアテンション
- Authors: Seungwook Kim, Juhong Min, Minsu Cho
- Abstract要約: 本稿では,視覚領域におけるトランスフォーマーネットワークの成功を基盤として,TransforMatcherと呼ばれる強力なセマンティック画像マッチング学習手法を提案する。
既存の畳み込みや注意に基づく対応スキームとは異なり、TransforMatcherは、正確なマッチングローカライゼーションとダイナミックリファインメントのために、グローバルなマッチングアテンションを実行する。
実験では、TransforMatcherはSPair-71k上の新しい状態を設定し、PF-PASCALデータセット上の既存のSOTAメソッドと同等に動作させる。
- 参考スコア(独自算出の注目度): 48.25709192748133
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Establishing correspondences between images remains a challenging task,
especially under large appearance changes due to different viewpoints or
intra-class variations. In this work, we introduce a strong semantic image
matching learner, dubbed TransforMatcher, which builds on the success of
transformer networks in vision domains. Unlike existing convolution- or
attention-based schemes for correspondence, TransforMatcher performs global
match-to-match attention for precise match localization and dynamic refinement.
To handle a large number of matches in a dense correlation map, we develop a
light-weight attention architecture to consider the global match-to-match
interactions. We also propose to utilize a multi-channel correlation map for
refinement, treating the multi-level scores as features instead of a single
score to fully exploit the richer layer-wise semantics. In experiments,
TransforMatcher sets a new state of the art on SPair-71k while performing on
par with existing SOTA methods on the PF-PASCAL dataset.
- Abstract(参考訳): 画像間の対応を確立することは、特に異なる視点やクラス内変異による大きな外観変化において、難しい課題である。
本研究では,視覚領域におけるトランスフォーマーネットワークの成功を基盤とした,強力なセマンティック画像マッチング学習システムであるTransforMatcherを紹介する。
既存の畳み込みや注意に基づく対応スキームとは異なり、TransforMatcherは、正確なマッチングローカライゼーションとダイナミックリファインメントのために、グローバルなマッチングアテンションを実行する。
密接な相関マップで大量のマッチングを扱うため、グローバルなマッチングとマッチングの相互作用を考えるために軽量な注意アーキテクチャを開発した。
また,多段階スコアを単一スコアではなく特徴として扱うことで,よりリッチな層間セマンティクスをフル活用するマルチチャネル相関マップを提案する。
実験では、TransforMatcherはSPair-71k上の新しい状態を設定し、PF-PASCALデータセット上の既存のSOTAメソッドと同等に実行する。
関連論文リスト
- Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - OAMatcher: An Overlapping Areas-based Network for Accurate Local Feature
Matching [9.006654114778073]
OAMatcherは、人間の動作を模倣して、密集した正確な一致を生成する、検知不要な手法である。
OAMatcherは重複する領域を予測し、効果的でクリーンなグローバルコンテキストアグリゲーションを促進する。
総合的な実験により、OAMatcherはいくつかのベンチマークで最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-02-12T03:32:45Z) - FECANet: Boosting Few-Shot Semantic Segmentation with Feature-Enhanced
Context-Aware Network [48.912196729711624]
Few-shot セマンティックセグメンテーション(Few-shot semantic segmentation)は、新しいクラスの各ピクセルを、わずかに注釈付きサポートイメージで検索するタスクである。
本稿では,クラス間の類似性に起因するマッチングノイズを抑制するために,機能拡張コンテキスト認識ネットワーク(FECANet)を提案する。
さらに,前景と背景の余分な対応関係を符号化する新たな相関再構成モジュールを提案する。
論文 参考訳(メタデータ) (2023-01-19T16:31:13Z) - DeepMatcher: A Deep Transformer-based Network for Robust and Accurate
Local Feature Matching [9.662752427139496]
本研究では,検出器レス手法における局所的特徴マッチングの探索に基づくディープトランスフォーマーベースネットワークを提案する。
DeepMatcherは、より直感的でシンプルでマッシュアップな機能をキャプチャする。
我々は、DeepMatcherがいくつかのベンチマークで最先端の手法を大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2023-01-08T07:15:09Z) - Global-and-Local Collaborative Learning for Co-Salient Object Detection [162.62642867056385]
Co-Salient Object Detection (CoSOD)の目標は、2つ以上の関連する画像を含むクエリグループに一般的に現れる有能なオブジェクトを見つけることである。
本稿では,グローバル対応モデリング(GCM)とローカル対応モデリング(LCM)を含む,グローバル・ローカル協調学習アーキテクチャを提案する。
提案したGLNetは3つの一般的なCoSODベンチマークデータセットに基づいて評価され、我々のモデルが小さなデータセット(約3k画像)でトレーニングされた場合、一部の大規模データセット(約8k-200k画像)でトレーニングされた11の最先端の競合製品(約8k-200k画像)を上回っていることを示す。
論文 参考訳(メタデータ) (2022-04-19T14:32:41Z) - Learning Contrastive Representation for Semantic Correspondence [150.29135856909477]
セマンティックマッチングのためのマルチレベルコントラスト学習手法を提案する。
画像レベルのコントラスト学習は、畳み込み特徴が類似したオブジェクト間の対応を見出すための鍵となる要素であることを示す。
論文 参考訳(メタデータ) (2021-09-22T18:34:14Z) - GOCor: Bringing Globally Optimized Correspondence Volumes into Your
Neural Network [176.3781969089004]
特徴相関層は、画像ペア間の密接な対応を含むコンピュータビジョン問題において、重要なニューラルネットワークモジュールとして機能する。
我々は,特徴相関層の直接置換として機能する,完全に微分可能な密マッチングモジュール GOCor を提案する。
本手法は,幾何マッチング,光学フロー,密接なセマンティックマッチングのタスクにおいて,特徴相関層を著しく上回っている。
論文 参考訳(メタデータ) (2020-09-16T17:33:01Z) - Learning to Compose Hypercolumns for Visual Correspondence [57.93635236871264]
本稿では,画像に条件付けされた関連レイヤを活用することで,動的に効率的な特徴を構成する視覚対応手法を提案する。
提案手法はダイナミックハイパーピクセルフロー(Dynamic Hyperpixel Flow)と呼ばれ,深層畳み込みニューラルネットワークから少数の関連層を選択することにより,高速にハイパーカラム機能を構成することを学習する。
論文 参考訳(メタデータ) (2020-07-21T04:03:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。