論文の概要: Similarity-Aware Selective State-Space Modeling for Semantic Correspondence
- arxiv url: http://arxiv.org/abs/2509.24318v1
- Date: Mon, 29 Sep 2025 05:56:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.774434
- Title: Similarity-Aware Selective State-Space Modeling for Semantic Correspondence
- Title(参考訳): 意味対応のための類似性を考慮した選択的状態空間モデリング
- Authors: Seungwook Kim, Minsu Cho,
- Abstract要約: MambaMatcherは選択的状態空間モデル(SSM)を用いて高次元相関を効率的にモデル化する
MambaMatcherは特徴マップの解像度や受容場を損なうことなく、4D相関マップを効果的に洗練する。
標準的な意味対応ベンチマークの実験は、MambaMatcherが最先端のパフォーマンスを達成することを示す。
- 参考スコア(独自算出の注目度): 54.92596581841942
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Establishing semantic correspondences between images is a fundamental yet challenging task in computer vision. Traditional feature-metric methods enhance visual features but may miss complex inter-correlation relationships, while recent correlation-metric approaches are hindered by high computational costs due to processing 4D correlation maps. We introduce MambaMatcher, a novel method that overcomes these limitations by efficiently modeling high-dimensional correlations using selective state-space models (SSMs). By implementing a similarity-aware selective scan mechanism adapted from Mamba's linear-complexity algorithm, MambaMatcher refines the 4D correlation map effectively without compromising feature map resolution or receptive field. Experiments on standard semantic correspondence benchmarks demonstrate that MambaMatcher achieves state-of-the-art performance.
- Abstract(参考訳): 画像間の意味的対応を確立することは、コンピュータビジョンにおける基本的な課題である。
従来の特徴量法は視覚的特徴を高めるが、複雑な相関関係を欠く場合がある。
選択状態空間モデル(SSM)を用いて高次元相関を効率的にモデル化することにより,これらの制約を克服する新しい手法であるMambaMatcherを紹介する。
MambaMatcherは、Mambaの線形複雑度アルゴリズムに適応した類似性を考慮した選択的スキャン機構を実装することにより、特徴マップの解像度や受容場を損なうことなく、4D相関マップを効果的に洗練する。
標準的な意味対応ベンチマークの実験は、MambaMatcherが最先端のパフォーマンスを達成することを示す。
関連論文リスト
- BSMamba: Brightness and Semantic Modeling for Long-Range Interaction in Low-Light Image Enhancement [3.3392058493559693]
現在の低照度画像強調法(LLIE)は、セマンティック一貫性、細部、計算効率を保ちながら、輝度を同時に改善する上で重要な制限に直面している。
BSMamba は,Brightness Mamba と Semantic Mamba の2つの特別に設計されたコンポーネントからなる新しい視覚的マンバアーキテクチャである。
BSMambaは、セマンティック一貫性を維持しながらLLIEで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-06-23T07:04:34Z) - Visual Explanation via Similar Feature Activation for Metric Learning [23.559106251249872]
クラスアクティベーションマップ(CAM)はソフトマックスベースの畳み込みニューラルネットワークの解釈可能性を調べるために広く利用されている。
類似特徴活性化マップ(SFAM)と呼ばれる新しい視覚的説明法を提案する。
SFAMは、ユークリッド距離またはコサイン類似度を類似度計量として用いて、CNNモデルに対して非常に有望な解釈可能な視覚的説明を提供する。
論文 参考訳(メタデータ) (2025-06-02T13:14:37Z) - Bridging the Modality Gap: Dimension Information Alignment and Sparse Spatial Constraint for Image-Text Matching [10.709744162565274]
本稿では2つの側面からモダリティギャップを橋渡しするDIASと呼ばれる新しい手法を提案する。
この方法はFlickr30kとMSCOCOベンチマークで4.3%-10.2%のrSum改善を実現している。
論文 参考訳(メタデータ) (2024-10-22T09:37:29Z) - GSSF: Generalized Structural Sparse Function for Deep Cross-modal Metric Learning [51.677086019209554]
ペアワイド類似性学習のためのモダリティ間の強力な関係を捕捉する汎用構造スパースを提案する。
距離メートル法は、対角線とブロック対角線の2つの形式を微妙にカプセル化する。
クロスモーダルと2つの余分なユニモーダル検索タスクの実験は、その優位性と柔軟性を検証した。
論文 参考訳(メタデータ) (2024-10-20T03:45:50Z) - Efficient Semantic Matching with Hypercolumn Correlation [58.92933923647451]
HCCNetは効率的で効果的なセマンティックマッチング手法である。
マルチスケール相関写像の完全なポテンシャルを利用する。
4D相関マップ上では、高価なマッチング関係のマイニングに頼っている。
論文 参考訳(メタデータ) (2023-11-07T20:40:07Z) - FECANet: Boosting Few-Shot Semantic Segmentation with Feature-Enhanced
Context-Aware Network [48.912196729711624]
Few-shot セマンティックセグメンテーション(Few-shot semantic segmentation)は、新しいクラスの各ピクセルを、わずかに注釈付きサポートイメージで検索するタスクである。
本稿では,クラス間の類似性に起因するマッチングノイズを抑制するために,機能拡張コンテキスト認識ネットワーク(FECANet)を提案する。
さらに,前景と背景の余分な対応関係を符号化する新たな相関再構成モジュールを提案する。
論文 参考訳(メタデータ) (2023-01-19T16:31:13Z) - Deep Relational Metric Learning [84.95793654872399]
本稿では,画像クラスタリングと検索のためのディープリレーショナルメトリック学習フレームワークを提案する。
我々は、クラス間分布とクラス内分布の両方をモデル化するために、異なる側面から画像を特徴付ける特徴のアンサンブルを学ぶ。
広く使われているCUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、我々のフレームワークが既存の深層学習方法を改善し、非常に競争力のある結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-08-23T09:31:18Z) - Semantic Correspondence with Transformers [68.37049687360705]
本稿では,変換器を用いたコストアグリゲーション(CAT)を提案し,意味論的に類似した画像間の密接な対応を見出す。
初期相関マップと多レベルアグリゲーションを曖昧にするための外観親和性モデリングを含む。
提案手法の有効性を示す実験を行い,広範囲にわたるアブレーション研究を行った。
論文 参考訳(メタデータ) (2021-06-04T14:39:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。