論文の概要: SimpleMatch: A Simple and Strong Baseline for Semantic Correspondence
- arxiv url: http://arxiv.org/abs/2601.12357v1
- Date: Sun, 18 Jan 2026 11:31:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.593027
- Title: SimpleMatch: A Simple and Strong Baseline for Semantic Correspondence
- Title(参考訳): SimpleMatch: セマンティック対応のためのシンプルで強力なベースライン
- Authors: Hailing Jin, Huiying Li,
- Abstract要約: 我々は,低解像度でも高い性能を実現する意味対応フレームワークであるSimpleMatchを紹介する。
現在のSOTA法よりも252x252 (3.3倍小さい)の解像度で、SimpleMatchはSPair-71kベンチマークで84.1%のPCK@0.1で優れた性能を達成した。
- 参考スコア(独自算出の注目度): 1.0039285760896914
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in semantic correspondence have been largely driven by the use of pre-trained large-scale models. However, a limitation of these approaches is their dependence on high-resolution input images to achieve optimal performance, which results in considerable computational overhead. In this work, we address a fundamental limitation in current methods: the irreversible fusion of adjacent keypoint features caused by deep downsampling operations. This issue is triggered when semantically distinct keypoints fall within the same downsampled receptive field (e.g., 16x16 patches). To address this issue, we present SimpleMatch, a simple yet effective framework for semantic correspondence that delivers strong performance even at low resolutions. We propose a lightweight upsample decoder that progressively recovers spatial detail by upsampling deep features to 1/4 resolution, and a multi-scale supervised loss that ensures the upsampled features retain discriminative features across different spatial scales. In addition, we introduce sparse matching and window-based localization to optimize training memory usage and reduce it by 51%. At a resolution of 252x252 (3.3x smaller than current SOTA methods), SimpleMatch achieves superior performance with 84.1% PCK@0.1 on the SPair-71k benchmark. We believe this framework provides a practical and efficient baseline for future research in semantic correspondence. Code is available at: https://github.com/hailong23-jin/SimpleMatch.
- Abstract(参考訳): 意味的対応の最近の進歩は、主に事前訓練された大規模モデルの使用によって進められている。
しかし、これらの手法の限界は、最適な性能を達成するために高解像度の入力画像に依存するため、計算オーバーヘッドがかなり大きくなることである。
本研究は, 深部ダウンサンプリング操作による隣接するキーポイント特徴の可逆的融合という, 現行手法の基本的限界に対処するものである。
この問題は、意味的に異なるキーポイントが同じダウンサンプルの受信フィールド(例:16x16パッチ)に落ちるとトリガーされる。
この問題に対処するために、私たちはSimpleMatchという、低解像度でも強力なパフォーマンスを実現する意味対応のためのシンプルで効果的なフレームワークを紹介します。
本研究では,深部特徴を1/4分解能にアップサンプリングすることで空間ディテールを段階的に復元する軽量なアップサンプルデコーダを提案する。
さらに、スパースマッチングとウィンドウベースのローカライゼーションを導入し、トレーニングメモリ使用率を最適化し、51%削減する。
現在のSOTA法よりも252x252 (3.3倍小さい)の解像度で、SimpleMatchはSPair-71kベンチマークで84.1%のPCK@0.1で優れた性能を達成した。
我々は,この枠組みが今後の意味的対応研究の実践的で効率的なベースラインを提供すると考えている。
コードは、https://github.com/hailong23-jin/SimpleMatch.comで入手できる。
関連論文リスト
- Unleashing Degradation-Carrying Features in Symmetric U-Net: Simpler and Stronger Baselines for All-in-One Image Restoration [52.82397287366076]
オールインワン画像復元は、統合された枠組み内で様々な劣化(ノイズ、ぼかし、悪天候など)を扱うことを目的としている。
本研究では, 優れた特徴抽出法により, 劣化伝達情報を本質的にエンコードする, 重要な知見を明らかにする。
我々の対称設計は固有の劣化信号を頑健に保存し、スキップ接続に単純な加法融合を施す。
論文 参考訳(メタデータ) (2025-12-11T12:20:31Z) - Upsample Anything: A Simple and Hard to Beat Baseline for Feature Upsampling [38.24831571443335]
Upsample Anythingは、低解像度の機能をトレーニングなしで高解像度のピクセル単位の出力に復元する。
224x224イメージあたりの$approx0.419テキストのみで動作し、セマンティックセグメンテーション、深さ推定、深さと確率マップのアップサンプリングにおける最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-11-20T12:27:53Z) - A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.05517338122698]
一般的な類似性に基づく機能アップサンプリングパイプラインが提案されている。
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
我々は,モーザイクアーティファクトを緩和する上ではシンプルだが有効であるHR特徴に対して,きめ細かな近傍選択戦略を開発する。
論文 参考訳(メタデータ) (2024-07-02T14:12:21Z) - NubbleDrop: A Simple Way to Improve Matching Strategy for Prompted One-Shot Segmentation [2.2559617939136505]
マッチング戦略の有効性とロバスト性を高めるための,単純で訓練のない手法を提案する。
中心となる概念は、マッチングプロセス中にランダムに特徴チャネル(0に設定する)をドロップすることである。
この手法は、病理的なヌブルの破棄を模倣し、他の類似性コンピューティングのシナリオにシームレスに適用することができる。
論文 参考訳(メタデータ) (2024-05-19T08:00:38Z) - Discriminative Sample-Guided and Parameter-Efficient Feature Space Adaptation for Cross-Domain Few-Shot Learning [0.0]
クロスドメインの少ショット分類は、それまで見つからなかった領域で新しいクラスを学ぶという難しい課題を示す。
我々は,小データセット上の多数のパラメータの微調整に伴うオーバーフィッティングに対処する,軽量なパラメータ効率適応手法を提案する。
我々は,従来の遠心波を識別的サンプル認識損失関数に置き換え,クラス間およびクラス内分散に対するモデルの感度を高める。
論文 参考訳(メタデータ) (2024-03-07T13:49:29Z) - A Strong Baseline for Point Cloud Registration via Direct Superpoints Matching [7.308509114539376]
本稿では,グローバルなマッチング方式でスーパーポイントの対応を見つけるための,シンプルで効果的なベースラインを提案する。
我々の単純で効果的なベースラインは、3つのデータセットの最先端メソッドと同等かそれ以上の結果を示している。
論文 参考訳(メタデータ) (2023-07-03T21:33:40Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。