論文の概要: Semi-supervised Multiscale Matching for SAR-Optical Image
- arxiv url: http://arxiv.org/abs/2508.07812v1
- Date: Mon, 11 Aug 2025 09:55:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:29.037862
- Title: Semi-supervised Multiscale Matching for SAR-Optical Image
- Title(参考訳): SAR-Optical Imageのための半教師付きマルチスケールマッチング
- Authors: Jingze Gai, Changchun Li,
- Abstract要約: SAR-光画像マッチングのための半教師付きマルチスケールマッチング(S2M2-SAR)を提案する。
具体的には、未ラベルのSAR-光画像対に擬似接地構造類似性熱マップを擬似ラベル付けする。
また,モダリティ間の相互独立損失をトレーニングしたクロスモーダル機能拡張モジュールも導入した。
- 参考スコア(独自算出の注目度): 5.25009884148204
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Driven by the complementary nature of optical and synthetic aperture radar (SAR) images, SAR-optical image matching has garnered significant interest. Most existing SAR-optical image matching methods aim to capture effective matching features by employing the supervision of pixel-level matched correspondences within SAR-optical image pairs, which, however, suffers from time-consuming and complex manual annotation, making it difficult to collect sufficient labeled SAR-optical image pairs. To handle this, we design a semi-supervised SAR-optical image matching pipeline that leverages both scarce labeled and abundant unlabeled image pairs and propose a semi-supervised multiscale matching for SAR-optical image matching (S2M2-SAR). Specifically, we pseudo-label those unlabeled SAR-optical image pairs with pseudo ground-truth similarity heatmaps by combining both deep and shallow level matching results, and train the matching model by employing labeled and pseudo-labeled similarity heatmaps. In addition, we introduce a cross-modal feature enhancement module trained using a cross-modality mutual independence loss, which requires no ground-truth labels. This unsupervised objective promotes the separation of modality-shared and modality-specific features by encouraging statistical independence between them, enabling effective feature disentanglement across optical and SAR modalities. To evaluate the effectiveness of S2M2-SAR, we compare it with existing competitors on benchmark datasets. Experimental results demonstrate that S2M2-SAR not only surpasses existing semi-supervised methods but also achieves performance competitive with fully supervised SOTA methods, demonstrating its efficiency and practical potential.
- Abstract(参考訳): 光・合成開口レーダ(SAR)画像の相補的な性質により、SAR-光画像マッチングは大きな関心を集めている。
既存のSAR-光画像マッチング手法の多くは、SAR-光画像ペア内の画素レベルの一致した対応を監督することにより、効果的なマッチング特徴を捉えることを目的としている。
そこで我々は,少ないラベル付きおよび豊富なラベル付き画像ペアを併用した半教師付きSAR-光画像マッチングパイプラインを設計し,SAR-光画像マッチングのための半教師付きマルチスケールマッチングを提案する(S2M2-SAR)。
具体的には、未ラベルのSAR-光画像対に、深部と浅部の両方のマッチング結果を組み合わせることで、擬似的な地上構造類似熱マップを擬似ラベル付けし、ラベル付きおよび擬似ラベル付き類似熱マップを用いてマッチングモデルを訓練する。
さらに,クロスモーダルな相互独立損失をトレーニングしたクロスモーダル機能拡張モジュールを導入する。
この教師なしの目的は、モダリティ共有とモダリティ固有の特徴の分離を促進し、それら間の統計的独立を奨励し、光学およびSARモダリティ間の効果的な特徴の絡み合いを可能にする。
S2M2-SARの有効性を評価するため,既存のベンチマークデータセットと比較した。
実験により,S2M2-SARは既存の半教師付き手法を超越するだけでなく,完全に教師付きSOTA法と競合する性能を実現し,その効率性と実用性を示した。
関連論文リスト
- Collaborative Learning of Scattering and Deep Features for SAR Target Recognition with Noisy Labels [7.324728751991982]
雑音ラベル付きSAR自動目標認識のための散乱・深度特徴の協調学習を提案する。
具体的には、散乱と深い特徴を統合するために、マルチモデル機能融合フレームワークが設計されている。
提案手法は,ラベルノイズの異なる動作条件下での最先端性能を実現することができる。
論文 参考訳(メタデータ) (2025-08-11T06:10:23Z) - Quantitative Comparison of Fine-Tuning Techniques for Pretrained Latent Diffusion Models in the Generation of Unseen SAR Image Concepts [0.0]
本研究は,大規模な事前学習型潜伏拡散モデルの急激な画像領域への適応について検討する:合成開口レーダ(SAR)
我々は、Low-Rank Adaptation (LoRA)のようなフルモデル微調整とパラメータ効率のアプローチを含む、複数の微調整戦略を探索、比較する。
提案手法は,テキストエンコーダのLoRAによる部分的チューニングとSAR>トークンの埋め込み学習を併用して,迅速なアライメントの維持に有効であることを示す。
論文 参考訳(メタデータ) (2025-06-16T09:48:01Z) - Learning from Noisy Pseudo-labels for All-Weather Land Cover Mapping [20.979328369582486]
SAR画像は詳細な情報がなく、大きなスペックルノイズに悩まされている。
近年、擬似ラベルを生成するために、ペアの光学SAR画像のアノテートが試みられている。
半教師付き学習を新たな画像解像度アライメント拡張と共に組み込むことにより、擬似ラベルを生成するためのより正確な方法を提案する。
論文 参考訳(メタデータ) (2025-04-18T04:24:47Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - Joint Image De-noising and Enhancement for Satellite-Based SAR [0.0]
合成開口レーダ(SAR)データから再構成した画像は、乗算ノイズと低コントラストレベルに悩まされる。
本稿では,これらの欠点を同時に扱う手法を提案する。
実際、ノイズ除去とコントラスト強化のプロセスを統一されたアルゴリズムに組み合わせる。
論文 参考訳(メタデータ) (2024-08-06T18:44:16Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Two-Stage Self-Supervised Cycle-Consistency Network for Reconstruction
of Thin-Slice MR Images [62.4428833931443]
太いスライス磁気共鳴(MR)画像は、しばしば冠状および矢状視で構造的にぼやけている。
深層学習は、これらの低分解能(LR)症例から高分解能(HR)薄膜MR画像を再構築する大きな可能性を示している。
MRスライス再構成のための2段階自己監督型サイクル一貫性ネットワーク(TSCNet)を提案する。
論文 参考訳(メタデータ) (2021-06-29T13:29:18Z) - DDet: Dual-path Dynamic Enhancement Network for Real-World Image
Super-Resolution [69.2432352477966]
実画像超解像(Real-SR)は、実世界の高分解能画像(HR)と低分解能画像(LR)の関係に焦点を当てている。
本稿では,Real-SRのためのデュアルパス動的拡張ネットワーク(DDet)を提案する。
特徴表現のための大規模な畳み込みブロックを積み重ねる従来の手法とは異なり、非一貫性のある画像対を研究するためのコンテンツ認識フレームワークを導入する。
論文 参考訳(メタデータ) (2020-02-25T18:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。