論文の概要: DI3CL: Contrastive Learning With Dynamic Instances and Contour Consistency for SAR Land-Cover Classification Foundation Model
- arxiv url: http://arxiv.org/abs/2511.07808v2
- Date: Thu, 13 Nov 2025 01:22:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 14:36:37.048945
- Title: DI3CL: Contrastive Learning With Dynamic Instances and Contour Consistency for SAR Land-Cover Classification Foundation Model
- Title(参考訳): DI3CL: SAR土地被覆分類基礎モデルにおける動的インスタンスと輪郭整合性を用いたコントラスト学習
- Authors: Zhongle Ren, Hui Ding, Kai Wang, Biao Hou, Xingyu Luo, Weibin Li, Licheng Jiao,
- Abstract要約: 本稿では,SAR土地被覆分類のための汎用基盤モデルを開発する。
Dynamic InstanceとContour Consistency Contrastive Learning (DI3CL)事前トレーニングフレームワークが組み込まれている。
その結果,提案したDI3CLは既存手法よりも優れた性能を示した。
- 参考スコア(独自算出の注目度): 47.09803039926004
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although significant advances have been achieved in SAR land-cover classification, recent methods remain predominantly focused on supervised learning, which relies heavily on extensive labeled datasets. This dependency not only limits scalability and generalization but also restricts adaptability to diverse application scenarios. In this paper, a general-purpose foundation model for SAR land-cover classification is developed, serving as a robust cornerstone to accelerate the development and deployment of various downstream models. Specifically, a Dynamic Instance and Contour Consistency Contrastive Learning (DI3CL) pre-training framework is presented, which incorporates a Dynamic Instance (DI) module and a Contour Consistency (CC) module. DI module enhances global contextual awareness by enforcing local consistency across different views of the same region. CC module leverages shallow feature maps to guide the model to focus on the geometric contours of SAR land-cover objects, thereby improving structural discrimination. Additionally, to enhance robustness and generalization during pre-training, a large-scale and diverse dataset named SARSense, comprising 460,532 SAR images, is constructed to enable the model to capture comprehensive and representative features. To evaluate the generalization capability of our foundation model, we conducted extensive experiments across a variety of SAR land-cover classification tasks, including SAR land-cover mapping, water body detection, and road extraction. The results consistently demonstrate that the proposed DI3CL outperforms existing methods. Our code and pre-trained weights are publicly available at: https://github.com/SARpre-train/DI3CL.
- Abstract(参考訳): SARの土地被覆分類では大きな進歩があったが、近年の手法は広範囲なラベル付きデータセットに大きく依存する教師あり学習に重点を置いている。
この依存関係はスケーラビリティと一般化を制限するだけでなく、多様なアプリケーションシナリオへの適応性を制限します。
本稿では,SAR土地被覆分類のための汎用基盤モデルを開発し,様々な下流モデルの開発と展開を加速するための強固な基盤となる。
具体的には、Dynamic InstanceとContour Consistency Consistency Learning(DI3CL)の事前トレーニングフレームワークが紹介され、Dynamic Instance(DI)モジュールとContour Consistency(CC)モジュールが組み込まれている。
DIモジュールは、同じ領域の異なるビューに対して局所的な一貫性を強制することによって、グローバルなコンテキスト認識を強化する。
CCモジュールは浅い特徴マップを利用して、SARランドカバーオブジェクトの幾何学的輪郭に焦点を合わせ、構造的識別を改善する。
さらに、事前トレーニング中の堅牢性と一般化を高めるために、460,532のSAR画像からなるSARSenseという大規模で多様なデータセットを構築し、モデルが包括的で代表的な特徴をキャプチャできるようにする。
基礎モデルの一般化能力を評価するため,SARの土地被覆マッピング,水域検出,道路抽出など,SARの土地被覆分類タスクの多種多様な実験を行った。
その結果,提案したDI3CLは既存手法よりも優れた性能を示した。
私たちのコードと事前トレーニングされたウェイトは、https://github.com/SARpre-train/DI3CLで公開されています。
関連論文リスト
- FUSAR-KLIP: Towards Multimodal Foundation Models for Remote Sensing [16.948824707021412]
クロスモーダル人工知能は近年広く注目を集めており、自然画像の研究において大きな進歩を遂げている。
既存の手法は主にRGB画像用に設計されており、合成開口レーダ(SAR)画像のモデリングにおいて大きなギャップを残している。
本稿では,再利用可能なデータと評価ベースラインとともに,初の汎用SARマルチモーダル基盤モデルであるFUSAR-KLIPを提案する。
論文 参考訳(メタデータ) (2025-09-28T15:03:25Z) - Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - Towards Scalable and Generalizable Earth Observation Data Mining via Foundation Model Composition [0.0]
リモートセンシングと一般ビジョンデータセットに事前訓練された基礎モデルを効果的に組み合わせて性能を向上させることができるかを検討する。
その結果、より小さな事前訓練モデルの特徴レベルのアンサンブルは、はるかに大きなモデルの性能に適合するか、超える可能性があることがわかった。
この研究は、よりコンパクトなモデルにアンサンブルの強度を伝達するために知識蒸留を適用する可能性を強調している。
論文 参考訳(メタデータ) (2025-06-25T07:02:42Z) - SASep: Saliency-Aware Structured Separation of Geometry and Feature for Open Set Learning on Point Clouds [22.753452376062565]
本稿では,3次元物体認識のためのSalience-Aware Structured separation (SASep)を提案する。
SASepは、(i)意味論的分解(TSD)モジュールで、オブジェクトを重要かつ重要でない部分に意味的に分解し、(ii)擬似未知のオブジェクトを生成する幾何学的戦略(GSS)モジュールと、(iii)特徴レベルの分離を強化するための合成支援マージン分離(SMS)モジュールを含む。
実験の結果, SASepは3次元OSRにおいて優れた性能を示し, 既存の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2025-06-16T08:22:11Z) - GCE-Pose: Global Context Enhancement for Category-level Object Pose Estimation [52.910282443646864]
モデルフリーなカテゴリレベルのポーズ推定における重要な課題は、特定のカテゴリ内の様々なインスタンスにまたがって一般化されるコンテキストオブジェクトの特徴の抽出である。
GCE-Poseは、カテゴリレベルのグローバルコンテキストを予め統合することにより、新規インスタンスのポーズ推定を強化する手法である。
論文 参考訳(メタデータ) (2025-02-06T18:35:13Z) - High-Performance Few-Shot Segmentation with Foundation Models: An Empirical Study [64.06777376676513]
基礎モデルに基づく数ショットセグメンテーション(FSS)フレームワークを開発した。
具体的には、基礎モデルから暗黙的な知識を抽出し、粗い対応を構築するための簡単なアプローチを提案する。
2つの広く使われているデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2024-09-10T08:04:11Z) - Style-Hallucinated Dual Consistency Learning: A Unified Framework for
Visual Domain Generalization [113.03189252044773]
本稿では,様々な視覚的タスクにおけるドメインシフトを処理するための統合フレームワークであるStyle-HAllucinated Dual consistEncy Learning (SHADE)を提案する。
我々の汎用SHADEは、画像分類、セマンティックセグメンテーション、オブジェクト検出など、様々な視覚認識タスクにおける一般化を著しく向上させることができる。
論文 参考訳(メタデータ) (2022-12-18T11:42:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。