論文の概要: SARMAE: Masked Autoencoder for SAR Representation Learning
- arxiv url: http://arxiv.org/abs/2512.16635v1
- Date: Thu, 18 Dec 2025 15:10:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:32.115072
- Title: SARMAE: Masked Autoencoder for SAR Representation Learning
- Title(参考訳): SARMAE:SAR表現学習のためのマスクオートエンコーダ
- Authors: Danxu Liu, Di Wang, Hebaixu Wang, Haoyang Chen, Wentao Jiang, Yilin Cheng, Haonan Guo, Wei Cui, Jing Zhang,
- Abstract要約: 自己教師型SAR表現学習のためのノイズ対応マスク付き自動エンコーダであるSARMAEを提案する。
SARMAEは、SAR固有のスペックルノイズをマスク付きオートエンコーダに注入し、ノイズ認識と堅牢な表現学習を容易にする。
複数のSARデータセットに対する実験は、SARMAEが分類、検出、セグメンテーションタスクにおける最先端のパフォーマンスを達成することを示した。
- 参考スコア(独自算出の注目度): 17.36199520462285
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthetic Aperture Radar (SAR) imagery plays a critical role in all-weather, day-and-night remote sensing applications. However, existing SAR-oriented deep learning is constrained by data scarcity, while the physically grounded speckle noise in SAR imagery further hampers fine-grained semantic representation learning. To address these challenges, we propose SARMAE, a Noise-Aware Masked Autoencoder for self-supervised SAR representation learning. Specifically, we construct SAR-1M, the first million-scale SAR dataset, with additional paired optical images, to enable large-scale pre-training. Building upon this, we design Speckle-Aware Representation Enhancement (SARE), which injects SAR-specific speckle noise into masked autoencoders to facilitate noise-aware and robust representation learning. Furthermore, we introduce Semantic Anchor Representation Constraint (SARC), which leverages paired optical priors to align SAR features and ensure semantic consistency. Extensive experiments across multiple SAR datasets demonstrate that SARMAE achieves state-of-the-art performance on classification, detection, and segmentation tasks. Code and models will be available at https://github.com/MiliLab/SARMAE.
- Abstract(参考訳): 合成開口レーダ(SAR)画像は、全天候、昼夜のリモートセンシングアプリケーションにおいて重要な役割を果たす。
しかし、既存のSAR指向の深層学習はデータ不足によって制約される一方、SAR画像における物理的に接地されたスペックルノイズは、よりきめ細かなセマンティックな表現学習を妨げている。
これらの課題に対処するために、自己教師型SAR表現学習のためのノイズ対応マスク付き自動エンコーダであるSARMAEを提案する。
具体的には、SAR-1Mという最初の100万のSARデータセットと、さらにペア化された光学画像を構築し、大規模な事前学習を可能にする。
そこで我々は,SARE(Speckle-Aware Representation Enhancement)を設計し,SAR固有のスペックルノイズをマスク付きオートエンコーダに注入し,ノイズ認識と堅牢な表現学習を容易にする。
さらに,セマンティックアンカー表現制約(SARC)を導入し,SARの特徴の整合とセマンティック一貫性の確保を図る。
複数のSARデータセットにわたる大規模な実験は、SARMAEが分類、検出、セグメンテーションタスクにおける最先端のパフォーマンスを達成することを示した。
コードとモデルはhttps://github.com/MiliLab/SARMAE.comから入手できる。
関連論文リスト
- SARCLIP: A Vision Language Foundation Model for Semantic Understanding and Target Recognition in SAR Imagery [46.87845911116779]
SARCLIPは、SARドメインに適した最初のビジョン言語基盤モデルである。
SARCLIPは、ドメイン転送戦略によって対照的な視覚言語学習アプローチを用いて訓練される。
画像テキスト検索とゼロショット分類タスクの実験は、SARCLIPの優れた性能を示す。
論文 参考訳(メタデータ) (2025-10-26T13:04:50Z) - Annotation-Free Open-Vocabulary Segmentation for Remote-Sensing Images [51.74614065919118]
本稿では,アノテーションのないRS画像のオープン語彙セグメンテーションのための最初のフレームワークであるSegEarth-OVを紹介する。
粗い特徴から高分解能空間の詳細を頑健に復元する普遍的なアップサンプラーであるSimFeatUpを提案する。
また、パッチ機能から固有のグローバルコンテキストを抽出するための、シンプルで効果的なグローバルバイアス緩和操作も提示する。
論文 参考訳(メタデータ) (2025-08-25T14:22:57Z) - SAR-W-MixMAE: SAR Foundation Model Training Using Backscatter Power Weighting [3.618534280726541]
マスク付きオートエンコーダ(MAE)などの基礎モデルアプローチや、そのバリエーションが衛星画像に適用されている。
セマンティックラベリングによるデータセット作成の困難さと光学画像に対する高ノイズコンテントのため、SAR(Synthetic Aperture Radar)データは基礎モデルの分野ではあまり研究されていない。
本研究では,マスク付きオートエンコーダ,特にSentinel-1 SAR画像上のMixMAEとそのSAR画像分類タスクへの影響について検討した。
論文 参考訳(メタデータ) (2025-03-03T05:09:44Z) - SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文 参考訳(メタデータ) (2024-03-11T09:20:40Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Predicting Gradient is Better: Exploring Self-Supervised Learning for SAR ATR with a Joint-Embedding Predictive Architecture [23.375515181854254]
SSL(Self-Supervised Learning)手法は,大規模未ラベルデータの事前学習を伴う様々なSAR自動ターゲット認識(ATR)タスクを実現する。
SSLはデータから直接監視信号を構築することを目的としている。
本研究では,SAR ATRの基盤モデル構築に有効なSSL方式について検討した。
論文 参考訳(メタデータ) (2023-11-26T01:05:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。