論文の概要: Enhancing SAR Object Detection with Self-Supervised Pre-training on Masked Auto-Encoders
- arxiv url: http://arxiv.org/abs/2501.11249v1
- Date: Mon, 20 Jan 2025 03:28:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:22:37.028085
- Title: Enhancing SAR Object Detection with Self-Supervised Pre-training on Masked Auto-Encoders
- Title(参考訳): マスクオートエンコーダの自己教師付き事前学習によるSAR物体検出の高速化
- Authors: Xinyang Pu, Feng Xu,
- Abstract要約: 自己教師付き学習(SSL)は、事前学習プロセス中にSAR画像の特徴表現を学習するために提案される。
提案手法は、SAR画像の適切な潜在表現をキャプチャし、下流タスクにおけるモデル一般化を改善する。
- 参考スコア(独自算出の注目度): 5.234109158596138
- License:
- Abstract: Supervised fine-tuning methods (SFT) perform great efficiency on artificial intelligence interpretation in SAR images, leveraging the powerful representation knowledge from pre-training models. Due to the lack of domain-specific pre-trained backbones in SAR images, the traditional strategies are loading the foundation pre-train models of natural scenes such as ImageNet, whose characteristics of images are extremely different from SAR images. This may hinder the model performance on downstream tasks when adopting SFT on small-scale annotated SAR data. In this paper, an self-supervised learning (SSL) method of masked image modeling based on Masked Auto-Encoders (MAE) is proposed to learn feature representations of SAR images during the pre-training process and benefit the object detection task in SAR images of SFT. The evaluation experiments on the large-scale SAR object detection benchmark named SARDet-100k verify that the proposed method captures proper latent representations of SAR images and improves the model generalization in downstream tasks by converting the pre-trained domain from natural scenes to SAR images through SSL. The proposed method achieves an improvement of 1.3 mAP on the SARDet-100k benchmark compared to only the SFT strategies.
- Abstract(参考訳): 教師付き微調整法(SFT)は、事前学習モデルから強力な表現知識を活用することにより、SAR画像における人工知能の解釈に優れた効率性を発揮する。
SAR画像には、ドメイン固有のトレーニング済みバックボーンが欠如しているため、従来の戦略では、画像の特徴がSAR画像と非常に異なるImageNetのような自然シーンのベーストレーニング済みモデルがロードされている。
これにより、小さな注釈付きSARデータにSFTを採用する場合、下流タスクのモデルパフォーマンスが阻害される可能性がある。
本稿では,マスク付きオートエンコーダ(MAE)を用いた自己教師付き画像モデリング(SSL)手法を提案する。
大規模SARオブジェクト検出ベンチマークであるSARDet-100kの評価実験により,提案手法がSAR画像の適切な潜在表現をキャプチャし,学習済み領域を自然シーンからSSL経由でSAR画像に変換することにより,下流タスクにおけるモデル一般化を改善することを確認した。
SARDet-100k ベンチマークでは,SFT の戦略に比較して 1.3 mAP の改善が得られた。
関連論文リスト
- Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - X-Fake: Juggling Utility Evaluation and Explanation of Simulated SAR Images [49.546627070454456]
実データと模擬データの分散不整合性は、シミュレーションSAR画像の有用性に影響を与える主な障害である。
本稿では,X-Fake で表されるSAR画像の擬似的な説明を初めて行うことで,信頼性の高い実用性評価フレームワークを提案する。
提案手法は、電磁モデルから得られた4つのシミュレーションSAR画像データセットと、生成人工知能アプローチに基づいて検証される。
論文 参考訳(メタデータ) (2024-07-28T09:27:53Z) - SAFE: a SAR Feature Extractor based on self-supervised learning and masked Siamese ViTs [5.961207817077044]
マスク付きシームズ・ビジョン・トランスフォーマーをベースとした新しい自己教師型学習フレームワークを提案し,SAFEと命名された汎用SAR機能エクストラクタを提案する。
提案手法は,厳密で一般化可能な特徴を抽出し,ラベルのないSARデータに基づいてモデルを訓練するために,対照的な学習原理を利用する。
サブアパーチャ分解や非特異化など,SAR画像特有のデータ拡張技術を導入する。
我々のネットワークは、評価に使用されるセンサーの訓練を受けなくても、数ショットの分類やセグメンテーションタスクにおいて、他の最先端の手法と競合したり、超えたりしています。
論文 参考訳(メタデータ) (2024-06-30T23:11:20Z) - Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - On quantifying and improving realism of images generated with diffusion [50.37578424163951]
与えられた画像の5つの統計的測度から算出した画像リアリズムスコア(IRS)と呼ばれるメトリクスを提案する。
IRSは、与えられた画像を実または偽のものとして分類する手段として容易に利用できる。
我々は,安定拡散モデル (SDM) , Dalle2, Midjourney, BigGAN による偽画像の検出に成功して,提案したIRSのモデルおよびデータに依存しない性質を実験的に確立した。
このデータセットは、高品質の4つのモデルによって生成される100のクラスに対して1,000のサンプルを提供します。
論文 参考訳(メタデータ) (2023-09-26T08:32:55Z) - Improved Difference Images for Change Detection Classifiers in SAR
Imagery Using Deep Learning [0.0]
本稿では,SAR画像処理の改良手法を提案する。
この方法は、要求された取得条件の場所から人工的なSAR画像を生成するニューラルネットワークベースのマッピング変換関数に基づいて構築される。
論文 参考訳(メタデータ) (2023-03-31T06:57:34Z) - Transformer-based SAR Image Despeckling [53.99620005035804]
本稿では,SAR画像復号化のためのトランスフォーマーネットワークを提案する。
提案する非特定ネットワークは、トランスフォーマーベースのエンコーダにより、異なる画像領域間のグローバルな依存関係を学習することができる。
実験により,提案手法は従来型および畳み込み型ニューラルネットワークに基づく解法よりも大幅に改善されていることが示された。
論文 参考訳(メタデータ) (2022-01-23T20:09:01Z) - Contrastive Multiview Coding with Electro-optics for SAR Semantic
Segmentation [0.6445605125467573]
SARセマンティックセグメンテーションのためのマルチモーダル表現学習を提案する。
従来の研究とは異なり,本手法ではEO画像,SAR画像,ラベルマスクを併用した。
いくつかの実験により,本手法はモデル性能,サンプル効率,収束速度において既存の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-08-31T23:55:41Z) - Sparse Signal Models for Data Augmentation in Deep Learning ATR [0.8999056386710496]
ドメイン知識を取り入れ,データ集約学習アルゴリズムの一般化能力を向上させるためのデータ拡張手法を提案する。
本研究では,空間領域における散乱中心のスパース性とアジムタル領域における散乱係数の滑らかな変動構造を活かし,過パラメータモデルフィッティングの問題を解く。
論文 参考訳(メタデータ) (2020-12-16T21:46:33Z) - A New Mask R-CNN Based Method for Improved Landslide Detection [54.7905160534631]
本稿では,Mask R-CNN機能を利用した地すべり検出手法を提案する。
地すべり及び非地すべり画像を含む160個の要素からなるデータセットを作成する。
提案アルゴリズムは丘陵地帯の土地利用計画立案者や政策立案者にとって潜在的に有用である。
論文 参考訳(メタデータ) (2020-10-04T07:46:37Z) - Speckle2Void: Deep Self-Supervised SAR Despeckling with Blind-Spot
Convolutional Neural Networks [30.410981386006394]
切り離しはシーン分析アルゴリズムの 重要な予備段階です
ディープラーニングの最近の成功は、新しい世代の非仕様化技術が想定されている。
本稿では,自己教師型ベイズ解法を提案する。
論文 参考訳(メタデータ) (2020-07-04T11:38:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。