論文の概要: SAR Object Detection with Self-Supervised Pretraining and Curriculum-Aware Sampling
- arxiv url: http://arxiv.org/abs/2504.13310v1
- Date: Thu, 17 Apr 2025 19:44:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-28 20:22:05.555027
- Title: SAR Object Detection with Self-Supervised Pretraining and Curriculum-Aware Sampling
- Title(参考訳): 自己監督型事前学習とカリキュラム対応サンプリングによるSAR物体検出
- Authors: Yasin Almalioglu, Andrzej Kucik, Geoffrey French, Dafni Antotsiou, Alexander Adam, Cedric Archambeau,
- Abstract要約: 衛星搭載合成開口レーダ画像における物体検出は、都市モニタリングや災害対応といったタスクにおいて大きな可能性を秘めている。
衛星搭載SAR画像における小さな物体の検出は、比較的低い空間分解能と固有のノイズのため、特に複雑な問題を引き起こす。
本稿では,SARオブジェクト検出モデルであるTransARを紹介する。
- 参考スコア(独自算出の注目度): 41.24071764578782
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Object detection in satellite-borne Synthetic Aperture Radar (SAR) imagery holds immense potential in tasks such as urban monitoring and disaster response. However, the inherent complexities of SAR data and the scarcity of annotations present significant challenges in the advancement of object detection in this domain. Notably, the detection of small objects in satellite-borne SAR images poses a particularly intricate problem, because of the technology's relatively low spatial resolution and inherent noise. Furthermore, the lack of large labelled SAR datasets hinders the development of supervised deep learning-based object detection models. In this paper, we introduce TRANSAR, a novel self-supervised end-to-end vision transformer-based SAR object detection model that incorporates masked image pre-training on an unlabeled SAR image dataset that spans more than $25,700$ km\textsuperscript{2} ground area. Unlike traditional object detection formulation, our approach capitalises on auxiliary binary semantic segmentation, designed to segregate objects of interest during the post-tuning, especially the smaller ones, from the background. In addition, to address the innate class imbalance due to the disproportion of the object to the image size, we introduce an adaptive sampling scheduler that dynamically adjusts the target class distribution during training based on curriculum learning and model feedback. This approach allows us to outperform conventional supervised architecture such as DeepLabv3 or UNet, and state-of-the-art self-supervised learning-based arhitectures such as DPT, SegFormer or UperNet, as shown by extensive evaluations on benchmark SAR datasets.
- Abstract(参考訳): 衛星搭載SAR(Synthetic Aperture Radar)画像における物体検出は、都市モニタリングや災害対応といったタスクにおいて大きな可能性を秘めている。
しかし、SARデータの本質的な複雑さとアノテーションの不足は、この領域におけるオブジェクト検出の進歩に重大な課題をもたらしている。
特に、衛星搭載SAR画像における小さな物体の検出は、比較的低い空間分解能と固有のノイズのため、特に複雑な問題を引き起こす。
さらに、ラベル付きSARデータセットの欠如は、教師付きディープラーニングベースのオブジェクト検出モデルの開発を妨げる。
本稿では,SAR画像データセットにマスク付き画像事前学習を組み込んだ,自己教師型エンド・ツー・エンド・エンド・ビジョン・トランスフォーマーに基づくSARオブジェクト検出モデルであるTransARを紹介する。
従来の物体検出の定式化とは異なり,本手法は,学習後,特に小型の物体を背景から分離するために設計された補助的二分的セマンティックセマンティックセマンティックセマンティクスを利用する。
また,対象物が画像サイズに分散しているため,自然クラス不均衡に対処するために,カリキュラム学習とモデルフィードバックに基づいて,学習中の目標クラス分布を動的に調整する適応型サンプリングスケジューラを導入する。
提案手法は,DPTやSegFormer,UperNetといった最先端の自己教師型学習型アロイテクチャを,ベンチマークSARデータセットの広範な評価で示すように,DeepLabv3やUNetなどの従来の教師型アーキテクチャよりも優れています。
関連論文リスト
- BOOTPLACE: Bootstrapped Object Placement with Detection Transformers [23.300369070771836]
本稿では,オブジェクト配置を位置検出問題として定式化する新しいパラダイムであるBOOTPLACEを紹介する。
確立されたベンチマークの実験結果は、BOOTPLACEのオブジェクト再配置における優れた性能を示している。
論文 参考訳(メタデータ) (2025-03-27T21:21:20Z) - Generalization-Enhanced Few-Shot Object Detection in Remote Sensing [22.411751110592842]
Few-shot Object Detection (FSOD) は、データ制限条件下でのオブジェクト検出の課題をターゲットにしている。
リモートセンシングタスクにおける一般化機能を改善するために,GE-FSODモデルを提案する。
我々のモデルでは、CFPAN(Cross-Level Fusion Pyramid Attention Network)、MRRPN(Multi-Stage Refinement Region Proposal Network)、GCL(Generalized Classification Loss)の3つの重要なイノベーションを紹介している。
論文 参考訳(メタデータ) (2025-01-05T08:12:25Z) - Analysis of Object Detection Models for Tiny Object in Satellite Imagery: A Dataset-Centric Approach [0.0]
本稿では,衛星画像におけるSOD(Small-Object-Detection)の領域について述べる。
従来のオブジェクト検出モデルは、コンテキスト情報やクラス不均衡が限られたため、小さなオブジェクトを検出するのに困難に直面している。
本研究の目的は,衛星画像における微小物体検出に関する貴重な知見を,最先端のモデルを用いて実証的に評価することである。
論文 参考訳(メタデータ) (2024-12-12T07:06:22Z) - SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文 参考訳(メタデータ) (2024-03-11T09:20:40Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Knowledge Distillation for Oriented Object Detection on Aerial Images [1.827510863075184]
本稿では,KD-RNetの知識蒸留による空中画像の回転物体検出のためのモデル圧縮手法を提案する。
大規模空中物体検出データセット(DOTA)による実験結果から,提案したKD-RNetモデルにより,パラメータ数を削減した平均値精度(mAP)が向上し,同時にKD-RNetは,基底アノテーションと高い重なり合う高品質検出を提供することで,性能を向上することを示した。
論文 参考訳(メタデータ) (2022-06-20T14:24:16Z) - Context-Preserving Instance-Level Augmentation and Deformable
Convolution Networks for SAR Ship Detection [50.53262868498824]
ランダムな方向と部分的な情報損失によるSAR画像のターゲット形状の変形は、SAR船の検出において必須の課題である。
ターゲット内の部分的な情報損失に頑健なディープネットワークをトレーニングするためのデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2022-02-14T07:01:01Z) - Learning class prototypes from Synthetic InSAR with Vision Transformers [2.41710192205034]
火山活動の早期の兆候の検出は、火山の危険を評価するために重要である。
本稿では,合成干渉図の豊富な情報源を利用した新しい深層学習手法を提案する。
本報告では, 火山変動検出技術に勝る検出精度について報告する。
論文 参考訳(メタデータ) (2022-01-09T14:03:00Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。