論文の概要: SARATR-X: Toward Building A Foundation Model for SAR Target Recognition
- arxiv url: http://arxiv.org/abs/2405.09365v5
- Date: Wed, 22 Jan 2025 04:06:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-23 13:29:49.374914
- Title: SARATR-X: Toward Building A Foundation Model for SAR Target Recognition
- Title(参考訳): SARATR-X:SARターゲット認識の基礎モデルの構築に向けて
- Authors: Weijie Li, Wei Yang, Yuenan Hou, Li Liu, Yongxiang Liu, Xiang Li,
- Abstract要約: SAR ATRの基盤モデル構築に向けた最初の試みをSARATR-Xと呼ぶ。
SARATR-Xは、自己教師付き学習(SSL)を通じて一般化可能な表現を学び、汎用的なSARターゲット検出と分類タスクへのラベル効率のモデル適応のための基盤を提供する。
SARATR-Xは0.18Mの未ラベルのSARターゲットサンプルで訓練されており、これは同時代のベンチマークを組み合わせてキュレーションされ、これまでで最大の公開データセットとなっている。
- 参考スコア(独自算出の注目度): 22.770010893572973
- License:
- Abstract: Despite the remarkable progress in synthetic aperture radar automatic target recognition (SAR ATR), recent efforts have concentrated on detecting and classifying a specific category, e.g., vehicles, ships, airplanes, or buildings. One of the fundamental limitations of the top-performing SAR ATR methods is that the learning paradigm is supervised, task-specific, limited-category, closed-world learning, which depends on massive amounts of accurately annotated samples that are expensively labeled by expert SAR analysts and have limited generalization capability and scalability. In this work, we make the first attempt towards building a foundation model for SAR ATR, termed SARATR-X. SARATR-X learns generalizable representations via self-supervised learning (SSL) and provides a cornerstone for label-efficient model adaptation to generic SAR target detection and classification tasks. Specifically, SARATR-X is trained on 0.18 M unlabelled SAR target samples, which are curated by combining contemporary benchmarks and constitute the largest publicly available dataset till now. Considering the characteristics of SAR images, a backbone tailored for SAR ATR is carefully designed, and a two-step SSL method endowed with multi-scale gradient features was applied to ensure the feature diversity and model scalability of SARATR-X. The capabilities of SARATR-X are evaluated on classification under few-shot and robustness settings and detection across various categories and scenes, and impressive performance is achieved, often competitive with or even superior to prior fully supervised, semi-supervised, or self-supervised algorithms. Our SARATR-X and the curated dataset are released at https://github.com/waterdisappear/SARATR-X to foster research into foundation models for SAR image interpretation.
- Abstract(参考訳): 合成開口レーダー自動目標認識(SAR ATR)の顕著な進歩にもかかわらず、近年の取り組みは車両、船舶、航空機、建物などの特定のカテゴリーの検出と分類に集中している。
トップパフォーマンスのSAR ATR手法の基本的な制限の1つは、学習パラダイムが教師付き、タスク特化、制限付き、クローズドワールドラーニングである。
本研究では,SAR ATRの基盤モデル構築に向けた最初の試みであるSARATR-Xについて述べる。
SARATR-Xは、自己教師付き学習(SSL)を通じて一般化可能な表現を学び、汎用的なSARターゲット検出と分類タスクへのラベル効率のモデル適応のための基盤を提供する。
具体的には、SARATR-Xは0.18Mの未ラベルのSARターゲットサンプルでトレーニングされており、これは現代のベンチマークを組み合わせてキュレーションされ、これまでで最大の公開データセットとなっている。
SAR画像の特徴を考慮すると、SAR ATR用に調整されたバックボーンを慎重に設計し、SARATR-Xの特徴多様性とモデルのスケーラビリティを確保するために、マルチスケール勾配特徴を付与した2ステップSSL手法を適用した。
SARATR-Xの能力は、いくつかのショットと頑健な設定に基づいて評価され、様々なカテゴリやシーンで検出される。
我々のSARATR-Xとキュレートされたデータセットはhttps://github.com/waterdisappear/SARATR-Xで公開され、SAR画像解釈の基礎モデルの研究が促進される。
関連論文リスト
- IncSAR: A Dual Fusion Incremental Learning Framework for SAR Target Recognition [13.783950035836593]
IncSARは、ターゲット認識における破滅的な忘れに対処するために設計された漸進的な学習フレームワークである。
SAR画像に固有のスペックルノイズを軽減するため、ニューラルネットワーク近似に基づくデノナイジングモジュールを用いる。
MSTAR、SAR-AIRcraft-1.0、OpenSARShipベンチマークデータセットの実験は、IncSARが最先端のアプローチを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2024-10-08T08:49:47Z) - SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文 参考訳(メタデータ) (2024-03-11T09:20:40Z) - Benchmarking Deep Learning Classifiers for SAR Automatic Target
Recognition [7.858656052565242]
本稿では,複数のSARデータセットを用いたSAR ATRの先進的な深層学習モデルを総合的にベンチマークする。
推論スループットと解析性能の観点から,分類精度のランタイム性能に関する5つの分類器の評価と比較を行った。
SAR ATRの領域では、すべてのモデルルールが疑わしいのです。
論文 参考訳(メタデータ) (2023-12-12T02:20:39Z) - Predicting Gradient is Better: Exploring Self-Supervised Learning for SAR ATR with a Joint-Embedding Predictive Architecture [23.375515181854254]
SSL(Self-Supervised Learning)手法は,大規模未ラベルデータの事前学習を伴う様々なSAR自動ターゲット認識(ATR)タスクを実現する。
SSLはデータから直接監視信号を構築することを目的としている。
本研究では,SAR ATRの基盤モデル構築に有効なSSL方式について検討した。
論文 参考訳(メタデータ) (2023-11-26T01:05:55Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - A Global Model Approach to Robust Few-Shot SAR Automatic Target
Recognition [6.260916845720537]
ディープラーニングベースのSAR自動ターゲット認識(ATR)モデルをトレーニングするために、クラス毎に数百のラベル付きサンプルを収集できるとは限らない。
この研究は特に数発のSAR ATR問題に対処しており、興味のあるタスクをサポートするためにラベル付きサンプルがわずかである。
論文 参考訳(メタデータ) (2023-03-20T00:24:05Z) - Open-Set Automatic Target Recognition [52.27048031302509]
オートマチックターゲット認識(Automatic Target Recognition、ATR)は、異なるセンサーから取得したデータに基づいてターゲットを認識しようとするコンピュータビジョンアルゴリズムのカテゴリである。
既存のATRアルゴリズムは、トレーニングとテストが同じクラス分布を持つ従来のクローズドセット手法向けに開発されている。
ATRアルゴリズムのオープンセット認識機能を実現するためのオープンセット自動ターゲット認識フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-10T21:28:24Z) - Open-Set Recognition: A Good Closed-Set Classifier is All You Need [146.6814176602689]
分類器が「ゼロ・オブ・ア・ア・ア・ベ」決定を行う能力は、閉集合クラスにおける精度と高い相関関係があることが示される。
この相関を利用して、閉セット精度を向上させることにより、クロスエントロピーOSR'ベースライン'の性能を向上させる。
また、セマンティックノベルティを検出するタスクをより尊重する新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2021-10-12T17:58:59Z) - SCARF: Self-Supervised Contrastive Learning using Random Feature
Corruption [72.35532598131176]
本稿では,特徴のランダムなサブセットを乱してビューを形成するコントラスト学習手法であるSCARFを提案する。
SCARFは既存の戦略を補完し、オートエンコーダのような代替手段より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-29T08:08:33Z) - Automatic Target Recognition on Synthetic Aperture Radar Imagery: A
Survey [0.0]
本稿では,SAR ATRアーキテクチャの分類法と,標準および拡張された運用条件下でのそれぞれの手法の長所と短所の比較を行う。
MSTARは標準的なSAR ATRベンチマークデータセットであるにもかかわらず、弱点を強調し、今後の研究方向性を提案する。
論文 参考訳(メタデータ) (2020-07-04T14:22:30Z) - X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for
Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。
X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。
我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文 参考訳(メタデータ) (2020-06-24T15:29:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。