論文の概要: MTSGL: Multi-Task Structure Guided Learning for Robust and Interpretable SAR Aircraft Recognition
- arxiv url: http://arxiv.org/abs/2504.16467v1
- Date: Wed, 23 Apr 2025 07:27:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.032035
- Title: MTSGL: Multi-Task Structure Guided Learning for Robust and Interpretable SAR Aircraft Recognition
- Title(参考訳): MTSGL:ロバストかつ解釈可能なSAR航空機認識のためのマルチタスク構造学習
- Authors: Qishan He, Lingjun Zhao, Ru Luo, Siqian Zhang, Lin Lei, Kefeng Ji, Gangyao Kuang,
- Abstract要約: 本稿では,SAR航空機認識のためのマルチタスク構造誘導学習(MTSGL)ネットワークを提案する。
MTSGLは構造的意味認識(SSA)モジュールと構造的整合正則化(SCR)モジュールを含む。
結論として、MTSGLは、人間の認知過程に類似した方法で航空機の概念を理解することを目的として、専門レベルの航空機事前知識と構造学習パラダイムを提示する。
- 参考スコア(独自算出の注目度): 16.88286091071643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aircraft recognition in synthetic aperture radar (SAR) imagery is a fundamental mission in both military and civilian applications. Recently deep learning (DL) has emerged a dominant paradigm for its explosive performance on extracting discriminative features. However, current classification algorithms focus primarily on learning decision hyperplane without enough comprehension on aircraft structural knowledge. Inspired by the fined aircraft annotation methods for optical remote sensing images (RSI), we first introduce a structure-based SAR aircraft annotations approach to provide structural and compositional supplement information. On this basis, we propose a multi-task structure guided learning (MTSGL) network for robust and interpretable SAR aircraft recognition. Besides the classification task, MTSGL includes a structural semantic awareness (SSA) module and a structural consistency regularization (SCR) module. The SSA is designed to capture structure semantic information, which is conducive to gain human-like comprehension of aircraft knowledge. The SCR helps maintain the geometric consistency between the aircraft structure in SAR imagery and the proposed annotation. In this process, the structural attribute can be disentangled in a geometrically meaningful manner. In conclusion, the MTSGL is presented with the expert-level aircraft prior knowledge and structure guided learning paradigm, aiming to comprehend the aircraft concept in a way analogous to the human cognitive process. Extensive experiments are conducted on a self-constructed multi-task SAR aircraft recognition dataset (MT-SARD) and the effective results illustrate the superiority of robustness and interpretation ability of the proposed MTSGL.
- Abstract(参考訳): 合成開口レーダー(SAR)画像における航空機の認識は、軍用と民間の両方の用途において基本的な任務である。
近年,識別的特徴抽出における爆発的性能のパラダイムとして,深層学習(DL)が主流となっている。
しかし、現在の分類アルゴリズムは、主に航空機の構造的知識を十分に理解することなく、決定超平面を学習することに焦点を当てている。
光リモートセンシング画像(RSI)のための細かな航空機アノテーション手法に着想を得て、構造的・構成的補助情報を提供する構造的SAR航空機アノテーション手法を最初に導入する。
そこで本研究では,SAR航空機認識のためのマルチタスク構造誘導学習(MTSGL)ネットワークを提案する。
分類タスクに加えて、MTSGLは構造的意味認識(SSA)モジュールと構造的一貫性正規化(SCR)モジュールを含んでいる。
SSAは、航空機の知識を人間のように理解するための構造的意味情報を取得するように設計されている。
SCRは、SAR画像中の航空機構造と提案したアノテーションとの間の幾何的整合性を維持するのに役立つ。
この過程において、構造属性は幾何学的に意味のある方法で切り離すことができる。
結論として、MTSGLは、人間の認知過程に類似した方法で航空機の概念を理解することを目的として、専門レベルの航空機事前知識と構造学習パラダイムを提示する。
自己構築型マルチタスクSAR航空機認識データセット(MT-SARD)で大規模な実験を行い、提案したMTSGLの堅牢性と解釈能力の優位性を示す。
関連論文リスト
- Unpaired Object-Level SAR-to-Optical Image Translation for Aircraft with Keypoints-Guided Diffusion Models [4.6570959687411975]
SAR画像を光学画像に変換することは、下流タスクの解釈とサポートを強化するための有望な解決策である。
本研究では,無人航空機のSAR-光画像変換のためのキーポイント誘導拡散モデル(KeypointDiff)を提案する。
論文 参考訳(メタデータ) (2025-03-25T16:05:49Z) - Physics-Guided Detector for SAR Airplanes [48.11882103050703]
SAR航空機のための新しい物理誘導検出器(PGD)学習パラダイムを提案する。
検出性能を向上させるために、その離散性と変動性を包括的に調査する。
実験では,提案したPGDの柔軟性と有効性を示す。
論文 参考訳(メタデータ) (2024-11-19T07:41:09Z) - StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization [94.31508613367296]
Retrieval-augmented Generation(RAG)は、大規模言語モデル(LLM)を効果的に強化する鍵となる手段である。
本稿では,手前のタスクに対して最適な構造型を識別し,元の文書をこの構造化形式に再構成し,その結果に基づいて回答を推測するStructRAGを提案する。
実験の結果、StructRAGは最先端のパフォーマンスを実現し、特に挑戦的なシナリオに優れていた。
論文 参考訳(メタデータ) (2024-10-11T13:52:44Z) - SAFE: a SAR Feature Extractor based on self-supervised learning and masked Siamese ViTs [5.961207817077044]
マスク付きシームズ・ビジョン・トランスフォーマーをベースとした新しい自己教師型学習フレームワークを提案し,SAFEと命名された汎用SAR機能エクストラクタを提案する。
提案手法は,厳密で一般化可能な特徴を抽出し,ラベルのないSARデータに基づいてモデルを訓練するために,対照的な学習原理を利用する。
サブアパーチャ分解や非特異化など,SAR画像特有のデータ拡張技術を導入する。
我々のネットワークは、評価に使用されるセンサーの訓練を受けなくても、数ショットの分類やセグメンテーションタスクにおいて、他の最先端の手法と競合したり、超えたりしています。
論文 参考訳(メタデータ) (2024-06-30T23:11:20Z) - Efficient Prompt Tuning of Large Vision-Language Model for Fine-Grained Ship Classification [59.99976102069976]
リモートセンシング(RS-FGSC)における船のきめ細かい分類は、クラス間の高い類似性とラベル付きデータの限られた可用性のために大きな課題となる。
大規模な訓練済みビジョンランゲージモデル(VLM)の最近の進歩は、少数ショット学習やゼロショット学習において印象的な能力を示している。
本研究は, 船種別分類精度を高めるために, VLMの可能性を生かしたものである。
論文 参考訳(メタデータ) (2024-03-13T05:48:58Z) - MS-Net: A Multi-modal Self-supervised Network for Fine-Grained
Classification of Aircraft in SAR Images [8.54188605939881]
本稿では,航空機の細粒度分類のための新しいマルチモーダル自己教師ネットワーク(MS-Net)を提案する。
ラベルがない場合、提案アルゴリズムは17種類のエアクラフト分類タスクに対して88.46%の精度を達成する。
論文 参考訳(メタデータ) (2023-08-28T14:28:50Z) - Structure-CLIP: Towards Scene Graph Knowledge to Enhance Multi-modal
Structured Representations [70.41385310930846]
マルチモーダルな構造表現を強化するためのエンドツーエンドフレームワークであるStructure-CLIPを提案する。
シーングラフを用いてセマンティックなネガティブな例の構築をガイドし、その結果、構造化された表現の学習に重点を置いている。
知識エンハンス(KEE)は、SGKを入力として活用し、構造化表現をさらに強化するために提案される。
論文 参考訳(メタデータ) (2023-05-06T03:57:05Z) - SIM-Trans: Structure Information Modeling Transformer for Fine-grained
Visual Categorization [59.732036564862796]
本稿では,オブジェクト構造情報を変換器に組み込んだSIM-Trans(Structure Information Modeling Transformer)を提案する。
提案した2つのモジュールは軽量化されており、任意のトランスフォーマーネットワークにプラグインでき、エンドツーエンドで容易に訓練できる。
実験と解析により,提案したSIM-Transが細粒度視覚分類ベンチマークの最先端性能を達成することを示した。
論文 参考訳(メタデータ) (2022-08-31T03:00:07Z) - Attentional Feature Refinement and Alignment Network for Aircraft
Detection in SAR Imagery [24.004052923372548]
SAR(Synthetic Aperture Radar)画像における航空機検出は、航空機の離散的な外観、明らかなクラス内変異、小さなサイズ、深刻な背景の干渉のために難しい課題である。
本稿では,SAR画像中の航空機を競合精度と速度で検出する単一ショット検出器AFRANを提案する。
論文 参考訳(メタデータ) (2022-01-18T16:54:49Z) - RC-Struct: A Structure-based Neural Network Approach for MIMO-OFDM
Detection [33.414673669107906]
信号検出のための構造ベースニューラルネットワークアーキテクチャであるRC-Structを導入する。
RC構造は貯水池計算(RC)を通して信号の時間構造を利用する
紹介されたRC-Structは、5Gと5G Beyondの通信ドメイン知識と学習ベースの受信処理の組み合わせに光を当てている。
論文 参考訳(メタデータ) (2021-10-03T19:39:21Z) - Structure-Preserving Image Super-Resolution [94.16949589128296]
単一画像超解像(SISR)の構造
近年の研究では、フォトリアリスティック画像の復元によるSISRの開発が進められている。
しかし、回収された画像にはいまだ望ましくない構造歪みがある。
論文 参考訳(メタデータ) (2021-09-26T08:48:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。