論文の概要: MS-Net: A Multi-modal Self-supervised Network for Fine-Grained
Classification of Aircraft in SAR Images
- arxiv url: http://arxiv.org/abs/2308.14613v1
- Date: Mon, 28 Aug 2023 14:28:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 13:36:15.106272
- Title: MS-Net: A Multi-modal Self-supervised Network for Fine-Grained
Classification of Aircraft in SAR Images
- Title(参考訳): MS-Net:SAR画像における航空機の細粒度分類のためのマルチモーダル自己教師ネットワーク
- Authors: Bingying Yue, Jianhao Li, Hao Shi, Yupei Wang, Honghu Zhong
- Abstract要約: 本稿では,航空機の細粒度分類のための新しいマルチモーダル自己教師ネットワーク(MS-Net)を提案する。
ラベルがない場合、提案アルゴリズムは17種類のエアクラフト分類タスクに対して88.46%の精度を達成する。
- 参考スコア(独自算出の注目度): 8.54188605939881
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthetic aperture radar (SAR) imaging technology is commonly used to provide
24-hour all-weather earth observation. However, it still has some drawbacks in
SAR target classification, especially in fine-grained classification of
aircraft: aircrafts in SAR images have large intra-class diversity and
inter-class similarity; the number of effective samples is insufficient and
it's hard to annotate. To address these issues, this article proposes a novel
multi-modal self-supervised network (MS-Net) for fine-grained classification of
aircraft. Firstly, in order to entirely exploit the potential of multi-modal
information, a two-sided path feature extraction network (TSFE-N) is
constructed to enhance the image feature of the target and obtain the domain
knowledge feature of text mode. Secondly, a contrastive self-supervised
learning (CSSL) framework is employed to effectively learn useful
label-independent feature from unbalanced data, a similarity per-ception loss
(SPloss) is proposed to avoid network overfitting. Finally, TSFE-N is used as
the encoder of CSSL to obtain the classification results. Through a large
number of experiments, our MS-Net can effectively reduce the difficulty of
classifying similar types of aircrafts. In the case of no label, the proposed
algorithm achieves an accuracy of 88.46% for 17 types of air-craft
classification task, which has pioneering significance in the field of
fine-grained classification of aircraft in SAR images.
- Abstract(参考訳): 合成開口レーダ(SAR)イメージング技術は、通常24時間の全地球観測に使用される。
SAR画像の航空機は、クラス内での多様性とクラス間の類似性が大きく、有効サンプルの数は不十分であり、注釈を付けることは困難である。
本稿では,航空機の細粒度分類のためのマルチモーダル自己教師ネットワーク(MS-Net)を提案する。
まず,マルチモーダル情報の可能性を完全に活用するために,ターゲットの画像特徴量を高め,テキストモードのドメイン知識特徴を得るために,双方向パス特徴抽出ネットワーク(tsfe-n)を構築した。
第2に,不均衡データから有用なラベル非依存特徴を効果的に学習するために,コントラスト型自己教師付き学習(cssl)フレームワークを用い,ネットワークの過剰フィッティングを回避するために,sploss(sequity per-ception loss)を提案する。
最後に、TSFE-NをCSSLのエンコーダとして使用して分類結果を得る。
多数の実験を通じて、我々のms-netは、類似の航空機の分類の困難を効果的に低減することができる。
ラベルなしの場合、提案アルゴリズムは17種類の航空機分類タスクに対して88.46%の精度を達成し、sar画像における航空機の細粒度分類の分野における先駆的意義を持つ。
関連論文リスト
- Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文 参考訳(メタデータ) (2024-09-09T13:56:22Z) - SAFE: a SAR Feature Extractor based on self-supervised learning and masked Siamese ViTs [5.961207817077044]
マスク付きシームズ・ビジョン・トランスフォーマーをベースとした新しい自己教師型学習フレームワークを提案し,SAFEと命名された汎用SAR機能エクストラクタを提案する。
提案手法は,厳密で一般化可能な特徴を抽出し,ラベルのないSARデータに基づいてモデルを訓練するために,対照的な学習原理を利用する。
サブアパーチャ分解や非特異化など,SAR画像特有のデータ拡張技術を導入する。
我々のネットワークは、評価に使用されるセンサーの訓練を受けなくても、数ショットの分類やセグメンテーションタスクにおいて、他の最先端の手法と競合したり、超えたりしています。
論文 参考訳(メタデータ) (2024-06-30T23:11:20Z) - Efficient Prompt Tuning of Large Vision-Language Model for Fine-Grained
Ship Classification [62.425462136772666]
リモートセンシング(RS-FGSC)における船のきめ細かい分類は、クラス間の高い類似性とラベル付きデータの限られた可用性のために大きな課題となる。
大規模な訓練済みビジョンランゲージモデル(VLM)の最近の進歩は、少数ショット学習やゼロショット学習において印象的な能力を示している。
本研究は, 船種別分類精度を高めるために, VLMの可能性を生かしたものである。
論文 参考訳(メタデータ) (2024-03-13T05:48:58Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Multi-Modal Domain Fusion for Multi-modal Aerial View Object
Classification [4.438928487047433]
マルチモーダルデータから領域不変性を学習するために,新しいマルチモーダルドメイン融合(MDF)ネットワークを提案する。
ネットワークはTrack-1で25.3%、Track-2でトップ5で34.26%の精度でトップ10のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-12-14T05:14:02Z) - SAR-ShipNet: SAR-Ship Detection Neural Network via Bidirectional
Coordinate Attention and Multi-resolution Feature Fusion [7.323279438948967]
本稿では,ニューラルネットワークによる合成開口レーダ(SAR)画像から,事実上有意義な船舶検出問題について検討する。
本稿では,CentralNetに基づく双方向協調注意(BCA)とMRF(Multi- resolution Feature Fusion)を新たに開発したSAR-ShipNet(略してSAR-ShipNet)を提案する。
パブリックなSAR-Shipデータセットの実験結果から,SAR-ShipNetは速度と精度の両面で競争上の優位性を達成していることがわかった。
論文 参考訳(メタデータ) (2022-03-29T12:27:04Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Attentional Feature Refinement and Alignment Network for Aircraft
Detection in SAR Imagery [24.004052923372548]
SAR(Synthetic Aperture Radar)画像における航空機検出は、航空機の離散的な外観、明らかなクラス内変異、小さなサイズ、深刻な背景の干渉のために難しい課題である。
本稿では,SAR画像中の航空機を競合精度と速度で検出する単一ショット検出器AFRANを提案する。
論文 参考訳(メタデータ) (2022-01-18T16:54:49Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - Multi-Objective CNN Based Algorithm for SAR Despeckling [1.933681537640272]
本稿では,SAR画像特性を考慮した多目的コスト関数を持つ畳み込みニューラルネットワーク(CNN)を提案する。
シミュレーションおよび実写SAR画像を用いた実験により,提案手法の精度が,Stand-of-Art despecklingアルゴリズムと比較された。
論文 参考訳(メタデータ) (2020-06-16T10:15:42Z) - DeepEMD: Differentiable Earth Mover's Distance for Few-Shot Learning [122.51237307910878]
我々は,画像領域間の最適なマッチングの新しい視点から,少数ショット画像分類法を開発した。
我々は、高密度画像表現間の構造距離を計算するために、Earth Mover's Distance (EMD) を用いている。
定式化において重要な要素の重みを生成するために,我々は相互参照機構を設計する。
論文 参考訳(メタデータ) (2020-03-15T08:13:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。