論文の概要: Remote Sensing Image Classification using Transfer Learning and
Attention Based Deep Neural Network
- arxiv url: http://arxiv.org/abs/2206.13392v1
- Date: Mon, 20 Jun 2022 10:05:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-04 00:50:36.451842
- Title: Remote Sensing Image Classification using Transfer Learning and
Attention Based Deep Neural Network
- Title(参考訳): 伝達学習と注意に基づく深層ニューラルネットワークを用いたリモートセンシング画像分類
- Authors: Lam Pham, Khoa Tran, Dat Ngo, Jasmin Lampert, Alexander Schindler
- Abstract要約: 本稿では、転送学習技術とマルチヘッドアテンションスキームを活用した、深層学習に基づくRSISCフレームワークを提案する。
提案したディープラーニングフレームワークは、ベンチマークNWPU-RESISC45データセットに基づいて評価され、最高の分類精度94.7%を達成する。
- 参考スコア(独自算出の注目度): 59.86658316440461
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The task of remote sensing image scene classification (RSISC), which aims at
classifying remote sensing images into groups of semantic categories based on
their contents, has taken the important role in a wide range of applications
such as urban planning, natural hazards detection, environment
monitoring,vegetation mapping, or geospatial object detection. During the past
years, research community focusing on RSISC task has shown significant effort
to publish diverse datasets as well as propose different approaches to deal
with the RSISC challenges. Recently, almost proposed RSISC systems base on deep
learning models which prove powerful and outperform traditional approaches
using image processing and machine learning. In this paper, we also leverage
the power of deep learning technology, evaluate a variety of deep neural
network architectures, indicate main factors affecting the performance of a
RSISC system. Given the comprehensive analysis, we propose a deep learning
based framework for RSISC, which makes use of the transfer learning technique
and multihead attention scheme. The proposed deep learning framework is
evaluated on the benchmark NWPU-RESISC45 dataset and achieves the best
classification accuracy of 94.7% which shows competitive to the
state-of-the-art systems and potential for real-life applications.
- Abstract(参考訳): リモートセンシング画像シーン分類(remote sensing image scene classification, rsisc)の課題は、その内容に基づいて、リモートセンシング画像を意味カテゴリーのグループに分類することを目的としており、都市計画、自然災害検出、環境モニタリング、植生マッピング、地理空間オブジェクト検出など、幅広いアプリケーションにおいて重要な役割を担っている。
過去数年間、rsiscタスクに焦点を当てた研究コミュニティは、さまざまなデータセットを公開すると同時に、rsiscの課題に対処するためのさまざまなアプローチを提案している。
近年、ほぼ提案されているRSISCシステムは、画像処理と機械学習を用いた従来のアプローチよりも強力で優れたディープラーニングモデルに基づいている。
本稿では、ディープラーニング技術のパワーを活用し、様々なディープニューラルネットワークアーキテクチャを評価し、RSISCシステムの性能に影響を及ぼす主な要因を示す。
包括的分析から,伝達学習手法とマルチヘッドアテンション方式を応用した,深層学習に基づくRSISCフレームワークを提案する。
提案したディープラーニングフレームワークは、ベンチマークNWPU-RESISC45データセットに基づいて評価され、最先端システムと競合し、リアルタイムアプリケーションの可能性を示す94.7%の最高の分類精度を達成する。
関連論文リスト
- SAFE: a SAR Feature Extractor based on self-supervised learning and masked Siamese ViTs [5.961207817077044]
マスク付きシームズ・ビジョン・トランスフォーマーをベースとした新しい自己教師型学習フレームワークを提案し,SAFEと命名された汎用SAR機能エクストラクタを提案する。
提案手法は,厳密で一般化可能な特徴を抽出し,ラベルのないSARデータに基づいてモデルを訓練するために,対照的な学習原理を利用する。
サブアパーチャ分解や非特異化など,SAR画像特有のデータ拡張技術を導入する。
我々のネットワークは、評価に使用されるセンサーの訓練を受けなくても、数ショットの分類やセグメンテーションタスクにおいて、他の最先端の手法と競合したり、超えたりしています。
論文 参考訳(メタデータ) (2024-06-30T23:11:20Z) - Dehazing Remote Sensing and UAV Imagery: A Review of Deep Learning, Prior-based, and Hybrid Approaches [4.516330345599765]
高品質な画像は、リモートセンシングおよびUAVアプリケーションに不可欠である。
大気ヘイズは 画像の質を著しく低下させ 画像の劣化を 重要な研究領域にします
論文 参考訳(メタデータ) (2024-05-13T07:35:24Z) - ADASR: An Adversarial Auto-Augmentation Framework for Hyperspectral and
Multispectral Data Fusion [54.668445421149364]
HSI(Deep Learning-based Hyperspectral Image)は、HSI(Hyperspectral Image)とMSI(Multispectral Image)を深層ニューラルネットワーク(DNN)に融合させることにより、高空間分解能HSI(HR-HSI)を生成することを目的としている。
本稿では, HSI-MSI 融合のためのデータ多様性を向上するために, HSI-MSI サンプルペアの自動最適化と拡張を行う新しい逆自動データ拡張フレームワーク ADASR を提案する。
論文 参考訳(メタデータ) (2023-10-11T07:30:37Z) - Multi-spectral Class Center Network for Face Manipulation Detection and Localization [52.569170436393165]
顔の操作検出と局所化のための新しいマルチスペクトル・クラス・センター・ネットワーク(MSCCNet)を提案する。
周波数帯域の異なる特徴に基づき、MSCCモジュールはマルチスペクトルクラスセンターを収集し、ピクセル対クラス関係を計算する。
多スペクトルクラスレベルの表現を適用することで、偽画像の操作された領域に敏感な視覚概念の意味情報を抑えることができる。
論文 参考訳(メタデータ) (2023-05-18T08:09:20Z) - Impact of a DCT-driven Loss in Attention-based Knowledge-Distillation
for Scene Recognition [64.29650787243443]
本稿では, アクティベーションマップの2次元周波数変換を転送前に提案し, 解析する。
この戦略は、シーン認識などのタスクにおける知識伝達可能性を高める。
我々は、この論文で使われているトレーニングおよび評価フレームワークを、http://www.vpu.eps.uam.es/publications/DCTBasedKDForSceneRecognitionで公開しています。
論文 参考訳(メタデータ) (2022-05-04T11:05:18Z) - RSBNet: One-Shot Neural Architecture Search for A Backbone Network in
Remote Sensing Image Recognition [43.95699860302204]
本稿では、シーン分類、土地被覆分類、オブジェクト検出を含むRSI認識タスクにおけるバックボーンアーキテクチャの新しい設計パラダイムを提案する。
重量共有戦略と進化的アルゴリズムに基づく新しいワンショットアーキテクチャ探索フレームワークRSBNetを提案する。
評価課題の異なる5つのベンチマークデータセットを用いて大規模な実験を行い,提案手法の有効性を示した。
論文 参考訳(メタデータ) (2021-12-07T02:44:16Z) - Multi-Content Complementation Network for Salient Object Detection in
Optical Remote Sensing Images [108.79667788962425]
光リモートセンシング画像(RSI-SOD)における有能な物体検出は、いまだに課題である。
本稿では, RSI-SOD における複数コンテンツの相補性を検討するために, MCCNet (Multi-Content Complementation Network) を提案する。
MCCMでは、前景機能、エッジ機能、背景機能、グローバル画像レベル機能など、RSI-SODにとって重要な複数の機能について検討する。
論文 参考訳(メタデータ) (2021-12-02T04:46:40Z) - Learnable Multi-level Frequency Decomposition and Hierarchical Attention
Mechanism for Generalized Face Presentation Attack Detection [7.324459578044212]
顔提示攻撃検知(PAD)は多くの注目を集めており、顔認識システムを保護する上で重要な役割を果たしている。
両ストリーム畳み込みニューラルネットワーク(CNN)フレームワークを提案する。
ステップワイドアブレーション研究において提案したPAD法の設計を実証した。
論文 参考訳(メタデータ) (2021-09-16T13:06:43Z) - Robust Self-Ensembling Network for Hyperspectral Image Classification [38.84831094095329]
この問題に対処するために,ロバストな自己認識ネットワーク(RSEN)を提案する。
rsenはベースネットワークとアンサンブルネットワークを含む2つのワークから成り立っている。
提案アルゴリズムは, 最先端手法と比較して, 競争性能を向上できることを示す。
論文 参考訳(メタデータ) (2021-04-08T13:33:14Z) - Factors of Influence for Transfer Learning across Diverse Appearance
Domains and Task Types [50.1843146606122]
現在の最新のコンピュータビジョンモデルでは、簡単な転送学習が一般的です。
転校学習に関するこれまでの体系的な研究は限られており、作業が期待される状況は十分に理解されていない。
本論文では,非常に異なる画像領域にまたがる転送学習の広範な実験的研究を行う。
論文 参考訳(メタデータ) (2021-03-24T16:24:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。