Fugu-MT 論文翻訳(概要): Enhancing Ship Classification in Optical Satellite Imagery: Integrating Convolutional Block Attention Module with ResNet for Improved Performance

論文の概要: Enhancing Ship Classification in Optical Satellite Imagery: Integrating Convolutional Block Attention Module with ResNet for Improved Performance

arxiv url: http://arxiv.org/abs/2404.02135v3
Date: Mon, 8 Apr 2024 06:11:48 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-09 23:56:54.032816
Title: Enhancing Ship Classification in Optical Satellite Imagery: Integrating Convolutional Block Attention Module with ResNet for Improved Performance
Title（参考訳）: 光衛星画像における船種分類の強化:ResNetと畳み込みブロック注意モジュールの統合による性能向上
Authors: Ryan Donghan Kwon, Gangjoo Robin Nam, Jisoo Tak, Junseob Shin, Hyerin Cha, Yeom Hyeok, Seung Won Lee,
Abstract要約: 本研究は,光衛星画像からの船舶分類のための高度な畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。ベースラインであるResNet50の85%と比較して87%の精度を実現した。このモデルは95%の精度を示し、精度、リコール、f1スコアは全て様々な船級で大幅に改善された。
参考スコア（独自算出の注目度）: 1.395908759634353
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: This study presents an advanced Convolutional Neural Network (CNN) architecture for ship classification from optical satellite imagery, significantly enhancing performance through the integration of the Convolutional Block Attention Module (CBAM) and additional architectural innovations. Building upon the foundational ResNet50 model, we first incorporated a standard CBAM to direct the model's focus towards more informative features, achieving an accuracy of 87% compared to the baseline ResNet50's 85%. Further augmentations involved multi-scale feature integration, depthwise separable convolutions, and dilated convolutions, culminating in the Enhanced ResNet Model with Improved CBAM. This model demonstrated a remarkable accuracy of 95%, with precision, recall, and f1-scores all witnessing substantial improvements across various ship classes. The bulk carrier and oil tanker classes, in particular, showcased nearly perfect precision and recall rates, underscoring the model's enhanced capability in accurately identifying and classifying ships. Attention heatmap analyses further validated the improved model's efficacy, revealing a more focused attention on relevant ship features, regardless of background complexities. These findings underscore the potential of integrating attention mechanisms and architectural innovations in CNNs for high-resolution satellite imagery classification. The study navigates through the challenges of class imbalance and computational costs, proposing future directions towards scalability and adaptability in new or rare ship type recognition. This research lays a groundwork for the application of advanced deep learning techniques in the domain of remote sensing, offering insights into scalable and efficient satellite image classification.
Abstract（参考訳）: 本研究では,光衛星画像から船種分類を行うための高度な畳み込みニューラルネットワーク (CNN) アーキテクチャを提案し,CBAM (Convolutional Block Attention Module) と追加アーキテクチャの革新によって性能を著しく向上させた。基礎となるResNet50モデルに基づいて、私たちはまず、標準CBAMを組み込んで、モデルがより有益な機能に焦点を向け、ベースラインであるResNet50の85%と比較して87%の精度を実現しました。さらなる拡張には、マルチスケールの機能統合、深く分離可能な畳み込み、拡張された畳み込みが含まれ、CBAMを改良した強化ResNetモデルで頂点に達した。このモデルは95%の精度を示し、精度、リコール、f1スコアは全て様々な船級で大幅に改善された。特にばら積み貨物船と石油タンカーのクラスは、ほぼ完全な精度とリコール率を示し、船の正確な識別と分類におけるモデルの強化能力を強調した。注意熱マップ解析により、改善されたモデルの有効性がさらに検証され、背景の複雑さに関わらず、関連する船の特徴により注意が向けられた。これらの知見は、高解像度衛星画像分類のためのCNNにおける注意機構とアーキテクチャ革新の統合の可能性を示している。この研究は、クラス不均衡と計算コストの課題を乗り越え、新しいまたは稀な船型認識におけるスケーラビリティと適応性への今後の方向性を提案する。本研究は,リモートセンシング分野における高度な深層学習技術の応用に向けた基礎研究であり,スケーラブルで効率的な衛星画像分類に関する洞察を提供する。

関連論文リスト

Attention Pooling Enhances NCA-based Classification of Microscopy Images [45.60974312463409]
我々は、特徴抽出を強化し、分類精度を向上させるために、ニューラルセルオートマタとアテンションプーリングを統合した。 8種類の顕微鏡画像データセットを用いて本手法の評価を行い,提案手法が既存のNAA法より有意に優れていることを示す。本結果は,NAAモデルが説明可能な画像分類の代替となる可能性を強調した。
論文参考訳（メタデータ） (2025-08-17T10:46:53Z)
GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文参考訳（メタデータ） (2025-08-14T11:31:43Z)
Large-Scale Model Enabled Semantic Communication Based on Robust Knowledge Distillation [53.16213723669751]
大規模モデル(LSM)は意味表現と理解に有効なフレームワークである。しかしながら、それらの直接的なデプロイメントは、しばしば高い計算複雑性とリソース要求によって妨げられる。本稿では,新しい知識蒸留に基づくセマンティックコミュニケーションフレームワークを提案する。
論文参考訳（メタデータ） (2025-08-04T07:47:18Z)
Integrated Image Reconstruction and Target Recognition based on Deep Learning Technique [3.3410072288157155]
Att-ClassiGAN は,従来の CMI アプローチと比較して,再建時間を大幅に短縮する。改良された正規化平均二乗誤差(NMSE)、より高い構造類似度指数(SSIM)、再建対象に対するより良い分類結果を提供する。
論文参考訳（メタデータ） (2025-05-07T22:34:32Z)
Any Image Restoration via Efficient Spatial-Frequency Degradation Adaptation [158.37640586809187]
劣化した画像を1つのモデルで効率的に復元することは、ますます重要になっている。我々のアプローチはAnyIRと呼ばれ、様々な劣化にまたがる固有の類似性を活用する統一された経路をとっています。劣化認識と文脈的注意を融合させるため,空間周波数並列融合戦略を提案する。
論文参考訳（メタデータ） (2025-04-19T09:54:46Z)
A Low-cost and Ultra-lightweight Binary Neural Network for Traffic Signal Recognition [5.296139403757585]
ハードウェア展開用に設計された超軽量バイナリニューラルネットワーク(BNN)モデルを提案する。提案モデルでは、97.64%の精度で優れた認識性能を示す。我々の研究は、コンピュータビジョンモデルのハードウェア展開におけるBNNの大きな可能性を示している。
論文参考訳（メタデータ） (2025-01-14T03:19:10Z)
Advancing the Biological Plausibility and Efficacy of Hebbian Convolutional Neural Networks [0.0]
本稿では,画像処理のための畳み込みニューラルネットワーク(CNN)へのヘビアン学習の統合について述べる。ヘビアン学習は、局所的な教師なしの神経情報に基づいて特徴表現を形成する。その結果, より複雑で受容的な領域を通じて, まばらな階層的学習の徴候がみられた。
論文参考訳（メタデータ） (2025-01-06T12:29:37Z)
CAVE: Classifying Abnormalities in Video Capsule Endoscopy [0.1937002985471497]
本研究では,複雑な画像データセットの分類精度を向上させるために,アンサンブルに基づくアプローチを検討する。各モデルのユニークな特徴抽出機能を活用し、全体的な精度を向上させる。実験により、アンサンブルは難易度と不均衡度の高いクラス間で高い精度と堅牢性を達成することが示された。
論文参考訳（メタデータ） (2024-10-26T17:25:08Z)
CCDepth: A Lightweight Self-supervised Depth Estimation Network with Enhanced Interpretability [11.076431337488973]
本研究では,畳み込みニューラルネットワーク(CNN)とホワイトボックスCRATEネットワークを組み合わせた,ハイブリッド型自己教師型深度推定ネットワークCCDepthを提案する。このネットワークは,CNNとCRATEモジュールを用いて画像中の局所的およびグローバルな情報を抽出し,学習効率の向上とモデルサイズ削減を実現する。
論文参考訳（メタデータ） (2024-09-30T04:19:40Z)
Any Image Restoration with Efficient Automatic Degradation Adaptation [132.81912195537433]
本研究は, 各種劣化の相似性を有効かつ包括的修復に活用し, 共同埋設を実現する統一的な方法を提案する。我々のネットワークは、モデルの複雑さをトレーニング可能なパラメータで約82%、FLOPで約85%削減しつつ、新しいSOTAレコードを設定している。
論文参考訳（メタデータ） (2024-07-18T10:26:53Z)
Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文参考訳（メタデータ） (2023-12-03T13:50:24Z)
Systematic Architectural Design of Scale Transformed Attention Condenser DNNs via Multi-Scale Class Representational Response Similarity Analysis [93.0013343535411]
マルチスケールクラス表現応答類似性分析(ClassRepSim)と呼ばれる新しいタイプの分析法を提案する。 ResNetスタイルのアーキテクチャにSTACモジュールを追加すると、最大1.6%の精度が向上することを示す。 ClassRepSim分析の結果は、STACモジュールの効果的なパラメータ化を選択するために利用することができ、競争性能が向上する。
論文参考訳（メタデータ） (2023-06-16T18:29:26Z)
A Light-weight Deep Learning Model for Remote Sensing Image Classification [70.66164876551674]
リモートセンシング画像分類(RSIC)のための高性能で軽量なディープラーニングモデルを提案する。 NWPU-RESISC45ベンチマークで広範な実験を行うことで、提案した教師学生モデルは最先端システムより優れている。
論文参考訳（メタデータ） (2023-02-25T09:02:01Z)
ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders [104.05133094625137]
完全畳み込み型マスク付きオートエンコーダフレームワークと,新たなグローバル応答正規化層を提案する。この自己教師付き学習技術とアーキテクチャ改善の共設計により、純粋なConvNetの性能を大幅に向上させるConvNeXt V2と呼ばれる新しいモデルファミリが生まれる。
論文参考訳（メタデータ） (2023-01-02T18:59:31Z)
A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。 Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文参考訳（メタデータ） (2022-10-27T13:24:08Z)
An Attention Module for Convolutional Neural Networks [5.333582981327498]
本稿では,AW-畳み込みを開発することで,畳み込みニューラルネットワークのためのアテンションモジュールを提案する。画像分類とオブジェクト検出タスクのための複数のデータセットの実験により,提案した注目モジュールの有効性が示された。
論文参考訳（メタデータ） (2021-08-18T15:36:18Z)
Enhancing Object Detection for Autonomous Driving by Optimizing Anchor Generation and Addressing Class Imbalance [0.0]
本研究では,より高速なR-CNNに基づく拡張型2次元物体検出器を提案する。より高速なr-cnnに対する修正は計算コストを増加させず、他のアンカーベースの検出フレームワークを最適化するために容易に拡張できる。
論文参考訳（メタデータ） (2021-04-08T16:58:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。