論文の概要: MKSNet: Advanced Small Object Detection in Remote Sensing Imagery with Multi-Kernel and Dual Attention Mechanisms
- arxiv url: http://arxiv.org/abs/2512.03640v1
- Date: Wed, 03 Dec 2025 10:22:27 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 12:17:13.95547
- Title: MKSNet: Advanced Small Object Detection in Remote Sensing Imagery with Multi-Kernel and Dual Attention Mechanisms
- Title(参考訳): MKSNet:マルチカーネルとデュアルアテンション機構を用いたリモートセンシング画像における高度な小物体検出
- Authors: Jiahao Zhang, Xiao Zhao, Guangyu Gao,
- Abstract要約: 本稿では,MKSNet(Multi- Kernel Selection Network)を紹介する。
MKSNetは、空間的およびチャネル的アテンションモジュールをマージする二重アテンション機構を組み込んでいる。
DOTA-v1.0とHRSC2016ベンチマークの実証的な評価は、MKSNetがリモートセンシング画像中の小さな物体を検出する際に、既存の最先端モデルを大幅に上回っていることを示している。
- 参考スコア(独自算出の注目度): 14.119656392340111
- License:
- Abstract: Deep convolutional neural networks (DCNNs) have substantially advanced object detection capabilities, particularly in remote sensing imagery. However, challenges persist, especially in detecting small objects where the high resolution of these images and the small size of target objects often result in a loss of critical information in the deeper layers of conventional CNNs. Additionally, the extensive spatial redundancy and intricate background details typical in remote-sensing images tend to obscure these small targets. To address these challenges, we introduce Multi-Kernel Selection Network (MKSNet), a novel network architecture featuring a novel Multi-Kernel Selection mechanism. The MKS mechanism utilizes large convolutional kernels to effectively capture an extensive range of contextual information. This innovative design allows for adaptive kernel size selection, significantly enhancing the network's ability to dynamically process and emphasize crucial spatial details for small object detection. Furthermore, MKSNet also incorporates a dual attention mechanism, merging spatial and channel attention modules. The spatial attention module adaptively fine-tunes the spatial weights of feature maps, focusing more intensively on relevant regions while mitigating background noise. Simultaneously, the channel attention module optimizes channel information selection, improving feature representation and detection accuracy. Empirical evaluations on the DOTA-v1.0 and HRSC2016 benchmark demonstrate that MKSNet substantially surpasses existing state-of-the-art models in detecting small objects in remote sensing images. These results highlight MKSNet's superior ability to manage the complexities associated with multi-scale and high-resolution image data, confirming its effectiveness and innovation in remote sensing object detection.
- Abstract(参考訳): ディープ畳み込みニューラルネットワーク(DCNN)は、特にリモートセンシング画像において、かなり高度な物体検出機能を備えている。
しかし、特にこれらの画像の高分解能と対象物のサイズが小さい小さな物体を検出する場合、従来のCNNの深い層では重要な情報が失われることがしばしばある。
さらに、リモートセンシング画像に典型的な空間的冗長性と複雑な背景の詳細は、これらの小さな標的を隠蔽する傾向がある。
これらの課題に対処するため、我々はMKSNet(Multi-Kernel Selection Network)を導入する。
MKSメカニズムは、大きな畳み込みカーネルを使用して、コンテキスト情報の広範囲を効果的にキャプチャする。
この革新的な設計は、適応的なカーネルサイズ選択を可能にし、ネットワークの動的処理能力を大幅に強化し、小さなオブジェクト検出において重要な空間的詳細を強調する。
さらに、MKSNetにはデュアルアテンション機構があり、空間およびチャネルアテンションモジュールをマージする。
空間的注意モジュールは特徴写像の空間的重みを適応的に微調整し、背景雑音を緩和しながら関連領域に集中的に焦点を合わせる。
同時に、チャンネルアテンションモジュールはチャンネル情報の選択を最適化し、特徴表現と検出精度を向上させる。
DOTA-v1.0とHRSC2016ベンチマークの実証的な評価は、MKSNetがリモートセンシング画像中の小さな物体を検出する際に、既存の最先端モデルを大幅に上回っていることを示している。
これらの結果は、MKSNetがマルチスケールおよび高解像度の画像データに関連する複雑さを管理する能力に優れており、リモートセンシングオブジェクト検出の有効性と革新性を確認している。
関連論文リスト
- GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - Selective Structured State Space for Multispectral-fused Small Target Detection [24.622199000121025]
高解像度リモートセンシング画像におけるターゲット検出は、小さなターゲットの認識精度が低く、計算コストが高いため、課題に直面している。
これらの計算制約に対処するために、効率性のためにMambaの線形複雑性を利用する。
我々は,拡張小型目標検出(ESTD)モジュールと畳み込み注意残差ゲート(CARG)モジュールを開発することで,マンバを強化した。
論文 参考訳(メタデータ) (2025-05-20T07:39:27Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - An Advanced Features Extraction Module for Remote Sensing Image Super-Resolution [0.5461938536945723]
チャネル・アンド・スペースアテンション特徴抽出(CSA-FE)と呼ばれる高度な特徴抽出モジュールを提案する。
提案手法は,高頻度情報を含む特定のチャネルや空間的位置に着目し,関連する特徴に焦点を合わせ,無関係な特徴を抑えるのに役立つ。
本モデルは,既存モデルと比較して優れた性能を示した。
論文 参考訳(メタデータ) (2024-05-07T18:15:51Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Multi-Attention-Network for Semantic Segmentation of Fine Resolution
Remote Sensing Images [10.835342317692884]
リモートセンシング画像におけるセマンティックセグメンテーションの精度は、ディープ畳み込みニューラルネットワークによって著しく向上した。
本稿では,これらの問題に対処するマルチアテンション・ネットワーク(MANet)を提案する。
線形複雑性を伴うカーネル注意の新たなアテンション機構が提案され,注目される計算負荷の低減が図られた。
論文 参考訳(メタデータ) (2020-09-03T09:08:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。