論文の概要: Multi-Scale Direction-Aware Network for Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2406.02037v2
- Date: Mon, 25 Nov 2024 12:49:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:15:35.623148
- Title: Multi-Scale Direction-Aware Network for Infrared Small Target Detection
- Title(参考訳): 赤外線小ターゲット検出のためのマルチスケール方向認識ネットワーク
- Authors: Jinmiao Zhao, Zelin Shi, Chuang Yu, Yunpeng Liu,
- Abstract要約: 赤外小目標検出は、背景とターゲットを効果的に分離することが難しい問題に直面している。
我々は、赤外線小ターゲットの高周波方向特徴を統合するためのマルチスケール方向対応ネットワーク(MSDA-Net)を提案する。
MSDA-Netは、パブリックNUDT-SIRST、SIRST、IRSTD-1kデータセット上で、最先端(SOTA)結果を達成する。
- 参考スコア(独自算出の注目度): 2.661766509317245
- License:
- Abstract: Infrared small target detection faces the problem that it is difficult to effectively separate the background and the target. Existing deep learning-based methods focus on appearance features and ignore high-frequency directional features. Therefore, we propose a multi-scale direction-aware network (MSDA-Net), which is the first attempt to integrate the high-frequency directional features of infrared small targets as domain prior knowledge into neural networks. Specifically, an innovative multi-directional feature awareness (MDFA) module is constructed, which fully utilizes the prior knowledge of targets and emphasizes the focus on high-frequency directional features. On this basis, combined with the multi-scale local relation learning (MLRL) module, a multi-scale direction-aware (MSDA) module is further constructed. The MSDA module promotes the full extraction of local relations at different scales and the full perception of key features in different directions. Meanwhile, a high-frequency direction injection (HFDI) module without training parameters is constructed to inject the high-frequency directional information of the original image into the network. This helps guide the network to pay attention to detailed information such as target edges and shapes. In addition, we propose a feature aggregation (FA) structure that aggregates multi-level features to solve the problem of small targets disappearing in deep feature maps. Furthermore, a lightweight feature alignment fusion (FAF) module is constructed, which can effectively alleviate the pixel offset existing in multi-level feature map fusion. Extensive experimental results show that our MSDA-Net achieves state-of-the-art (SOTA) results on the public NUDT-SIRST, SIRST and IRSTD-1k datasets.
- Abstract(参考訳): 赤外小目標検出は、背景とターゲットを効果的に分離することが難しい問題に直面している。
既存のディープラーニングベースの手法は、外観特徴に焦点をあて、高周波指向性を無視する。
そこで本研究では、ニューラルネットワークに先立つ領域知識として、赤外線小ターゲットの高周波指向性機能を統合するためのマルチスケール指向ネットワーク(MSDA-Net)を提案する。
具体的には、ターゲットの事前知識を十分に活用し、高周波指向性に重点を置く、革新的な多方向特徴認識モジュール(MDFA)を構築している。
マルチスケール局所関係学習(MLRL)モジュールと組み合わせて,マルチスケール方向認識(MSDA)モジュールをさらに構築する。
MSDAモジュールは、異なるスケールでの局所的な関係の完全な抽出と、異なる方向における重要な特徴の完全な認識を促進する。
一方、トレーニングパラメータのない高周波方向注入(HFDI)モジュールを構築し、元の画像の高周波方向情報をネットワークに注入する。
これにより、ネットワークはターゲットエッジや形状といった詳細な情報に注意を払うことができる。
さらに,複数レベルの特徴を集約して,より深い特徴マップで消失する小さなターゲットの問題を解決する機能集約(FA)構造を提案する。
さらに、マルチレベルの特徴マップ融合に存在する画素オフセットを効果的に緩和できる軽量な特徴アライメント融合(FAF)モジュールを構築する。
我々のMSDA-Netは、パブリックNUDT-SIRST、SIRST、IRSTD-1kデータセットに対して、最先端のSOTA(State-of-the-art)を達成している。
関連論文リスト
- Paying more attention to local contrast: improving infrared small target detection performance via prior knowledge [11.865797842063884]
本稿では,局所コントラスト注意向上型赤外小型目標検出ネットワーク(LCAE-Net)を提案する。
パラメータカウントと浮動小数点演算(FLOP)はそれぞれ1.945Mと4.862Gであり、エッジデバイスへの展開に適している。
論文 参考訳(メタデータ) (2024-11-20T12:21:30Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Single-Point Supervised High-Resolution Dynamic Network for Infrared Small Target Detection [7.0456782736205685]
単一点教師付き高分解能ダイナミックネットワーク(SSHD-Net)を提案する。
単一点監視のみを用いて、最先端(SOTA)検出性能を実現する。
公開データセット NUDT-SIRST と IRSTD-1k の実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-04T09:44:47Z) - HCF-Net: Hierarchical Context Fusion Network for Infrared Small Object Detection [16.92362922379821]
赤外線小物体検出性能を向上させるための深層学習法を提案する。
本発明の方法は、PPAモジュール、DASIモジュール、MDCRモジュールを含む。
論文 参考訳(メタデータ) (2024-03-16T02:45:42Z) - Salient Object Detection in Optical Remote Sensing Images Driven by
Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。
具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。
3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2023-09-15T07:14:43Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Dense Nested Attention Network for Infrared Small Target Detection [36.654692765557726]
単一フレーム赤外線小ターゲット(SIRST)検出は、小さなターゲットを乱雑な背景から分離することを目的としている。
既存のCNNベースのメソッドは、赤外線小ターゲットに対して直接適用することはできない。
本稿では,高密度ネステッドアテンションネットワーク(DNANet)を提案する。
論文 参考訳(メタデータ) (2021-06-01T13:45:35Z) - High-resolution Depth Maps Imaging via Attention-based Hierarchical
Multi-modal Fusion [84.24973877109181]
誘導DSRのための新しい注意に基づく階層型マルチモーダル融合ネットワークを提案する。
本手法は,再現精度,動作速度,メモリ効率の点で最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:28:33Z) - Dense Attention Fluid Network for Salient Object Detection in Optical
Remote Sensing Images [193.77450545067967]
光リモートセンシング画像(RSI)における有意物体検出のためのエンド・ツー・エンドDense Attention Fluid Network(DAFNet)を提案する。
GCA(Global Context-Aware Attention)モジュールは、長距離の意味的関係を適応的にキャプチャするために提案される。
我々は、2000枚の画像とピクセルワイドなサリエンシアノテーションを含むSODのための新しい、挑戦的な光学RSIデータセットを構築した。
論文 参考訳(メタデータ) (2020-11-26T06:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。