論文の概要: Improved Dense Nested Attention Network Based on Transformer for
Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2311.08747v1
- Date: Wed, 15 Nov 2023 07:29:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-16 16:45:17.672726
- Title: Improved Dense Nested Attention Network Based on Transformer for
Infrared Small Target Detection
- Title(参考訳): 赤外線小ターゲット検出用変圧器を用いた高密度ネスト注意ネットワークの改良
- Authors: Chun Bao, Jie Cao, Yaqian Ning, Tianhua Zhao, Zhijun Li, Zechen Wang,
Li Zhang, and Qun Hao
- Abstract要約: 深層学習に基づく赤外線小ターゲット検出は、複雑な背景と動的背景から小さなターゲットを分離する際、独特な利点をもたらす。
畳み込みニューラルネットワーク(CNN)の深さが増加するにつれて、赤外線小ターゲットの特徴は徐々に弱まる。
本稿では,トランスアーキテクチャに基づく高密度ネストアテンションネットワーク (IDNANet) を提案する。
- 参考スコア(独自算出の注目度): 8.388564430699155
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Infrared small target detection based on deep learning offers unique
advantages in separating small targets from complex and dynamic backgrounds.
However, the features of infrared small targets gradually weaken as the depth
of convolutional neural network (CNN) increases. To address this issue, we
propose a novel method for detecting infrared small targets called improved
dense nested attention network (IDNANet), which is based on the transformer
architecture. We preserve the dense nested structure of dense nested attention
network (DNANet) and introduce the Swin-transformer during feature extraction
stage to enhance the continuity of features. Furthermore, we integrate the
ACmix attention structure into the dense nested structure to enhance the
features of intermediate layers. Additionally, we design a weighted dice binary
cross-entropy (WD-BCE) loss function to mitigate the negative impact of
foreground-background imbalance in the samples. Moreover, we develop a dataset
specifically for infrared small targets, called BIT-SIRST. The dataset
comprises a significant amount of real-world targets and manually annotated
labels, as well as synthetic data and corresponding labels. We have evaluated
the effectiveness of our method through experiments conducted on public
datasets. In comparison to other state-of-the-art methods, our approach
outperforms in terms of probability of detection (P_d), false-alarm rate (F_a),
and mean intersection of union ($mIoU$). The $mIoU$ reaches 90.89 on the
NUDT-SIRST dataset and 79.72 on the NUAA-SIRST dataset.
- Abstract(参考訳): ディープラーニングに基づく赤外線小目標検出は、小目標を複雑でダイナミックな背景から分離するユニークな利点を提供する。
しかし、畳み込みニューラルネットワーク(CNN)の深さが増加するにつれて、赤外線小ターゲットの特徴は徐々に弱まる。
そこで本研究では,このトランスフォーマアーキテクチャに基づく高密度ネストアテンションネットワーク (IDNANet) と呼ばれる赤外線小ターゲット検出手法を提案する。
我々は,高密度ネステッドアテンションネットワーク(DNANet)の高密度ネスト構造を保持し,特徴抽出段階においてスウィン変換器を導入し,特徴の連続性を高める。
さらに,acmixアテンション構造を密集したネスト構造に統合し,中間層の特徴を高める。
さらに,重み付きダイス二元クロスエントロピー(wd-bce)損失関数の設計を行い,試料中の前後不均衡の負の影響を緩和した。
さらに、BIT-SIRSTと呼ばれる、赤外線小ターゲット専用のデータセットを開発する。
データセットには、大量の現実世界のターゲットと手動で注釈付けされたラベル、合成データと対応するラベルが含まれている。
提案手法の有効性を,公開データセットを用いた実験により評価した。
他の最先端手法と比較して、我々の手法は検出の確率(P_d)、偽アラーム率(F_a)、および結合の平均交叉(mIoU$)において優れている。
mIoU$はNUDT-SIRSTデータセットで90.89ドル、NUAA-SIRSTデータセットで79.72ドルに達する。
関連論文リスト
- SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - EFLNet: Enhancing Feature Learning for Infrared Small Target Detection [20.546186772828555]
単一フレームの赤外線小目標検出は難しい課題であると考えられている。
ターゲットと背景の極端に不均衡のため、境界ボックスの回帰は赤外線小ターゲットに対して非常に敏感である。
本稿では,これらの問題に対処する機能学習ネットワーク(EFLNet)を提案する。
論文 参考訳(メタデータ) (2023-07-27T09:23:22Z) - ABC: Attention with Bilinear Correlation for Infrared Small Target
Detection [4.7379300868029395]
CNNに基づく深層学習法は、赤外線小ターゲット(IRST)のセグメンテーションに有効ではない
バイリニア相関(ABC)を用いた注目モデルを提案する。
ABCはトランスアーキテクチャに基づいており、特徴抽出と融合のための新しいアテンション機構を備えた畳み込み線形核融合トランス (CLFT) モジュールを含んでいる。
論文 参考訳(メタデータ) (2023-03-18T03:47:06Z) - Provable Data Subset Selection For Efficient Neural Network Training [73.34254513162898]
本稿では,任意の放射基底関数ネットワーク上での入力データの損失を近似する,emphRBFNNのコアセットを構成するアルゴリズムについて紹介する。
次に、一般的なネットワークアーキテクチャやデータセット上で、関数近似とデータセットサブセットの選択に関する経験的評価を行う。
論文 参考訳(メタデータ) (2023-03-09T10:08:34Z) - SAR Despeckling Using Overcomplete Convolutional Networks [53.99620005035804]
スペックルはSAR画像を劣化させるため、リモートセンシングにおいて重要な問題である。
近年の研究では、畳み込みニューラルネットワーク(CNN)が古典的解法よりも優れていることが示されている。
本研究は、受容場を制限することで低レベルの特徴を学習することに集中するために、過剰なCNNアーキテクチャを用いる。
本稿では,合成および実SAR画像の非特定化手法と比較して,提案手法により非特定化性能が向上することを示す。
論文 参考訳(メタデータ) (2022-05-31T15:55:37Z) - Context-Preserving Instance-Level Augmentation and Deformable
Convolution Networks for SAR Ship Detection [50.53262868498824]
ランダムな方向と部分的な情報損失によるSAR画像のターゲット形状の変形は、SAR船の検出において必須の課題である。
ターゲット内の部分的な情報損失に頑健なディープネットワークをトレーニングするためのデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2022-02-14T07:01:01Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Dense Nested Attention Network for Infrared Small Target Detection [36.654692765557726]
単一フレーム赤外線小ターゲット(SIRST)検出は、小さなターゲットを乱雑な背景から分離することを目的としている。
既存のCNNベースのメソッドは、赤外線小ターゲットに対して直接適用することはできない。
本稿では,高密度ネステッドアテンションネットワーク(DNANet)を提案する。
論文 参考訳(メタデータ) (2021-06-01T13:45:35Z) - MobileSal: Extremely Efficient RGB-D Salient Object Detection [62.04876251927581]
本稿では,効率的なRGB-Dサルエント物体検出(SOD)に焦点を当てた新しいネットワーク,メソッド名を提案する。
RGB-D SODのためのモバイルネットワークの特徴表現能力を強化するために,暗黙的深度復元(IDR)手法を提案する。
IDRとCPRを組み込むことで、7つの挑戦的なRGB-D SODデータセット上のsArtメソッドに対してメソッド名が好ましい。
論文 参考訳(メタデータ) (2020-12-24T04:36:42Z) - Attentional Local Contrast Networks for Infrared Small Target Detection [15.882749652217653]
赤外線小目標検出のための新しいモデル駆動深層ネットワークを提案する。
従来の局所コントラスト測定法を、エンドツーエンドネットワークにおける深さ自在なパラメータレス非線形特徴精製層としてモジュール化します。
ネットワークアーキテクチャの各コンポーネントの有効性と効率を実証的に検証するために,ネットワーク奥行きの異なる詳細なアブレーション研究を行う。
論文 参考訳(メタデータ) (2020-12-15T19:33:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。