論文の概要: Paying more attention to local contrast: improving infrared small target detection performance via prior knowledge
- arxiv url: http://arxiv.org/abs/2411.13260v1
- Date: Wed, 20 Nov 2024 12:21:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-21 16:12:07.271214
- Title: Paying more attention to local contrast: improving infrared small target detection performance via prior knowledge
- Title(参考訳): 局所的コントラストにもっと注意を払う--事前知識による赤外線小目標検出性能の向上
- Authors: Peichao Wang, Jiabao Wang, Yao Chen, Rui Zhang, Yang Li, Zhuang Miao,
- Abstract要約: 本稿では,局所コントラスト注意向上型赤外小型目標検出ネットワーク(LCAE-Net)を提案する。
パラメータカウントと浮動小数点演算(FLOP)はそれぞれ1.945Mと4.862Gであり、エッジデバイスへの展開に適している。
- 参考スコア(独自算出の注目度): 11.865797842063884
- License:
- Abstract: The data-driven method for infrared small target detection (IRSTD) has achieved promising results. However, due to the small scale of infrared small target datasets and the limited number of pixels occupied by the targets themselves, it is a challenging task for deep learning methods to directly learn from these samples. Utilizing human expert knowledge to assist deep learning methods in better learning is worthy of exploration. To effectively guide the model to focus on targets' spatial features, this paper proposes the Local Contrast Attention Enhanced infrared small target detection Network (LCAE-Net), combining prior knowledge with data-driven deep learning methods. LCAE-Net is a U-shaped neural network model which consists of two developed modules: a Local Contrast Enhancement (LCE) module and a Channel Attention Enhancement (CAE) module. The LCE module takes advantages of prior knowledge, leveraging handcrafted convolution operator to acquire Local Contrast Attention (LCA), which could realize background suppression while enhance the potential target region, thus guiding the neural network to pay more attention to potential infrared small targets' location information. To effectively utilize the response information throughout downsampling progresses, the CAE module is proposed to achieve the information fusion among feature maps' different channels. Experimental results indicate that our LCAE-Net outperforms existing state-of-the-art methods on the three public datasets NUDT-SIRST, NUAA-SIRST, and IRSTD-1K, and its detection speed could reach up to 70 fps. Meanwhile, our model has a parameter count and Floating-Point Operations (FLOPs) of 1.945M and 4.862G respectively, which is suitable for deployment on edge devices.
- Abstract(参考訳): 赤外線小ターゲット検出(IRSTD)のためのデータ駆動方式は有望な結果を得た。
しかし、小型の赤外線小ターゲットデータセットとターゲット自体が占める画素数が限られているため、深層学習手法がこれらのサンプルから直接学習することは難しい課題である。
人間の専門家の知識を活用して、ディープラーニングの手法をよりよい学習に活用することは、探索に値する。
そこで本研究では,従来の知識とデータ駆動型深層学習手法を組み合わせた,局所コントラスト強調赤外小型目標検出ネットワーク(LCAE-Net)を提案する。
LCAE-Netは、ローカルコントラストエンハンスメント(LCE)モジュールとチャネルアテンションエンハンスメント(CAE)モジュールの2つの開発モジュールで構成されるU字型ニューラルネットワークモデルである。
LCEモジュールは、手作りの畳み込み演算子を利用して、潜在的なターゲット領域を拡張しながらバックグラウンドの抑圧を実現することができるローカルコントラスト注意(LCA)を取得することにより、ニューラルネットワークが潜在的な赤外線小ターゲットの位置情報により多くの注意を払うように誘導する。
ダウンサンプリングの進行を通した応答情報を効果的に活用するために,機能マップの異なるチャネル間の情報融合を実現するため,CAEモジュールを提案する。
実験の結果, LCAE-Netは3つの公開データセット NUDT-SIRST, NUAA-SIRST, IRSTD-1K において既存の最先端手法よりも優れており, 検出速度は最大70fpsに達する可能性が示唆された。
パラメータカウントと浮動小数点演算(FLOP)はそれぞれ1.945Mと4.862Gであり、エッジデバイスへの展開に適している。
関連論文リスト
- Unleashing the Power of Generic Segmentation Models: A Simple Baseline for Infrared Small Target Detection [57.666055329221194]
本稿では,Segment Anything Model (SAM) などのジェネリックセグメンテーションモデルの赤外線小物体検出タスクへの適応について検討する。
提案モデルでは,既存の手法と比較して,精度とスループットの両方で性能が大幅に向上した。
論文 参考訳(メタデータ) (2024-09-07T05:31:24Z) - Single-Point Supervised High-Resolution Dynamic Network for Infrared Small Target Detection [7.0456782736205685]
単一点教師付き高分解能ダイナミックネットワーク(SSHD-Net)を提案する。
単一点監視のみを用いて、最先端(SOTA)検出性能を実現する。
公開データセット NUDT-SIRST と IRSTD-1k の実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-04T09:44:47Z) - Multi-Scale Direction-Aware Network for Infrared Small Target Detection [2.661766509317245]
赤外小目標検出は、背景とターゲットを効果的に分離することが難しい問題に直面している。
我々は、赤外線小ターゲットの高周波方向特徴を統合するためのマルチスケール方向対応ネットワーク(MSDA-Net)を提案する。
MSDA-Netは、パブリックNUDT-SIRST、SIRST、IRSTD-1kデータセット上で、最先端(SOTA)結果を達成する。
論文 参考訳(メタデータ) (2024-06-04T07:23:09Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Salient Object Detection in Optical Remote Sensing Images Driven by
Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。
具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。
3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2023-09-15T07:14:43Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - ABC: Attention with Bilinear Correlation for Infrared Small Target
Detection [4.7379300868029395]
CNNに基づく深層学習法は、赤外線小ターゲット(IRST)のセグメンテーションに有効ではない
バイリニア相関(ABC)を用いた注目モデルを提案する。
ABCはトランスアーキテクチャに基づいており、特徴抽出と融合のための新しいアテンション機構を備えた畳み込み線形核融合トランス (CLFT) モジュールを含んでいる。
論文 参考訳(メタデータ) (2023-03-18T03:47:06Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Dense Nested Attention Network for Infrared Small Target Detection [36.654692765557726]
単一フレーム赤外線小ターゲット(SIRST)検出は、小さなターゲットを乱雑な背景から分離することを目的としている。
既存のCNNベースのメソッドは、赤外線小ターゲットに対して直接適用することはできない。
本稿では,高密度ネステッドアテンションネットワーク(DNANet)を提案する。
論文 参考訳(メタデータ) (2021-06-01T13:45:35Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。