論文の概要: FSGNet: A Frequency-Aware and Semantic Guidance Network for Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2603.25389v1
- Date: Thu, 26 Mar 2026 12:38:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.291411
- Title: FSGNet: A Frequency-Aware and Semantic Guidance Network for Infrared Small Target Detection
- Title(参考訳): FSGNet:赤外線小ターゲット検出のための周波数認識・意味誘導ネットワーク
- Authors: Yingmei Zhang, Wangtao Bao, Yong Yang, Weiguo Wan, Qin Xiao, Xueting Zou,
- Abstract要約: IRSTDは、複雑な背景から小さなターゲットを識別し、識別することを目的としている。
U-Netは、深い層から浅い層へ高レベルの機能を転送する際のセマンティックな劣化に悩まされている。
本稿では,周波数認識と意味誘導を組み込んだ軽量かつ効果的な検出フレームワークFSGNetを提案する。
- 参考スコア(独自算出の注目度): 9.669351353574323
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Infrared small target detection (IRSTD) aims to identify and distinguish small targets from complex backgrounds. Leveraging the powerful multi-scale feature fusion capability of the U-Net architecture, IRSTD has achieved significant progress. However, U-Net suffers from semantic degradation when transferring high-level features from deep to shallow layers, limiting the precise localization of small targets. To address this issue, this paper proposes FSGNet, a lightweight and effective detection framework incorporating frequency-aware and semantic guidance mechanisms. Specifically, a multi-directional interactive attention module is proposed throughout the encoder to capture fine-grained and directional features, enhancing the network's sensitivity to small, low-contrast targets. To suppress background interference propagated through skip connections, a multi-scale frequency-aware module leverages Fast Fourier transform to filter out target-similar clutter while preserving salient target structures. At the deepest layer, a global pooling module captures high-level semantic information, which is subsequently upsampled and propagated to each decoder stage through the global semantic guidance flows, ensuring semantic consistency and precise localization across scales. Extensive experiments on four public IRSTD datasets demonstrate that FSGNet achieves superior detection performance and maintains high efficiency, highlighting its practical applicability and robustness. The codes will be released on https://github.com/Wangtao-Bao/FSGNet.
- Abstract(参考訳): 赤外線小ターゲット検出(IRSTD)は、複雑な背景から小さなターゲットを識別し、識別することを目的としている。
U-Netアーキテクチャの強力なマルチスケール機能融合機能を活用することで、IRSTDは大きな進歩を遂げた。
しかし、U-Netは、深い層から浅い層へ高レベルの特徴を移す際に意味劣化に悩まされ、小さなターゲットの正確な位置決めが制限される。
本稿では,周波数認識とセマンティックガイダンスを組み込んだ,軽量かつ効果的な検出フレームワークFSGNetを提案する。
具体的には、エンコーダ全体で多方向対話型アテンションモジュールを提案し、細粒度および指向性の特徴を捉え、低コントラストターゲットに対するネットワークの感度を高める。
スキップ接続を介して伝播する背景干渉を抑制するため、マルチスケールの周波数認識モジュールは、Fast Fourier変換を利用して目標類似のクラッタを除去する。
最も深い層では、グローバルプーリングモジュールがハイレベルなセマンティック情報をキャプチャし、その後、グローバルなセマンティックガイダンスフローを通じて各デコーダステージにアップサンプリングされ、伝播し、セマンティック一貫性とスケール間の正確なローカライゼーションを保証する。
4つの公開IRSTDデータセットに対する大規模な実験により、FSGNetは優れた検出性能を達成し、高い効率を維持し、実用性と堅牢性を強調している。
コードはhttps://github.com/Wangtao-Bao/FSGNetで公開される。
関連論文リスト
- G2HFNet: GeoGran-Aware Hierarchical Feature Fusion Network for Salient Object Detection in Optical Remote Sensing Images [76.1829298714382]
既存の手法では、一様注意機構を用いて複数の特徴を単一スケールで抽出するのが一般的である。
光リモートセンシング画像における幾何的および粒度をフル活用するGeoGran-Aware grained Feature Fusion Network (G2HFNet)を提案する。
論文 参考訳(メタデータ) (2026-03-13T05:52:00Z) - ARFC-WAHNet: Adaptive Receptive Field Convolution and Wavelet-Attentive Hierarchical Network for Infrared Small Target Detection [2.643590634429843]
ARFC-WAHNetは、赤外線小ターゲット検出のための適応型受容野畳み込みおよびウェーブレット減衰階層ネットワークである。
ARFC-WAHNetは、検出精度とロバスト性の両方において、最近の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2025-05-15T09:44:23Z) - MSCA-Net:Multi-Scale Context Aggregation Network for Infrared Small Target Detection [0.1759252234439348]
本稿では,3つのキーコンポーネントを統合したMSCA-Netというネットワークアーキテクチャを提案する。
MSEDAは、異なるスケールにわたる情報を適応的に集約するために、マルチスケールのフュージョンアテンション機構を使用している。
PCBAMは相関行列に基づく戦略によりグローバル特徴と局所特徴の相関を捉える。
CABは、それらに重みを割り当て、低レベル情報と高レベル情報を統合することで、重要な特徴の表現を強化する。
論文 参考訳(メタデータ) (2025-03-21T14:42:31Z) - Multi-Scale Direction-Aware Network for Infrared Small Target Detection [2.661766509317245]
赤外小目標検出は、背景とターゲットを効果的に分離することが難しい問題に直面している。
我々は、赤外線小ターゲットの高周波方向特徴を統合するためのマルチスケール方向対応ネットワーク(MSDA-Net)を提案する。
MSDA-Netは、パブリックNUDT-SIRST、SIRST、IRSTD-1kデータセット上で、最先端(SOTA)結果を達成する。
論文 参考訳(メタデータ) (2024-06-04T07:23:09Z) - SCTransNet: Spatial-channel Cross Transformer Network for Infrared Small Target Detection [46.049401912285134]
赤外線小ターゲット検出(IRSTD)は近年,U字型ニューラルモデルから大きな恩恵を受けている。
既存のテクニックは、ターゲットが背景と高い類似性を持つ場合に苦労する。
本稿では,空間チャネルクロストランスネットワーク(SCTransNet)を提案する。
論文 参考訳(メタデータ) (2024-01-28T06:41:15Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Dense Attention Fluid Network for Salient Object Detection in Optical
Remote Sensing Images [193.77450545067967]
光リモートセンシング画像(RSI)における有意物体検出のためのエンド・ツー・エンドDense Attention Fluid Network(DAFNet)を提案する。
GCA(Global Context-Aware Attention)モジュールは、長距離の意味的関係を適応的にキャプチャするために提案される。
我々は、2000枚の画像とピクセルワイドなサリエンシアノテーションを含むSODのための新しい、挑戦的な光学RSIデータセットを構築した。
論文 参考訳(メタデータ) (2020-11-26T06:14:10Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。