論文の概要: DENet: Dual-Path Edge Network with Global-Local Attention for Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2509.20701v1
- Date: Thu, 25 Sep 2025 03:08:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.67347
- Title: DENet: Dual-Path Edge Network with Global-Local Attention for Infrared Small Target Detection
- Title(参考訳): DENet:赤外小ターゲット検出のためのグローバルローカルアテンション付きデュアルパスエッジネットワーク
- Authors: Jiayi Zuo, Songwei Pei, Qian Li,
- Abstract要約: 災害警報や海上監視といったリモートセンシングアプリケーションには、赤外線小目標検出が不可欠である。
このタスクの深層モデルの設計における根本的な課題は、微小目標に対する高解像度の空間的詳細を捉えることと、より大きな目標に対する堅牢な意味的コンテキストを抽出することの相違にある。
既存の手法は、低コントラストと高雑音下でターゲットエッジを正確に抽出するには不十分な、固定勾配演算子や単純な注意機構に頼っていることが多い。
本稿では,エッジ拡張とセマンティックモデリングを2つの補完処理経路に分離することで,この課題に対処する新しいDual-Path Edge Networkを提案する。
- 参考スコア(独自算出の注目度): 5.672707725914493
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Infrared small target detection is crucial for remote sensing applications like disaster warning and maritime surveillance. However, due to the lack of distinctive texture and morphological features, infrared small targets are highly susceptible to blending into cluttered and noisy backgrounds. A fundamental challenge in designing deep models for this task lies in the inherent conflict between capturing high-resolution spatial details for minute targets and extracting robust semantic context for larger targets, often leading to feature misalignment and suboptimal performance. Existing methods often rely on fixed gradient operators or simplistic attention mechanisms, which are inadequate for accurately extracting target edges under low contrast and high noise. In this paper, we propose a novel Dual-Path Edge Network that explicitly addresses this challenge by decoupling edge enhancement and semantic modeling into two complementary processing paths. The first path employs a Bidirectional Interaction Module, which uses both Local Self-Attention and Global Self-Attention to capture multi-scale local and global feature dependencies. The global attention mechanism, based on a Transformer architecture, integrates long-range semantic relationships and contextual information, ensuring robust scene understanding. The second path introduces the Multi-Edge Refiner, which enhances fine-grained edge details using cascaded Taylor finite difference operators at multiple scales. This mathematical approach, along with an attention-driven gating mechanism, enables precise edge localization and feature enhancement for targets of varying sizes, while effectively suppressing noise. Our method provides a promising solution for precise infrared small target detection and localization, combining structural semantics and edge refinement in a unified framework.
- Abstract(参考訳): 災害警報や海上監視といったリモートセンシングアプリケーションには、赤外線小目標検出が不可欠である。
しかし、独特のテクスチャや形態的特徴が欠如しているため、赤外小ターゲットは乱雑でノイズの多い背景に混入することに非常に敏感である。
このタスクの深層モデルの設計における根本的な課題は、微小目標に対する高解像度空間的詳細の取得と、より大きな目標に対するロバストな意味的コンテキストの抽出との固有の矛盾であり、しばしば特徴的ミスアライメントと準最適性能に繋がる。
既存の手法は、低コントラストと高雑音下でターゲットエッジを正確に抽出するには不十分な、固定勾配演算子や単純な注意機構に頼っていることが多い。
本稿では,エッジ拡張とセマンティックモデリングを2つの相補的な処理経路に分離することで,この課題に対処する新しいDual-Path Edge Networkを提案する。
最初のパスでは双方向インタラクションモジュールが採用されており、ローカルなセルフアテンションとグローバルなセルフアテンションの両方を使用して、マルチスケールのローカルおよびグローバルな機能依存関係をキャプチャする。
グローバルアテンションメカニズムは、Transformerアーキテクチャに基づいて、長距離セマンティックリレーションとコンテキスト情報を統合し、堅牢なシーン理解を保証する。
第2のパスでは、マルチエッジリファイナを導入し、カスケードされたTaylor有限差分演算子を複数スケールで使用して、きめ細かなエッジの詳細を強化する。
この数学的アプローチは、注意駆動のゲーティング機構とともに、音を効果的に抑制しつつ、様々な大きさのターゲットに対して正確なエッジローカライゼーションと特徴強化を可能にする。
提案手法は, 構造的セマンティクスとエッジリファインメントを組み合わせた, 高精度な赤外小目標検出と位置推定のための有望なソリューションを提供する。
関連論文リスト
- Beyond Motion Cues and Structural Sparsity: Revisiting Small Moving Target Detection [5.375165101682048]
小型移動目標検出は、多くの防衛用途に不可欠である。
しかし、低信号対雑音比、曖昧な視覚的手がかり、乱雑な背景のため、非常に困難である。
本稿では,既存のアプローチと根本的に異なる新しいディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-09T12:20:25Z) - DISTA-Net: Dynamic Closely-Spaced Infrared Small Target Unmixing [55.366556355538954]
本稿では,動的フレームワーク内で従来のスパース再構築を再現する動的反復収縮閾値ネットワーク(DISTA-Net)を提案する。
DISTA-Netは、密接な空間を持つ赤外線小ターゲットのアンミックスのために特別に設計された最初のディープラーニングモデルである。
私たちはこの分野におけるさらなる研究を促進するために、最初のオープンソースエコシステムを確立しました。
論文 参考訳(メタデータ) (2025-05-25T13:52:00Z) - Learning Dynamic Local Context Representations for Infrared Small Target Detection [5.897465234102489]
複雑な背景、低信号/クラッタ比、ターゲットサイズと形状の違いにより、赤外線小目標検出(ISTD)は困難である。
ISTDの動的局所文脈表現を学習する新しい手法であるLCRNetを提案する。
1.65Mのパラメータだけで、LCRNetは最先端(SOTA)のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-12-23T09:06:27Z) - Pick of the Bunch: Detecting Infrared Small Targets Beyond Hit-Miss Trade-Offs via Selective Rank-Aware Attention [22.580497586948198]
複雑な背景乱れの中で、赤外線小目標検出は、ディムターゲットを正確に位置決めする固有の課題に直面している。
本稿では,従来のヒットミストレードオフを超えて高精度なネットワークであるSeRankDetを提案する。
論文 参考訳(メタデータ) (2024-08-07T12:10:32Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。