論文の概要: Breaking Self-Attention Failure: Rethinking Query Initialization for Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2601.02837v1
- Date: Tue, 06 Jan 2026 09:14:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.86588
- Title: Breaking Self-Attention Failure: Rethinking Query Initialization for Infrared Small Target Detection
- Title(参考訳): 自己注意障害を打破する:赤外小ターゲット検出のためのクエリ初期化を再考する
- Authors: Yuteng Liu, Duanni Meng, Maoxun Yuan, Xingxing Wei,
- Abstract要約: 赤外線小目標検出(IRSTD)は、低信号対雑音比(SNR)、小さなターゲットサイズ、複雑な乱雑な背景のために大きな課題に直面している。
最近のDETRベースの検出器は、IRSTDに顕著な性能劣化を示す。
- 参考スコア(独自算出の注目度): 22.128797773091403
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Infrared small target detection (IRSTD) faces significant challenges due to the low signal-to-noise ratio (SNR), small target size, and complex cluttered backgrounds. Although recent DETR-based detectors benefit from global context modeling, they exhibit notable performance degradation on IRSTD. We revisit this phenomenon and reveal that the target-relevant embeddings of IRST are inevitably overwhelmed by dominant background features due to the self-attention mechanism, leading to unreliable query initialization and inaccurate target localization. To address this issue, we propose SEF-DETR, a novel framework that refines query initialization for IRSTD. Specifically, SEF-DETR consists of three components: Frequency-guided Patch Screening (FPS), Dynamic Embedding Enhancement (DEE), and Reliability-Consistency-aware Fusion (RCF). The FPS module leverages the Fourier spectrum of local patches to construct a target-relevant density map, suppressing background-dominated features. DEE strengthens multi-scale representations in a target-aware manner, while RCF further refines object queries by enforcing spatial-frequency consistency and reliability. Extensive experiments on three public IRSTD datasets demonstrate that SEF-DETR achieves superior detection performance compared to state-of-the-art methods, delivering a robust and efficient solution for infrared small target detection task.
- Abstract(参考訳): 赤外線小目標検出(IRSTD)は、低信号対雑音比(SNR)、小さなターゲットサイズ、複雑な乱雑な背景のために大きな課題に直面している。
近年のDETRベースの検出器は、グローバルコンテキストモデリングの恩恵を受けているが、IRSTDの性能劣化は顕著である。
我々は、この現象を再考し、IRSTのターゲット関連埋め込みが、自己注意機構による支配的な背景特徴に必然的に圧倒され、信頼性の低いクエリ初期化と不正確なターゲットローカライゼーションをもたらすことを明らかにした。
本稿では,IRSTDのクエリ初期化を改良する新しいフレームワークであるSEF-DETRを提案する。
具体的には、SEF-DETRは、周波数誘導型パッチスクリーニング(FPS)、動的埋め込み強化(DEE)、信頼性に配慮したフュージョン(RCF)の3つのコンポーネントから構成される。
FPSモジュールは、ローカルパッチのフーリエスペクトルを利用して、ターゲット関連密度マップを構築し、背景優先の特徴を抑制する。
DEEはターゲットを意識したマルチスケール表現を強化し、RCFは空間周波数の一貫性と信頼性を強制することによってオブジェクトクエリをさらに洗練する。
3つのパブリックIRSTDデータセットに対する大規模な実験により、SEF-DETRは最先端の手法に比べて優れた検出性能を示し、赤外線小目標検出タスクに対して堅牢で効率的なソリューションを提供する。
関連論文リスト
- Source-Free Object Detection with Detection Transformer [59.33653163035064]
Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースドメインから教師なしのターゲットドメインへの知識転送を可能にする。
ほとんどの既存のSFODアプローチは、より高速なR-CNNのような従来のオブジェクト検出(OD)モデルに限られるか、新しいODアーキテクチャ、特に検出変換器(DETR)に適合しない一般的なソリューションとして設計されている。
本稿では,DTRのクエリ中心の機能強化を特化して設計された新しいSFODフレームワークであるFeature Reweighting ANd Contrastive Learning NetworK(FRANCK)を紹介する。
論文 参考訳(メタデータ) (2025-10-13T07:35:04Z) - Rethinking Evaluation of Infrared Small Target Detection [105.59753496831739]
本稿では,画素レベルと目標レベルのパフォーマンスを取り入れたハイブリッドレベルのメトリクスを導入し,システム的エラー解析手法を提案し,クロスデータセット評価の重要性を強調した。
標準化されたベンチマークを容易にするオープンソースツールキットがリリースされた。
論文 参考訳(メタデータ) (2025-09-21T02:45:07Z) - NS-FPN: Improving Infrared Small Target Detection and Segmentation from Noise Suppression Perspective [12.765772056631198]
赤外線小目標検出・セグメンテーション(IRS TDS)は、防衛および民間用途において重要な課題である。
近年のCNNに基づく手法は,ノイズの影響を相殺するための特徴表現の強化にのみ焦点をあてている。
本稿では,低周波誘導機能浄化 (LFP) モジュールとスパイラル認識機能サンプリング (SFS) モジュールを統合した新しいノイズ抑圧機能ピラミッドネットワーク (NS-FPN) を提案する。
論文 参考訳(メタデータ) (2025-08-09T08:17:37Z) - High-Frequency Semantics and Geometric Priors for End-to-End Detection Transformers in Challenging UAV Imagery [6.902247657565531]
本稿では,空中シーンに適したリアルタイム検出変換器であるHEDS-DETRを紹介する。
まず,高周波数拡張セマンティックスネットワーク(HFESNet)のバックボーンを提案する。
第2に、高分解能特徴を効率的に融合させることにより、情報損失に対処する。
第三に、2つの相乗的成分を用いてデコーダの安定性と位置決め精度を向上させる。
論文 参考訳(メタデータ) (2025-07-01T14:56:56Z) - Probing Deep into Temporal Profile Makes the Infrared Small Target Detector Much Better [63.567886330598945]
赤外線小目標(IRST)検出は、精度、普遍性、堅牢性、効率的な性能を同時に達成する上で困難である。
現在の学習に基づく手法は、空間的領域と短期的領域の両方から"より多くの情報を活用する。
本稿では、IRST検出のための時間次元でのみ計算を行う効率的な深部プローブネットワーク(DeepPro)を提案する。
論文 参考訳(メタデータ) (2025-06-15T08:19:32Z) - It's Not the Target, It's the Background: Rethinking Infrared Small Target Detection via Deep Patch-Free Low-Rank Representations [5.326302374594885]
本稿では、LRRNetと呼ばれる新しいエンドツーエンドIRSTDフレームワークを提案する。
乱れシーンの物理的圧縮性に着想を得て,本手法は圧縮・再構成・減算パラダイムを採用する。
複数の公開データセットの実験により、LRRNetは検出精度、堅牢性、計算効率の点で38の最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2025-06-12T07:24:45Z) - DISTA-Net: Dynamic Closely-Spaced Infrared Small Target Unmixing [55.366556355538954]
本稿では,動的フレームワーク内で従来のスパース再構築を再現する動的反復収縮閾値ネットワーク(DISTA-Net)を提案する。
DISTA-Netは、密接な空間を持つ赤外線小ターゲットのアンミックスのために特別に設計された最初のディープラーニングモデルである。
私たちはこの分野におけるさらなる研究を促進するために、最初のオープンソースエコシステムを確立しました。
論文 参考訳(メタデータ) (2025-05-25T13:52:00Z) - STARS: Sparse Learning Correlation Filter with Spatio-temporal Regularization and Super-resolution Reconstruction for Thermal Infrared Target Tracking [8.52497147463548]
時間画像の低解像度化と追跡干渉、TIRトラッカーの時間長制限。
超解像再構成を取り入れたスパース学習型トラッカーを提案する。
我々の知る限りでは、STARSはスパースラーニングベースのフレームワークに、初めて超解像法を統合する。
論文 参考訳(メタデータ) (2025-04-20T04:49:52Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。