論文の概要: FeedbackSTS-Det: Sparse Frames-Based Spatio-Temporal Semantic Feedback Network for Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2601.14690v1
- Date: Wed, 21 Jan 2026 06:06:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.252966
- Title: FeedbackSTS-Det: Sparse Frames-Based Spatio-Temporal Semantic Feedback Network for Infrared Small Target Detection
- Title(参考訳): フィードバックSTS-Det: スパースフレームに基づく赤外小ターゲット検出のための時空間セマンティックフィードバックネットワーク
- Authors: Yian Huang, Qing Qin, Aji Mao, Xiangyu Qiu, Liang Xu, Xian Zhang, Zhenming Peng,
- Abstract要約: 複雑な背景下での赤外線小検出目標(ISTD)は依然として困難な課題である。
既存の手法はまだ非効率な長距離依存性モデリングに苦慮している。
本稿では,スパースなセマンティック・テンポラル・フィードバック・ネットワークによるISTD検出手法を提案する。
- 参考スコア(独自算出の注目度): 7.648318265124807
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Infrared small target detection (ISTD) under complex backgrounds remains a critical yet challenging task, primarily due to the extremely low signal-to-clutter ratio, persistent dynamic interference, and the lack of distinct target features. While multi-frame detection methods leverages temporal cues to improve upon single-frame approaches, existing methods still struggle with inefficient long-range dependency modeling and insufficient robustness. To overcome these issues, we propose a novel scheme for ISTD, realized through a sparse frames-based spatio-temporal semantic feedback network named FeedbackSTS-Det. The core of our approach is a novel spatio-temporal semantic feedback strategy with a closed-loop semantic association mechanism, which consists of paired forward and backward refinement modules that work cooperatively across the encoder and decoder. Moreover, both modules incorporate an embedded sparse semantic module (SSM), which performs structured sparse temporal modeling to capture long-range dependencies with low computational cost. This integrated design facilitates robust implicit inter-frame registration and continuous semantic refinement, effectively suppressing false alarms. Furthermore, our overall procedure maintains a consistent training-inference pipeline, which ensures reliable performance transfer and increases model robustness. Extensive experiments on multiple benchmark datasets confirm the effectiveness of FeedbackSTS-Det. Code and models are available at: https://github.com/IDIP-Lab/FeedbackSTS-Det.
- Abstract(参考訳): 複雑な背景下での赤外線小目標検出(ISTD)は、信号対クラッタ比が極端に低いこと、持続的動的干渉、異なるターゲット特徴の欠如など、重要な課題であり続けている。
複数フレーム検出手法は時間的手がかりを利用して単一フレームアプローチを改善するが、既存の手法では非効率な長距離依存性モデリングと不十分な堅牢性に苦戦している。
これらの課題を克服するため、我々は、スパースフレームベースの時空間的セマンティックフィードバックネットワークであるFeedbackSTS-Detを通じて実現されたISTDの新しいスキームを提案する。
提案手法のコアとなるのは,エンコーダとデコーダをまたいで協調して機能する,ペア化された前方・後方改質モジュールからなる閉ループセマンティックアソシエーション機構を備えた,新しい時空間的セマンティックフィードバック戦略である。
さらに、どちらのモジュールも組込みスパースセマンティックモジュール(SSM)を組み込んでおり、低計算コストで長距離依存関係をキャプチャするために構造化スパース時間モデリングを実行する。
この統合設計は、強い暗黙的なフレーム間登録と連続的なセマンティックリファインメントを促進し、誤報を効果的に抑制する。
さらに、我々の全体的な手順は、信頼性の高いパフォーマンス転送を保証し、モデルの堅牢性を高める、一貫したトレーニング-推論パイプラインを維持している。
複数のベンチマークデータセットに対する大規模な実験により、FeedbackSTS-Detの有効性が確認された。
コードとモデルは、https://github.com/IDIP-Lab/FeedbackSTS-Det.comで入手できる。
関連論文リスト
- Towards Robust Optical-SAR Object Detection under Missing Modalities: A Dynamic Quality-Aware Fusion Framework [27.71603877164877]
光・合成開口レーダ(SAR)融合による物体検出はリモートセンシングに大きな研究関心を集めている。
本稿では,光SARオブジェクト検出のためのQDFNet(Quality-Aware Dynamic Fusion Network)を提案する。
論文 参考訳(メタデータ) (2025-12-27T03:16:48Z) - Source-Free Object Detection with Detection Transformer [59.33653163035064]
Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースドメインから教師なしのターゲットドメインへの知識転送を可能にする。
ほとんどの既存のSFODアプローチは、より高速なR-CNNのような従来のオブジェクト検出(OD)モデルに限られるか、新しいODアーキテクチャ、特に検出変換器(DETR)に適合しない一般的なソリューションとして設計されている。
本稿では,DTRのクエリ中心の機能強化を特化して設計された新しいSFODフレームワークであるFeature Reweighting ANd Contrastive Learning NetworK(FRANCK)を紹介する。
論文 参考訳(メタデータ) (2025-10-13T07:35:04Z) - Unsupervised Online 3D Instance Segmentation with Synthetic Sequences and Dynamic Loss [52.28880405119483]
教師なしのオンライン3Dインスタンスのセグメンテーションは、基本的だが難しい課題だ。
UNITのような既存の手法はこの方向に進んできたが、訓練の多様性が制限されているままである。
本稿では,合成点雲列生成によるトレーニング分布の強化を目的とした新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-27T08:53:27Z) - Temporal Point-Supervised Signal Reconstruction: A Human-Annotation-Free Framework for Weak Moving Target Detection [1.187456026346823]
手動のアノテーションを使わずに弱いターゲットを高速に検出できるTPS(Temporal Point-Supervised)フレームワークを提案する。
テンポラル信号再構成ネットワーク(TSRNet)は、TPSパラダイムの下で開発され、これらの過渡的な信号を再構成する。
目的とする低SNRデータセットに対する大規模な実験により、我々のフレームワークは人間のアノテーションを必要とせず、最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2025-07-23T09:02:09Z) - Fully Spiking Neural Networks for Unified Frame-Event Object Tracking [17.626181371045575]
我々は、SpikeFETと呼ばれる、最初の完全なSpyking Frame-Event Trackingフレームワークを提案する。
このネットワークは、進化的局所特徴抽出とトランスフォーマーに基づくグローバルモデリングをスパイキングパラダイム内で相乗的に統合する。
提案手法は既存の手法よりも優れたトラッキング精度を実現し,消費電力を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2025-05-27T07:53:50Z) - DiffMOD: Progressive Diffusion Point Denoising for Moving Object Detection in Remote Sensing [40.607660968380394]
リモートセンシングにおける移動物体検出(MOD)は、低解像度、極めて小さなオブジェクトサイズ、複雑なノイズ干渉によって著しく困難である。
現在のディープラーニングに基づくMOD法は、オブジェクト間の柔軟な情報相互作用を制限する確率密度推定に依存している。
本稿では,移動物体中心をスパースノイズ点から反復的に回収する遠隔センシングのためのポイントベースMODを提案する。
論文 参考訳(メタデータ) (2025-04-14T14:44:52Z) - Temporal Feature Matters: A Framework for Diffusion Model Quantization [105.3033493564844]
拡散モデルはマルチラウンド・デノナイジングの時間ステップに依存している。
3つの戦略を含む新しい量子化フレームワークを導入する。
このフレームワークは時間情報のほとんどを保存し、高品質なエンドツーエンド生成を保証する。
論文 参考訳(メタデータ) (2024-07-28T17:46:15Z) - Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。