論文の概要: Triple-domain Feature Learning with Frequency-aware Memory Enhancement for Moving Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2406.06949v2
- Date: Thu, 5 Sep 2024 14:16:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-07 02:31:44.675595
- Title: Triple-domain Feature Learning with Frequency-aware Memory Enhancement for Moving Infrared Small Target Detection
- Title(参考訳): 移動赤外小ターゲット検出のための周波数認識メモリ拡張を用いた三領域特徴学習
- Authors: Weiwei Duan, Luping Ji, Shengjia Chen, Sicheng Zhu, Mao Ye,
- Abstract要約: 赤外線小ターゲット検出は、ターゲットサイズと背景とのコントラストが低いため、重大な課題を呈する。
我々は、赤外線小ターゲット検出のための時間領域に周波数認識メモリを付加した新しいトリプルドメイン戦略(トリド)を提案する。
人間の視覚システムにインスパイアされたメモリ拡張は、ビデオフレーム間の赤外線ターゲットの空間的関係を捉えるように設計されている。
- 参考スコア(独自算出の注目度): 12.641645684148136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As a sub-field of object detection, moving infrared small target detection presents significant challenges due to tiny target sizes and low contrast against backgrounds. Currently-existing methods primarily rely on the features extracted only from spatio-temporal domain. Frequency domain has hardly been concerned yet, although it has been widely applied in image processing. To extend feature source domains and enhance feature representation, we propose a new Triple-domain Strategy (Tridos) with the frequency-aware memory enhancement on spatio-temporal domain for infrared small target detection. In this scheme, it effectively detaches and enhances frequency features by a local-global frequency-aware module with Fourier transform. Inspired by human visual system, our memory enhancement is designed to capture the spatial relations of infrared targets among video frames. Furthermore, it encodes temporal dynamics motion features via differential learning and residual enhancing. Additionally, we further design a residual compensation to reconcile possible cross-domain feature mismatches. To our best knowledge, proposed Tridos is the first work to explore infrared target feature learning comprehensively in spatio-temporal-frequency domains. The extensive experiments on three datasets (i.e., DAUB, ITSDT-15K and IRDST) validate that our triple-domain infrared feature learning scheme could often be obviously superior to state-of-the-art ones. Source codes are available at https://github.com/UESTC-nnLab/Tridos.
- Abstract(参考訳): 物体検出のサブフィールドとして、移動赤外線小目標検出は、小さなターゲットサイズと背景とのコントラストの低いため、大きな課題を呈する。
現在存在する手法は主に時空間領域のみから抽出された特徴に依存している。
周波数領域は、画像処理に広く応用されているが、ほとんど関心がない。
特徴源領域を拡張し,特徴表現を強化するため,赤外小目標検出のための時空間領域に周波数認識メモリを付加した新しいトリプル領域戦略(トリド)を提案する。
この方式では、フーリエ変換を用いた局所的な周波数認識モジュールにより、周波数特性を効果的に分解し、拡張する。
人間の視覚システムにインスパイアされたメモリ拡張は、ビデオフレーム間の赤外線ターゲットの空間的関係を捉えるように設計されている。
さらに,時間的運動特徴を差分学習と残差増強によって符号化する。
さらに,クロスドメインな特徴ミスマッチを再現するために,余剰な補償を設計する。
我々の知る限り、提案するTridosは、時空間周波数領域における赤外線ターゲット特徴学習を包括的に探求する最初の試みである。
3つのデータセット(DAUB, ITSDT-15K, IRDST)に関する広範な実験は、我々のトリプルドメイン赤外線特徴学習スキームが明らかに最先端のものよりも優れていることを証明している。
ソースコードはhttps://github.com/UESTC-nnLab/Tridos.comで入手できる。
関連論文リスト
- Frequency-Spatial Entanglement Learning for Camouflaged Object Detection [34.426297468968485]
既存の手法では、複雑な設計で空間的特徴の識別能力を最大化することにより、画素類似性の影響を減らそうとしている。
本稿では,周波数領域と空間領域の表現を共同で探索し,周波数空間の絡み合い学習(FSEL)手法を提案する。
我々の実験は、広く使われている3つのデータセットにおける包括的量的および質的比較を通じて、21以上の最先端手法によるFSELの優位性を実証した。
論文 参考訳(メタデータ) (2024-09-03T07:58:47Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Frequency Domain Nuances Mining for Visible-Infrared Person
Re-identification [75.87443138635432]
既存の手法は主に、識別周波数情報を無視しながら空間情報を利用する。
本稿では,周波数領域情報を対象とした周波数領域Nuances Mining(FDNM)手法を提案する。
本手法は,SYSU-MM01データセットにおいて,Ran-1精度が5.2%,mAPが5.8%向上する。
論文 参考訳(メタデータ) (2024-01-04T09:19:54Z) - An Adaptive Spatial-Temporal Local Feature Difference Method for
Infrared Small-moving Target Detection [8.466660143185493]
適応的背景抑圧(ABS)を用いた時空間局所特徴差法(STLFD)を提案する。
提案手法では,空間領域と時間領域のフィルタを用いて,出力に対して画素レベルのABSを行い,対象と背景のコントラストを高める。
実験の結果,提案手法は赤外線小移動目標検出のための最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2023-09-05T08:56:20Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - Fast Fourier Convolution Based Remote Sensor Image Object Detection for
Earth Observation [0.0]
リモートセンシングオブジェクト検出のための周波数対応特徴ピラミッドフレームワーク(FFPF)を提案する。
F-ResNetは、周波数領域の畳み込みをバックボーンの各ステージに差し込み、スペクトルコンテキスト情報を知覚するために提案される。
BSFPNは、双方向サンプリング戦略とスキップ接続を用いて、異なるスケールの物体の特徴の関連をより良くモデル化するように設計されている。
論文 参考訳(メタデータ) (2022-09-01T15:50:58Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Radar Guided Dynamic Visual Attention for Resource-Efficient RGB Object
Detection [10.983063391496543]
自動運転車の認識品質を向上させるために,RGB画像に対する新しいレーダー誘導空間アテンションを提案する。
提案手法は,RGBモードの物体検出装置では検出されない小型・長距離物体の知覚を改善する。
論文 参考訳(メタデータ) (2022-06-03T18:29:55Z) - Fourier Disentangled Space-Time Attention for Aerial Video Recognition [54.80846279175762]
本稿では,UAVビデオ行動認識のためのFAR(Fourier Activity Recognition)アルゴリズムを提案する。
我々の定式化は、人間のエージェントを背景から自然に分離するために、新しいフーリエオブジェクト・ディコンタングルメント法を用いています。
我々はUAV Human RGB、UAV Human Night、Drone Action、NEC Droneを含む複数のUAVデータセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2022-03-21T01:24:53Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。