論文の概要: Dynamic High-frequency Convolution for Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2602.02969v1
- Date: Tue, 03 Feb 2026 01:07:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.169792
- Title: Dynamic High-frequency Convolution for Infrared Small Target Detection
- Title(参考訳): 赤外線小ターゲット検出のための動的高周波コンボリューション
- Authors: Ruojing Li, Chao Xiao, Qian Yin, Wei An, Nuo Chen, Xinyi Ying, Miao Li, Yingqian Wang,
- Abstract要約: 単一フレーム赤外線小目標(SIRST)検出は困難である。
現在の学習ベースの手法はディープネットワークの強力な能力に依存している。
本稿では,識別的モデリングプロセスから動的局所フィルタバンクを生成するための動的高周波畳み込み(DHiF)を提案する。
- 参考スコア(独自算出の注目度): 27.117309531414147
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Infrared small targets are typically tiny and locally salient, which belong to high-frequency components (HFCs) in images. Single-frame infrared small target (SIRST) detection is challenging, since there are many HFCs along with targets, such as bright corners, broken clouds, and other clutters. Current learning-based methods rely on the powerful capabilities of deep networks, but neglect explicit modeling and discriminative representation learning of various HFCs, which is important to distinguish targets from other HFCs. To address the aforementioned issues, we propose a dynamic high-frequency convolution (DHiF) to translate the discriminative modeling process into the generation of a dynamic local filter bank. Especially, DHiF is sensitive to HFCs, owing to the dynamic parameters of its generated filters being symmetrically adjusted within a zero-centered range according to Fourier transformation properties. Combining with standard convolution operations, DHiF can adaptively and dynamically process different HFC regions and capture their distinctive grayscale variation characteristics for discriminative representation learning. DHiF functions as a drop-in replacement for standard convolution and can be used in arbitrary SIRST detection networks without significant decrease in computational efficiency. To validate the effectiveness of our DHiF, we conducted extensive experiments across different SIRST detection networks on real-scene datasets. Compared to other state-of-the-art convolution operations, DHiF exhibits superior detection performance with promising improvement. Codes are available at https://github.com/TinaLRJ/DHiF.
- Abstract(参考訳): 赤外線小ターゲットは、画像中の高周波成分(HFC)に属する、小さく、局所的に正当であるのが一般的である。
単一フレーム赤外線小目標(SIRST)検出は、明るい角、壊れた雲、その他の乱れなど、多くのHFCと共に存在するため、難しい。
現在の学習ベースの手法はディープ・ネットワークの強力な能力に頼っているが、様々なHFCの明示的モデリングと識別的表現学習は無視されている。
上記の問題に対処するために,識別モデルプロセスから動的局所フィルタバンクを生成するための動的高周波畳み込み(DHiF)を提案する。
特に、DHiFはHFCに敏感であり、生成したフィルタの動的パラメータがフーリエ変換特性に応じてゼロ中心の範囲内で対称的に調整されているためである。
標準的な畳み込み演算と組み合わせることで、DHiFは異なるHFC領域を適応的かつ動的に処理し、識別的表現学習のためにそれらの特徴的なグレースケールの変動特性を捉えることができる。
DHiFは標準畳み込みの代替として機能し、計算効率を著しく低下させることなく任意のSIRST検出ネットワークで使用できる。
DHiFの有効性を検証するために、実シーンデータセット上で異なるSIRST検出ネットワークをまたいだ広範囲な実験を行った。
他の最先端の畳み込み操作と比較して、DHiFは優れた検出性能を示し、有望な改善が期待できる。
コードはhttps://github.com/TinaLRJ/DHiF.comで入手できる。
関連論文リスト
- SFFR: Spatial-Frequency Feature Reconstruction for Multispectral Aerial Object Detection [12.521255528136278]
本研究では,新しい空間周波数特徴再構成法 (SFFR) を提案する。
特徴融合の前に空間領域と周波数領域の相補表現を再構成する。
提案するFCEKANモジュールとMSGKANモジュールは相補的であり,それぞれの周波数と空間的意味的特徴を効果的に捉えることができることを示す。
論文 参考訳(メタデータ) (2025-11-09T09:34:10Z) - Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。
既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。
本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文 参考訳(メタデータ) (2025-08-07T11:14:16Z) - FADPNet: Frequency-Aware Dual-Path Network for Face Super-Resolution [70.61549422952193]
計算コストの制限による顔超解像(FSR)は未解決の問題である。
既存のアプローチでは、全ての顔のピクセルを等しく扱い、計算資源を最適以下に割り当てる。
本稿では、低周波成分と高周波成分に顔の特徴を分解する周波数対応デュアルパスネットワークであるFADPNetを提案する。
論文 参考訳(メタデータ) (2025-06-17T02:33:42Z) - ARFC-WAHNet: Adaptive Receptive Field Convolution and Wavelet-Attentive Hierarchical Network for Infrared Small Target Detection [2.643590634429843]
ARFC-WAHNetは、赤外線小ターゲット検出のための適応型受容野畳み込みおよびウェーブレット減衰階層ネットワークである。
ARFC-WAHNetは、検出精度とロバスト性の両方において、最近の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2025-05-15T09:44:23Z) - Frequency Domain Enhanced U-Net for Low-Frequency Information-Rich Image Segmentation in Surgical and Deep-Sea Exploration Robots [34.28684917337352]
CNNと人間の視覚系における周波数帯域感度の差について検討する。
本稿では、生体視覚機構にインスパイアされたウェーブレット適応スペクトル融合(WASF)法を提案する。
我々は SAM2 のバックボーンネットワークを利用する FE-UNet モデルを開発し, セグメンテーション精度を確保するために細調整した Hiera-Large モジュールを組み込んだ。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - You Only Train Once: A Unified Framework for Both Full-Reference and No-Reference Image Quality Assessment [45.62136459502005]
本稿では,完全な参照 (FR) と非参照 (NR) IQA を行うネットワークを提案する。
まず、入力画像から多レベル特徴を抽出するためにエンコーダを用いる。
FRおよびNR入力のユニバーサルアダプタとして階層的注意(HA)モジュールを提案する。
エンコーダの浅い層と深い層との間の特徴相関を調べるために, セマンティック・ディストーション・アウェア (SDA) モジュールを提案する。
論文 参考訳(メタデータ) (2023-10-14T11:03:04Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。