論文の概要: Revisiting the Scale Loss Function and Gaussian-Shape Convolution for Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2604.09991v1
- Date: Sat, 11 Apr 2026 02:31:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.782186
- Title: Revisiting the Scale Loss Function and Gaussian-Shape Convolution for Infrared Small Target Detection
- Title(参考訳): 赤外小ターゲット検出のためのスケールロス関数とガウス形状変換の再検討
- Authors: Hao Li, Man Fung Zhuo,
- Abstract要約: 赤外線小目標検出は、非単調なスケール損失関数からの不安定性のトレーニングと、空間的注意の欠如という2つの永続的な課題に直面している。
本稿では,予測マスクと地上真実との符号付き面積差に応じて予測を重み付けするエンフディフに基づくスケール損失を提案する。
空間側では、赤外小目標の中心集中強度プロファイルと一致するように、学習可能なスケールパラメータを持つEmphGaussian型畳み込みを導入する。
- 参考スコア(独自算出の注目度): 5.238802422720473
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Infrared small target detection still faces two persistent challenges: training instability from non-monotonic scale loss functions, and inadequate spatial attention due to generic convolution kernels that ignore the physical imaging characteristics of small targets. In this paper, we revisit both aspects. For the loss side, we propose a \emph{diff-based scale loss} that weights predictions according to the signed area difference between the predicted mask and the ground truth, yielding strictly monotonic gradients and stable convergence. We further analyze a family of four scale loss variants to understand how their geometric properties affect detection behavior. For the spatial side, we introduce \emph{Gaussian-shaped convolution} with a learnable scale parameter to match the center-concentrated intensity profile of infrared small targets, and augment it with a \emph{rotated pinwheel mask} that adaptively aligns the kernel with target orientation via a straight-through estimator. Extensive experiments on IRSTD-1k, NUDT-SIRST, and SIRST-UAVB demonstrate consistent improvements in $mIoU$, $P_d$, and $F_a$ over state-of-the-art methods. We release our anonymous code and pretrained models.
- Abstract(参考訳): 赤外線小ターゲット検出は、非単調スケール損失関数からの不安定性のトレーニングと、小さなターゲットの物理的イメージング特性を無視した一般的な畳み込みカーネルによる空間的注意の不足という、2つの永続的な課題に直面している。
本稿では,両側面について考察する。
損失側には,予測マスクと地上真実との符号付き領域差に基づいて予測を重み付けし,厳密な単調勾配と安定収束を与える「emph{diff-based scale loss」を提案する。
さらに,その幾何学的特性が検出行動にどう影響するかを理解するために,4種類のスケール損失変異の族を解析する。
空間側では、赤外小目標の中心集中強度プロファイルと一致させるために、学習可能なスケールパラメータを持つ \emph{Gaussian-shaped convolution} を導入し、ストレートスルー推定器を介してカーネルと目標方向を適応的にアライメントする \emph{rotated pinwheel mask} で拡張する。
IRSTD-1k、NUDT-SIRST、SIRST-UAVBの大規模な実験では、mIoU$、$P_d$、$F_a$の最先端メソッドに対する一貫した改善が示されている。
匿名のコードと事前訓練されたモデルをリリースします。
関連論文リスト
- Pinwheel-shaped Convolution and Scale-based Dynamic Loss for Infrared Small Target Detection [0.4398130586098371]
バックボーンネットワークの下位層における標準畳み込みの代替として,新しいピンホイール型畳み込み(PConv)を提案する。
PConvは、ディム小ターゲットの画素ガウス空間分布とよく一致し、特徴抽出を強化し、受容野を著しく増加させ、パラメータの最小増加しか導入しない。
我々はSIRST-UAVBという新しいベンチマークを構築し、これは実際の単フレーム赤外線小ターゲット検出において、これまでで最大かつ最も難しいデータセットである。
論文 参考訳(メタデータ) (2024-12-22T12:04:02Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Learning High-Precision Bounding Box for Rotated Object Detection via
Kullback-Leibler Divergence [100.6913091147422]
既存の回転物体検出器は、主に水平検出パラダイムから受け継がれている。
本稿では,回転回帰損失の設計を帰納パラダイムから導出手法に変更することを目的としている。
論文 参考訳(メタデータ) (2021-06-03T14:29:19Z) - On the Principle of Least Symmetry Breaking in Shallow ReLU Models [13.760721677322072]
対象の重みに対する対称性の中期的損失は、より広範囲な設定に適用可能であることを示す。
これを受けて、我々はこの仮説を非等方性非積分布、滑らかな活性化関数、いくつかの層を持つネットワークの異なるクラスに相関させる一連の実験を行った。
論文 参考訳(メタデータ) (2019-12-26T22:04:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。