論文の概要: Pinwheel-shaped Convolution and Scale-based Dynamic Loss for Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2412.16986v1
- Date: Sun, 22 Dec 2024 12:04:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 15:58:13.798815
- Title: Pinwheel-shaped Convolution and Scale-based Dynamic Loss for Infrared Small Target Detection
- Title(参考訳): 赤外小ターゲット検出のためのピンホイール形状の畳み込みとスケールベース動的損失
- Authors: Jiangnan Yang, Shuangli Liu, Jingjun Wu, Xinyu Su, Nan Hai, Xueli Huang,
- Abstract要約: バックボーンネットワークの下位層における標準畳み込みの代替として,新しいピンホイール型畳み込み(PConv)を提案する。
PConvは、ディム小ターゲットの画素ガウス空間分布とよく一致し、特徴抽出を強化し、受容野を著しく増加させ、パラメータの最小増加しか導入しない。
我々はSIRST-UAVBという新しいベンチマークを構築し、これは実際の単フレーム赤外線小ターゲット検出において、これまでで最大かつ最も難しいデータセットである。
- 参考スコア(独自算出の注目度): 0.4398130586098371
- License:
- Abstract: These recent years have witnessed that convolutional neural network (CNN)-based methods for detecting infrared small targets have achieved outstanding performance. However, these methods typically employ standard convolutions, neglecting to consider the spatial characteristics of the pixel distribution of infrared small targets. Therefore, we propose a novel pinwheel-shaped convolution (PConv) as a replacement for standard convolutions in the lower layers of the backbone network. PConv better aligns with the pixel Gaussian spatial distribution of dim small targets, enhances feature extraction, significantly increases the receptive field, and introduces only a minimal increase in parameters. Additionally, while recent loss functions combine scale and location losses, they do not adequately account for the varying sensitivity of these losses across different target scales, limiting detection performance on dim-small targets. To overcome this, we propose a scale-based dynamic (SD) Loss that dynamically adjusts the influence of scale and location losses based on target size, improving the network's ability to detect targets of varying scales. We construct a new benchmark, SIRST-UAVB, which is the largest and most challenging dataset to date for real-shot single-frame infrared small target detection. Lastly, by integrating PConv and SD Loss into the latest small target detection algorithms, we achieved significant performance improvements on IRSTD-1K and our SIRST-UAVB dataset, validating the effectiveness and generalizability of our approach. Code -- https://github.com/JN-Yang/PConv-SDloss-Data
- Abstract(参考訳): 近年では、赤外小ターゲットを検出する畳み込みニューラルネットワーク(CNN)ベースの手法が優れたパフォーマンスを達成している。
しかし、これらの手法は一般的に標準の畳み込みを用いており、赤外線小ターゲットの画素分布の空間的特性を考慮しない。
そこで本研究では,バックボーンネットワークの下位層における標準畳み込みの代替として,新しいピンホイール型畳み込み(PConv)を提案する。
PConvは、ディム小ターゲットの画素ガウス空間分布とよく一致し、特徴抽出を強化し、受容野を著しく増加させ、パラメータの最小増加しか導入しない。
さらに、近年の損失関数はスケールとロケーションの損失を組み合わせたものだが、これらの損失の感度を異なる目標スケールで適切に考慮せず、ディム小目標に対する検出性能を制限している。
これを解決するために,ターゲットサイズに応じてスケールと位置損失の影響を動的に調整し,様々なスケールのターゲットを検出するネットワークの能力を向上させるスケールベース動的損失(SD損失)を提案する。
我々はSIRST-UAVBという新しいベンチマークを構築し、これは実際の単フレーム赤外線小ターゲット検出において、これまでで最大かつ最も難しいデータセットである。
最後に、PConvとSDロスを最新の小さなターゲット検出アルゴリズムに統合することにより、IRSTD-1KとSIRST-UAVBデータセットの大幅な性能向上を実現し、アプローチの有効性と一般化性を検証した。
コード --https://github.com/JN-Yang/PConv-SDloss-Data
関連論文リスト
- Better Sampling, towards Better End-to-end Small Object Detection [7.7473020808686694]
限られた特性と高密度と相互重なり合いのため、小さな物体検出は不満足なままである。
エンド・ツー・エンド・フレームワークにおけるサンプリングの強化手法を提案する。
我々のモデルは、VisDroneデータセット上での最先端(SOTA)よりも平均精度(AP)が2.9%向上することを示す。
論文 参考訳(メタデータ) (2024-05-17T04:37:44Z) - Infrared Small Target Detection with Scale and Location Sensitivity [19.89762494490961]
本稿では,より効率的な損失を伴い,より単純なモデル構造で検出性能を向上させることに焦点を当てる。
具体的には、まず、既存の損失の限界に対応するために、新しいスケール・アンド・ロケーション・センシティブ(SLS)損失を提案する。
予測の規模毎にSLS損失を適用することで、MSHNetは既存の最先端手法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2024-03-28T12:28:58Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - SpirDet: Towards Efficient, Accurate and Lightweight Infrared Small
Target Detector [60.42293239557962]
我々は、赤外線小ターゲットの効率的な検出のための新しいアプローチであるSpirDetを提案する。
新しいデュアルブランチスパースデコーダを用いて特徴写像を復元する。
大規模な実験により、提案されたSpirDetは最先端モデルよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-02-08T05:06:14Z) - Improved Dense Nested Attention Network Based on Transformer for
Infrared Small Target Detection [8.388564430699155]
深層学習に基づく赤外線小ターゲット検出は、複雑な背景と動的背景から小さなターゲットを分離する際、独特な利点をもたらす。
畳み込みニューラルネットワーク(CNN)の深さが増加するにつれて、赤外線小ターゲットの特徴は徐々に弱まる。
本稿では,トランスアーキテクチャに基づく高密度ネストアテンションネットワーク (IDNANet) を提案する。
論文 参考訳(メタデータ) (2023-11-15T07:29:24Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - One-Stage Cascade Refinement Networks for Infrared Small Target
Detection [21.28595135499812]
SIRST(Single-frame InfraRed Small Target)検出は、固有の特性の欠如による課題である。
実世界の高解像度単一フレームターゲットのSIRST-V2データセットからなる赤外線小ターゲット検出のための新しい研究ベンチマークを提案する。
論文 参考訳(メタデータ) (2022-12-16T13:37:23Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Regressive Domain Adaptation for Unsupervised Keypoint Detection [67.2950306888855]
ドメイン適応(DA)は、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送することを目的とする。
本稿では,教師なしキーポイント検出のためのレグレッシブドメイン適応(RegDA)法を提案する。
提案手法は,異なるデータセット上のPCKにおいて,8%から11%の大幅な改善をもたらす。
論文 参考訳(メタデータ) (2021-03-10T16:45:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。