論文の概要: SpirDet: Towards Efficient, Accurate and Lightweight Infrared Small
Target Detector
- arxiv url: http://arxiv.org/abs/2402.05410v1
- Date: Thu, 8 Feb 2024 05:06:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 16:18:32.363239
- Title: SpirDet: Towards Efficient, Accurate and Lightweight Infrared Small
Target Detector
- Title(参考訳): spirdet: 効率的で正確で軽量な赤外線小型ターゲット検出器を目指して
- Authors: Qianchen Mao, Qiang Li, Bingshu Wang, Yongjun Zhang, Tao Dai, C.L.
Philip Chen
- Abstract要約: 我々は、赤外線小ターゲットの効率的な検出のための新しいアプローチであるSpirDetを提案する。
新しいデュアルブランチスパースデコーダを用いて特徴写像を復元する。
大規模な実験により、提案されたSpirDetは最先端モデルよりも大幅に優れていることが示された。
- 参考スコア(独自算出の注目度): 60.42293239557962
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, the detection of infrared small targets using deep learning
methods has garnered substantial attention due to notable advancements. To
improve the detection capability of small targets, these methods commonly
maintain a pathway that preserves high-resolution features of sparse and tiny
targets. However, it can result in redundant and expensive computations. To
tackle this challenge, we propose SpirDet, a novel approach for efficient
detection of infrared small targets. Specifically, to cope with the
computational redundancy issue, we employ a new dual-branch sparse decoder to
restore the feature map. Firstly, the fast branch directly predicts a sparse
map indicating potential small target locations (occupying only 0.5\% area of
the map). Secondly, the slow branch conducts fine-grained adjustments at the
positions indicated by the sparse map. Additionally, we design an lightweight
DO-RepEncoder based on reparameterization with the Downsampling Orthogonality,
which can effectively reduce memory consumption and inference latency.
Extensive experiments show that the proposed SpirDet significantly outperforms
state-of-the-art models while achieving faster inference speed and fewer
parameters. For example, on the IRSTD-1K dataset, SpirDet improves $MIoU$ by
4.7 and has a $7\times$ $FPS$ acceleration compared to the previous
state-of-the-art model. The code will be open to the public.
- Abstract(参考訳): 近年,深層学習手法による赤外線小型ターゲットの検出が注目されている。
小目標の検出能力を向上させるため、これらの手法はスパースと小目標の高解像度な特徴を保持する経路を一般に維持する。
しかし、これは冗長で高価な計算をもたらす可能性がある。
この課題に対処するために、赤外小目標を効率的に検出するための新しいアプローチであるSpirDetを提案する。
具体的には、計算冗長性の問題に対処するために、特徴マップを復元するために新しいデュアルブランチスパースデコーダを用いる。
第一に、高速分岐は、潜在的に小さな目標位置(地図の0.5 % しか占めていない)を示すスパースマップを直接予測する。
第二に、遅い分岐はスパースマップで示される位置においてきめ細かい調整を行う。
さらに,Downsampling Orthogonalityを用いた再パラメータ化に基づく軽量DO-RepEncoderを設計し,メモリ消費と推論遅延を効果的に低減する。
大規模な実験により、提案されたSpirDetは、より高速な推論速度と少ないパラメータを実現しつつ、最先端のモデルよりも大幅に優れていることが示された。
例えば、IRSTD-1Kデータセットでは、SpirDetはMIoU$を4.7改善し、以前の最先端モデルと比較して7\times$$FPS$アクセラレーションを持つ。
コードは一般公開される予定だ。
関連論文リスト
- ESOD: Efficient Small Object Detection on High-Resolution Images [36.80623357577051]
小さなオブジェクトは通常、わずかに分散され、局所的にクラスタ化される。
画像の非対象背景領域において、大量の特徴抽出計算を無駄にする。
本稿では,検出器のバックボーンを再利用して,特徴レベルのオブジェクト探索とパッチスライシングを行う方法を提案する。
論文 参考訳(メタデータ) (2024-07-23T12:21:23Z) - Infrared Small Target Detection with Scale and Location Sensitivity [19.89762494490961]
本稿では,より効率的な損失を伴い,より単純なモデル構造で検出性能を向上させることに焦点を当てる。
具体的には、まず、既存の損失の限界に対応するために、新しいスケール・アンド・ロケーション・センシティブ(SLS)損失を提案する。
予測の規模毎にSLS損失を適用することで、MSHNetは既存の最先端手法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2024-03-28T12:28:58Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - One-Stage Cascade Refinement Networks for Infrared Small Target
Detection [21.28595135499812]
SIRST(Single-frame InfraRed Small Target)検出は、固有の特性の欠如による課題である。
実世界の高解像度単一フレームターゲットのSIRST-V2データセットからなる赤外線小ターゲット検出のための新しい研究ベンチマークを提案する。
論文 参考訳(メタデータ) (2022-12-16T13:37:23Z) - Lightweight Salient Object Detection in Optical Remote Sensing Images
via Feature Correlation [93.80710126516405]
本稿では,これらの問題に対処する軽量ORSI-SODソリューションであるCorrNetを提案する。
それぞれのコンポーネントのパラメータと計算を減らし、CorrNetは4.09Mのパラメータしか持たず、21.09GのFLOPで実行している。
2つの公開データセットの実験結果から、私たちの軽量なCorrNetは、26の最先端メソッドと比較して、競争力やパフォーマンスがさらに向上することが示された。
論文 参考訳(メタデータ) (2022-01-20T08:28:01Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - QueryDet: Cascaded Sparse Query for Accelerating High-Resolution Small
Object Detection [17.775203579232144]
特徴ピラミド系物体検出器の推論速度を高速化する新規なクエリ機構を提案する。
パイプラインはまず、低解像度特徴量上の小さな物体の粗い位置を予測し、高解像度特徴量を用いて正確な検出結果を算出する。
一般的なCOCOデータセットでは,検出mAPを1.0倍,mAPを2.0倍に改善し,高分解能推論速度を平均3.0倍に向上する。
論文 参考訳(メタデータ) (2021-03-16T15:30:20Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。