論文の概要: Lost in UNet: Improving Infrared Small Target Detection by Underappreciated Local Features
- arxiv url: http://arxiv.org/abs/2406.13445v1
- Date: Wed, 19 Jun 2024 11:11:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 20:03:05.376696
- Title: Lost in UNet: Improving Infrared Small Target Detection by Underappreciated Local Features
- Title(参考訳): UNetにおける損失:未承認局所特徴による赤外線小ターゲット検出の改善
- Authors: Wuzhou Quan, Wei Zhao, Weiming Wang, Haoran Xie, Fu Lee Wang, Mingqiang Wei,
- Abstract要約: HintUは、様々なUNetベースの手法によって失われた局所的特徴を回復し、効果的な赤外線小ターゲット検出を行う新しいネットワークである。
これは"Hint"メカニズムを初めて導入し、すなわち、ターゲット位置の事前の知識を活用して、重要なローカル特徴を強調する。
メインストリームのUNetベースのアーキテクチャを改善して、ダウンサンプリング後もターゲットピクセルを保存する。
- 参考スコア(独自算出の注目度): 24.53392612217076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many targets are often very small in infrared images due to the long-distance imaging meachnism. UNet and its variants, as popular detection backbone networks, downsample the local features early and cause the irreversible loss of these local features, leading to both the missed and false detection of small targets in infrared images. We propose HintU, a novel network to recover the local features lost by various UNet-based methods for effective infrared small target detection. HintU has two key contributions. First, it introduces the "Hint" mechanism for the first time, i.e., leveraging the prior knowledge of target locations to highlight critical local features. Second, it improves the mainstream UNet-based architecture to preserve target pixels even after downsampling. HintU can shift the focus of various networks (e.g., vanilla UNet, UNet++, UIUNet, MiM+, and HCFNet) from the irrelevant background pixels to a more restricted area from the beginning. Experimental results on three datasets NUDT-SIRST, SIRSTv2 and IRSTD1K demonstrate that HintU enhances the performance of existing methods with only an additional 1.88 ms cost (on RTX Titan). Additionally, the explicit constraints of HintU enhance the generalization ability of UNet-based methods. Code is available at https://github.com/Wuzhou-Quan/HintU.
- Abstract(参考訳): 多くの標的は、遠距離画像メカニズムのため、赤外線画像において非常に小さいことが多い。
UNetとその変種は、一般的な検出バックボーンネットワークとして、これらのローカル特徴を早期にダウンサンプルし、これらのローカル特徴の不可逆的な損失を引き起こし、赤外線画像における小さなターゲットの欠落と誤検出の両方を引き起こす。
提案するHintUは、様々なUNet方式で失われた局所的特徴を復元し、効果的な赤外小目標検出を行うための新しいネットワークである。
HintUには2つの重要な貢献がある。
第一に、"Hint"メカニズムを初めて導入し、すなわち、ターゲット位置の事前の知識を活用して、重要なローカル特徴を強調する。
第二に、メインストリームのUNetベースのアーキテクチャを改善して、ダウンサンプリング後もターゲットピクセルを保存する。
HintUは、さまざまなネットワーク(例えば、バニラUNet、UNet++、UIUNet、MiM+、HCFNet)の焦点を、無関係な背景ピクセルから、最初からより制限のある領域にシフトすることができる。
NUDT-SIRST、SIRSTv2、IRSTD1Kの3つのデータセットの実験結果は、HintUが既存のメソッドのパフォーマンスを1.88ミリ秒(RTX Titan)で向上させることを示した。
さらに、HintUの明示的な制約は、UNetベースのメソッドの一般化能力を高める。
コードはhttps://github.com/Wuzhou-Quan/HintUで入手できる。
関連論文リスト
- Triple-domain Feature Learning with Frequency-aware Memory Enhancement for Moving Infrared Small Target Detection [12.641645684148136]
赤外線小ターゲット検出は、ターゲットサイズと背景とのコントラストが低いため、重大な課題を呈する。
我々は、赤外線小ターゲット検出のための時間領域に周波数認識メモリを付加した新しいトリプルドメイン戦略(トリド)を提案する。
人間の視覚システムにインスパイアされたメモリ拡張は、ビデオフレーム間の赤外線ターゲットの空間的関係を捉えるように設計されている。
論文 参考訳(メタデータ) (2024-06-11T05:21:30Z) - Infrared Small Target Detection with Scale and Location Sensitivity [19.89762494490961]
本稿では,より効率的な損失を伴い,より単純なモデル構造で検出性能を向上させることに焦点を当てる。
具体的には、まず、既存の損失の限界に対応するために、新しいスケール・アンド・ロケーション・センシティブ(SLS)損失を提案する。
予測の規模毎にSLS損失を適用することで、MSHNetは既存の最先端手法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2024-03-28T12:28:58Z) - Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - SpirDet: Towards Efficient, Accurate and Lightweight Infrared Small
Target Detector [60.42293239557962]
我々は、赤外線小ターゲットの効率的な検出のための新しいアプローチであるSpirDetを提案する。
新しいデュアルブランチスパースデコーダを用いて特徴写像を復元する。
大規模な実験により、提案されたSpirDetは最先端モデルよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-02-08T05:06:14Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - Location-Free Camouflage Generation Network [82.74353843283407]
カモフラージュ(Camouflage)は一般的な視覚現象で、前景の物体を背景のイメージに隠すことで、人間の目からは一時的に見えなくなる。
本稿では,前景と背景像の高次特徴を融合させ,一つの推論によって結果を生成する,ロケーションフリーなカモフラージュ生成ネットワーク(LCG-Net)を提案する。
実験により,本手法は単一外観領域における最先端技術と同程度に良好であり,完全に見えない可能性が低いが,多外観領域における最先端技術の品質をはるかに上回っていることが示された。
論文 参考訳(メタデータ) (2022-03-18T10:33:40Z) - Local Motion and Contrast Priors Driven Deep Network for Infrared Small
Target Super-Resolution [24.131639832686083]
赤外線小目標超解像(SR)は、高コントラスト目標の信頼性と高解像度像を低解像度画像から回収することを目的としている。
Infrared small target SR method called local motion and contrast prior network (MoCoPnet)を提案する。
MoCoPnetは、赤外線小ターゲットのドメイン知識を深層ネットワークに統合し、小さな赤外線小ターゲットの特徴不足を軽減する。
論文 参考訳(メタデータ) (2022-01-04T07:20:46Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Zero-Shot Multi-View Indoor Localization via Graph Location Networks [66.05980368549928]
屋内ローカライゼーションは、位置ベースアプリケーションにおける基本的な問題である。
本稿では,インフラストラクチャフリーで多視点画像に基づく屋内ローカライゼーションを実現するために,新しいニューラルネットワークアーキテクチャであるGraph Location Networks(GLN)を提案する。
GLNは、メッセージパッシングネットワークを通じて画像から抽出されたロバストな位置表現に基づいて位置予測を行う。
新たにゼロショット屋内ローカライズ設定を導入し,提案したGLNを専用ゼロショットバージョンに拡張することで,その課題に対処する。
論文 参考訳(メタデータ) (2020-08-06T07:36:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。