論文の概要: UIU-Net: U-Net in U-Net for Infrared Small Object Detection
- arxiv url: http://arxiv.org/abs/2212.00968v1
- Date: Fri, 2 Dec 2022 04:52:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 16:50:07.964228
- Title: UIU-Net: U-Net in U-Net for Infrared Small Object Detection
- Title(参考訳): UIU-Net:赤外線小物体検出のためのU-NetのU-Net
- Authors: Xin Wu and Danfeng Hong and Jocelyn Chanussot
- Abstract要約: 本稿では,U-NetフレームワークにおけるU-Netの簡易かつ効果的なUIU-Netを提案する。
名前が示すように、UIU-Netは小さなU-Netを大きなU-Netバックボーンに組み込み、オブジェクトのマルチレベルおよびマルチスケールの表現学習を可能にする。
提案したUIU-Netは、ビデオシーケンス赤外線小オブジェクトデータセットの強力な一般化性能も生み出す。
- 参考スコア(独自算出の注目度): 36.72184013409837
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning-based infrared small object detection methods currently rely heavily
on the classification backbone network. This tends to result in tiny object
loss and feature distinguishability limitations as the network depth increases.
Furthermore, small objects in infrared images are frequently emerged bright and
dark, posing severe demands for obtaining precise object contrast information.
For this reason, we in this paper propose a simple and effective ``U-Net in
U-Net'' framework, UIU-Net for short, and detect small objects in infrared
images. As the name suggests, UIU-Net embeds a tiny U-Net into a larger U-Net
backbone, enabling the multi-level and multi-scale representation learning of
objects. Moreover, UIU-Net can be trained from scratch, and the learned
features can enhance global and local contrast information effectively. More
specifically, the UIU-Net model is divided into two modules: the
resolution-maintenance deep supervision (RM-DS) module and the
interactive-cross attention (IC-A) module. RM-DS integrates Residual U-blocks
into a deep supervision network to generate deep multi-scale
resolution-maintenance features while learning global context information.
Further, IC-A encodes the local context information between the low-level
details and high-level semantic features. Extensive experiments conducted on
two infrared single-frame image datasets, i.e., SIRST and Synthetic datasets,
show the effectiveness and superiority of the proposed UIU-Net in comparison
with several state-of-the-art infrared small object detection methods. The
proposed UIU-Net also produces powerful generalization performance for video
sequence infrared small object datasets, e.g., ATR ground/air video sequence
dataset. The codes of this work are available openly at
\url{https://github.com/danfenghong/IEEE_TIP_UIU-Net}.
- Abstract(参考訳): 学習に基づく赤外小物体検出手法は現在、分類バックボーンネットワークに大きく依存している。
これは、ネットワークの深さが増加するにつれて、小さなオブジェクトの損失と特徴の区別可能性の制限をもたらす傾向がある。
さらに、赤外線画像中の小さな物体は、しばしば明るく暗く現われ、正確な物体コントラスト情報を得るために厳しい要求を受ける。
そこで本稿では,UIU-Netの簡易かつ効果的なフレームワークであるUIU-Netを提案する。
名前が示すように、UIU-Netは小さなU-Netを大きなU-Netバックボーンに組み込み、オブジェクトのマルチレベルおよびマルチスケールの表現学習を可能にする。
さらに、UIU-Netはゼロからトレーニングすることができ、学習した機能はグローバルとローカルのコントラスト情報を効果的に強化することができる。
より具体的には、UIU-Netモデルは、分解能維持深度監視(RM-DS)モジュールとインタラクティブクロスアテンション(IC-A)モジュールの2つのモジュールに分けられる。
RM-DSは、Residual Uブロックを深い監視ネットワークに統合し、グローバルコンテキスト情報を学習しながら、深いマルチスケールの解像度維持機能を生成する。
さらに、IC-Aは、低レベルの詳細と高レベルの意味的特徴の間のローカルコンテキスト情報を符号化する。
SIRSTとSyntheticの2つの赤外線単一フレーム画像データセットに対して行われた大規模な実験は、提案したUIU-Netの有効性と優位性を示している。
提案したUIU-Netは、ATR地上/空中ビデオシーケンスデータセットなど、ビデオシーケンス赤外線小オブジェクトデータセットの強力な一般化性能も提供する。
この作業のコードは、 \url{https://github.com/danfenghong/IEEE_TIP_UIU-Net} で公開されている。
関連論文リスト
- HCF-Net: Hierarchical Context Fusion Network for Infrared Small Object Detection [16.92362922379821]
赤外線小物体検出性能を向上させるための深層学習法を提案する。
本発明の方法は、PPAモジュール、DASIモジュール、MDCRモジュールを含む。
論文 参考訳(メタデータ) (2024-03-16T02:45:42Z) - ILNet: Low-level Matters for Salient Infrared Small Target Detection [5.248337726304453]
赤外線小目標検出は、赤外クラッタ背景から小目標を検出する技術である。
高レベルセマンティック情報の変形により、CNNの深い層では、小さな赤外線ターゲット特性が弱まる。
我々は、赤外線小ターゲットを意味情報が少ない有能な領域とみなす赤外線低レベルネットワーク(ILNet)を提案する。
論文 参考訳(メタデータ) (2023-09-24T14:09:37Z) - Point-aware Interaction and CNN-induced Refinement Network for RGB-D
Salient Object Detection [95.84616822805664]
我々は,CNNによるトランスフォーマーアーキテクチャを導入し,ポイント・アウェア・インタラクションとCNNによるリファインメントを備えた新しいRGB-D SODネットワークを提案する。
トランスフォーマーがもたらすブロック効果とディテール破壊問題を自然に軽減するために,コンテンツリファインメントとサプリメントのためのCNNRユニットを設計する。
論文 参考訳(メタデータ) (2023-08-17T11:57:49Z) - Local Contrast and Global Contextual Information Make Infrared Small
Object Salient Again [5.324958606516871]
赤外線小物体検出(ISOS)は、赤外画像中の乱雑な背景から、いくつかのピクセルでしかカバーされていない小さな物体を分割することを目的としている。
1) 十分な強度、形状、テクスチャ情報がない小さなオブジェクト、2) 深層ニューラルネットワークのような検出モデルが、連続的なダウンサンプリングを通じて高レベルのセマンティック特徴とイメージレベルの受容フィールドを得るプロセスにおいて、小さなオブジェクトは、容易に失われる。
本稿では,この2つの問題をうまく処理できるUCFNetと呼ばれるISOSの信頼性検出モデルを提案する。
いくつかの公開データセットの実験により、我々の手法は現状を大きく上回っていることが示された。
論文 参考訳(メタデータ) (2023-01-28T05:18:13Z) - iSmallNet: Densely Nested Network with Label Decoupling for Infrared
Small Target Detection [35.4167548966077]
iSmallNetは高密度にネストされたネットワークで、赤外小物体検出のためにラベルをデカップリングする。
全体的なパフォーマンスを高めるために、2つの重要なモジュールを開発しました。
NUAA-SIRSTとNUDT-SIRSTの実験は、iSmallNetが11の最先端検出器よりも優れていることを明らかに示している。
論文 参考訳(メタデータ) (2022-10-29T10:27:54Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - RGB-D Saliency Detection via Cascaded Mutual Information Minimization [122.8879596830581]
既存のRGB-Dサリエンシ検出モデルは、RGBと深さを効果的にマルチモーダル学習を実現するために明示的に奨励するものではない。
本稿では,RGB画像と深度データ間のマルチモーダル情報を「明示的」にモデル化するために,相互情報最小化による新しい多段階学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-15T12:31:27Z) - Dense Nested Attention Network for Infrared Small Target Detection [36.654692765557726]
単一フレーム赤外線小ターゲット(SIRST)検出は、小さなターゲットを乱雑な背景から分離することを目的としている。
既存のCNNベースのメソッドは、赤外線小ターゲットに対して直接適用することはできない。
本稿では,高密度ネステッドアテンションネットワーク(DNANet)を提案する。
論文 参考訳(メタデータ) (2021-06-01T13:45:35Z) - KiU-Net: Overcomplete Convolutional Architectures for Biomedical Image
and Volumetric Segmentation [71.79090083883403]
トラディショナル・エンコーダ・デコーダに基づく手法は, より小さな構造を検出でき, 境界領域を正確に分割できない。
本稿では,(1)入力の細部と正確なエッジを捉えることを学ぶ完全畳み込みネットワークKite-Netと,(2)高レベルの特徴を学習するU-Netの2つの枝を持つKiU-Netを提案する。
提案手法は,より少ないパラメータとより高速な収束の利点により,最近のすべての手法と比較して性能が向上する。
論文 参考訳(メタデータ) (2020-10-04T19:23:33Z) - Accurate RGB-D Salient Object Detection via Collaborative Learning [101.82654054191443]
RGB-Dサリエンシ検出は、いくつかの課題シナリオにおいて素晴らしい能力を示している。
本稿では,エッジ,深度,塩分濃度をより効率的に活用する新しい協調学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T04:33:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。