論文の概要: MTU-Net: Multi-level TransUNet for Space-based Infrared Tiny Ship
Detection
- arxiv url: http://arxiv.org/abs/2209.13756v1
- Date: Wed, 28 Sep 2022 00:48:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 17:05:34.580134
- Title: MTU-Net: Multi-level TransUNet for Space-based Infrared Tiny Ship
Detection
- Title(参考訳): MTU-Net:宇宙用赤外線Tiny船検出用マルチレベルトランスUNet
- Authors: Tianhao Wu, Boyang Li, Yihang Luo, Yingqian Wang, Chao Xiao, Ting Liu,
Jungang Yang, Wei An, Yulan Guo
- Abstract要約: 我々は,48個の空間ベースの赤外線画像と17598ピクセルレベルの小型船舶アノテーションを用いた,宇宙ベースの小型船舶検出データセット(NUDT-SIRST-Sea)を開発した。
このような挑戦的な場面におけるこれらの小型船の極端な特性を考慮すると、本稿ではマルチレベルトランスUNet(MTU-Net)を提案する。
NUDT-SIRST-Seaデータセットによる実験結果から,MTU-Netは従来の深層学習に基づくSIRST法よりも検出率,誤警報率,結合上の交叉率の点で優れていた。
- 参考スコア(独自算出の注目度): 42.92798053154314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Space-based infrared tiny ship detection aims at separating tiny ships from
the images captured by earth orbiting satellites. Due to the extremely large
image coverage area (e.g., thousands square kilometers), candidate targets in
these images are much smaller, dimer, more changeable than those targets
observed by aerial-based and land-based imaging devices. Existing short imaging
distance-based infrared datasets and target detection methods cannot be well
adopted to the space-based surveillance task. To address these problems, we
develop a space-based infrared tiny ship detection dataset (namely,
NUDT-SIRST-Sea) with 48 space-based infrared images and 17598 pixel-level tiny
ship annotations. Each image covers about 10000 square kilometers of area with
10000X10000 pixels. Considering the extreme characteristics (e.g., small, dim,
changeable) of those tiny ships in such challenging scenes, we propose a
multi-level TransUNet (MTU-Net) in this paper. Specifically, we design a Vision
Transformer (ViT) Convolutional Neural Network (CNN) hybrid encoder to extract
multi-level features. Local feature maps are first extracted by several
convolution layers and then fed into the multi-level feature extraction module
(MVTM) to capture long-distance dependency. We further propose a
copy-rotate-resize-paste (CRRP) data augmentation approach to accelerate the
training phase, which effectively alleviates the issue of sample imbalance
between targets and background. Besides, we design a FocalIoU loss to achieve
both target localization and shape description. Experimental results on the
NUDT-SIRST-Sea dataset show that our MTU-Net outperforms traditional and
existing deep learning based SIRST methods in terms of probability of
detection, false alarm rate and intersection over union.
- Abstract(参考訳): 地球を周回する衛星が捉えた画像から小さな船を分離することを目的としている。
非常に大きな画像カバレッジ領域(例えば数千平方キロメートル)のため、これらの画像の候補ターゲットは、空中および地上の撮像装置で観測されるターゲットよりもはるかに小さく、小さく、変更しやすい。
既存の近距離画像に基づく赤外線データとターゲット検出法は、空間ベースの監視タスクにうまく適用できない。
この問題に対処するため,我々は,48枚の宇宙ベース赤外線画像と17598ピクセルレベルの小型船舶アノテーションを備えた,宇宙ベースの赤外線小型船舶検出データセット(nudt-sirst-sea)を開発した。
各画像の面積は約10000平方キロメートルで、10000X10000ピクセルである。
そこで本稿では,これらの小型船舶の極端な特性(小型,薄型,変更可能な)を考慮し,マルチレベルトランスフォーント(mtu-net)を提案する。
具体的には,ビジョントランスフォーマー (ViT) と畳み込みニューラルネットワーク (CNN) のハイブリッドエンコーダを設計し,マルチレベルの特徴を抽出する。
ローカルな特徴マップは、まず複数の畳み込み層によって抽出され、その後、多レベル特徴抽出モジュール(MVTM)に入力され、長距離依存性をキャプチャする。
さらに, 目標と背景のサンプル不均衡の問題を効果的に解消するために, 学習段階を加速するためのコピー・ローテーション・リサイズ・ペースト(crrp)データ拡張手法を提案する。
さらに,FocalIoU損失を設計し,目標位置と形状記述の両方を実現する。
NUDT-SIRST-Seaデータセットによる実験結果から,MTU-Netは従来の深層学習に基づくSIRST法よりも検出率,誤警報率,結合上の交叉率の点で優れていた。
関連論文リスト
- IRSAM: Advancing Segment Anything Model for Infrared Small Target Detection [55.554484379021524]
Infrared Small Target Detection (IRSTD) タスクは、自然画像と赤外線画像の間に顕著な領域ギャップがあるため、満足度の高い性能を達成するには不十分である。
IRSTDのためのIRSAMモデルを提案する。これはSAMのエンコーダデコーダアーキテクチャを改善し、赤外線小物体の特徴表現をより良く学習する。
論文 参考訳(メタデータ) (2024-07-10T10:17:57Z) - Multimodal Transformer Using Cross-Channel attention for Object Detection in Remote Sensing Images [1.662438436885552]
マルチモーダル融合は、複数のモーダルからのデータを融合することで精度を高めることが決定されている。
早期に異なるチャネル間の関係をマッピングするための新しいマルチモーダル融合戦略を提案する。
本手法は,中期・後期の手法とは対照的に,早期の融合に対処することにより,既存の手法と比較して,競争力や性能に優れる。
論文 参考訳(メタデータ) (2023-10-21T00:56:11Z) - Fast Fourier Convolution Based Remote Sensor Image Object Detection for
Earth Observation [0.0]
リモートセンシングオブジェクト検出のための周波数対応特徴ピラミッドフレームワーク(FFPF)を提案する。
F-ResNetは、周波数領域の畳み込みをバックボーンの各ステージに差し込み、スペクトルコンテキスト情報を知覚するために提案される。
BSFPNは、双方向サンプリング戦略とスキップ接続を用いて、異なるスケールの物体の特徴の関連をより良くモデル化するように設計されている。
論文 参考訳(メタデータ) (2022-09-01T15:50:58Z) - Beyond Cross-view Image Retrieval: Highly Accurate Vehicle Localization
Using Satellite Image [91.29546868637911]
本稿では,地上画像と架空衛星地図とをマッチングすることにより,車載カメラのローカライゼーションの問題に対処する。
鍵となる考え方は、タスクをポーズ推定として定式化し、ニューラルネットベースの最適化によってそれを解くことである。
標準自動運転車のローカライゼーションデータセットの実験により,提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2022-04-10T19:16:58Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - FOVEA: Foveated Image Magnification for Autonomous Navigation [53.69803081925454]
入力キャンバスを小さく保ちながら、ある領域を弾性的に拡大する注意的アプローチを提案する。
提案手法は,高速R-CNNより高速かつ微調整の少ない検出APを高速化する。
Argoverse-HD と BDD100K の自律走行データセットでは,提案手法が標準の高速 R-CNN を超越した検出APを微調整なしで促進することを示す。
論文 参考訳(メタデータ) (2021-08-27T03:07:55Z) - Locality-Aware Rotated Ship Detection in High-Resolution Remote Sensing
Imagery Based on Multi-Scale Convolutional Network [7.984128966509492]
マルチスケール畳み込みニューラルネットワーク(CNN)に基づく局所性認識型回転船検出(LARSD)フレームワークを提案する。
提案フレームワークはUNetのようなマルチスケールCNNを用いて高解像度の情報を持つマルチスケール特徴マップを生成する。
検出データセットを拡大するために、新しい高解像度船舶検出(HRSD)データセットを構築し、2499の画像と9269のインスタンスを異なる解像度でGoogle Earthから収集した。
論文 参考訳(メタデータ) (2020-07-24T03:01:42Z) - Drone-based RGB-Infrared Cross-Modality Vehicle Detection via
Uncertainty-Aware Learning [59.19469551774703]
ドローンによる車両検出は、空中画像中の車両の位置とカテゴリーを見つけることを目的としている。
我々はDroneVehicleと呼ばれる大規模ドローンベースのRGB赤外線車両検出データセットを構築した。
私たちのDroneVehicleは28,439RGBの赤外線画像を収集し、都市道路、住宅地、駐車場、その他のシナリオを昼から夜までカバーしています。
論文 参考訳(メタデータ) (2020-03-05T05:29:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。