論文の概要: A Multi-task Framework for Infrared Small Target Detection and
Segmentation
- arxiv url: http://arxiv.org/abs/2206.06923v1
- Date: Tue, 14 Jun 2022 15:43:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-15 15:03:58.277746
- Title: A Multi-task Framework for Infrared Small Target Detection and
Segmentation
- Title(参考訳): 赤外線小ターゲット検出・セグメンテーションのためのマルチタスクフレームワーク
- Authors: Yuhang Chen, Liyuan Li, Xin Liu, Xiaofeng Su, and Fansheng Chen
- Abstract要約: 赤外線小ターゲット検出とセグメンテーションのための新しいエンドツーエンドフレームワークを提案する。
UNetをバックボーンとして、解像度とセマンティック情報を維持するために使用しています。
我々は、赤外線小ターゲット検出とセグメンテーションのためのマルチタスクフレームワークを開発した。
- 参考スコア(独自算出の注目度): 9.033048310220346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the complicated background and noise of infrared images, infrared
small target detection is one of the most difficult problems in the field of
computer vision. In most existing studies, semantic segmentation methods are
typically used to achieve better results. The centroid of each target is
calculated from the segmentation map as the detection result. In contrast, we
propose a novel end-to-end framework for infrared small target detection and
segmentation in this paper. First, with the use of UNet as the backbone to
maintain resolution and semantic information, our model can achieve a higher
detection accuracy than other state-of-the-art methods by attaching a simple
anchor-free head. Then, a pyramid pool module is used to further extract
features and improve the precision of target segmentation. Next, we use
semantic segmentation tasks that pay more attention to pixel-level features to
assist in the training process of object detection, which increases the average
precision and allows the model to detect some targets that were previously not
detectable. Furthermore, we develop a multi-task framework for infrared small
target detection and segmentation. Our multi-task learning model reduces
complexity by nearly half and speeds up inference by nearly twice compared to
the composite single-task model, while maintaining accuracy. The code and
models are publicly available at https://github.com/Chenastron/MTUNet.
- Abstract(参考訳): 赤外線画像の背景やノイズが複雑であるため、赤外線の小さなターゲット検出はコンピュータビジョンの分野で最も難しい問題の1つである。
既存のほとんどの研究において、セマンティックセグメンテーション法は一般的により良い結果を得るために使われる。
各目標のセントロイドは、検出結果としてセグメンテーションマップから算出される。
対照的に,本論文では,赤外線小ターゲット検出とセグメンテーションのための新しいエンドツーエンドフレームワークを提案する。
まず、UNetをバックボーンとして、解像度とセマンティック情報を維持することで、単純なアンカーフリーヘッドをアタッチすることで、他の最先端手法よりも高い検出精度を実現できる。
次に、ピラミッドプールモジュールを使用して、さらに特徴を抽出し、ターゲットセグメンテーションの精度を向上させる。
次に,ピクセルレベルの特徴により多くの注意を払うセマンティックセグメンテーションタスクを使用して,オブジェクト検出のトレーニングプロセスを支援する。
さらに,赤外線小目標検出とセグメンテーションのためのマルチタスクフレームワークを開発した。
マルチタスク学習モデルは、複雑性をほぼ半分に削減し、精度を維持しつつ、複合的なシングルタスクモデルと比較して推論をほぼ2倍高速化します。
コードとモデルはhttps://github.com/Chenastron/MTUNet.comで公開されている。
関連論文リスト
- Infrared Small Target Detection based on Adjustable Sensitivity Strategy and Multi-Scale Fusion [2.661766509317245]
調整可能な感度(AS)戦略とマルチスケール融合に基づく改良された赤外線小ターゲット検出手法を提案する。
具体的には、マルチスケール方向対応ネットワーク(MSDA-Net)に基づくマルチスケールモデル融合フレームワークを構築する。
このスキームは、PRCV 2024ワイドエリア赤外線小目標検出競技で優勝した。
論文 参考訳(メタデータ) (2024-07-29T15:22:02Z) - Single-Shot and Multi-Shot Feature Learning for Multi-Object Tracking [55.13878429987136]
そこで本研究では,異なる目標に対して,単発と複数発の特徴を共同で学習するための,シンプルで効果的な2段階特徴学習パラダイムを提案する。
提案手法は,DanceTrackデータセットの最先端性能を達成しつつ,MOT17およびMOT20データセットの大幅な改善を実現している。
論文 参考訳(メタデータ) (2023-11-17T08:17:49Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文 参考訳(メタデータ) (2021-08-18T09:25:39Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z) - TBC-Net: A real-time detector for infrared small target detection using
semantic constraint [18.24737906712967]
深層学習は、小さな目標特徴の学習が困難であるため、赤外線小目標検出にはほとんど使われない。
赤外線小ターゲット検出のための新しい軽量畳み込みニューラルネットワークTBC-Netを提案する。
論文 参考訳(メタデータ) (2019-12-27T05:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。