論文の概要: Concealed Object Detection for Passive Millimeter-Wave Security Imaging
Based on Task-Aligned Detection Transformer
- arxiv url: http://arxiv.org/abs/2212.00313v2
- Date: Fri, 7 Jul 2023 11:34:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-10 15:54:47.621973
- Title: Concealed Object Detection for Passive Millimeter-Wave Security Imaging
Based on Task-Aligned Detection Transformer
- Title(参考訳): タスクアライン検出変換器を用いたパッシブミリ波画像の物体検出
- Authors: Cheng Guo, Fei Hu, and Yan Hu
- Abstract要約: 本稿では,PMMW-DETRと呼ばれるタスク適応型検出変換器ネットワークを提案する。
最初の段階では、DCFT(Denoising Coarse-to-Fine Transformer)バックボーンは、異なるスケールで長短の特徴を抽出するように設計されている。
第2段階では、先行知識として学習された空間的特徴をネットワークに導入するためのクエリ選択モジュールを提案する。
第3段階では、分類性能の向上を目的として、分類タスクと回帰タスクを分離するタスクアラインなデュアルヘッドブロックを実行する。
- 参考スコア(独自算出の注目度): 6.524763502003648
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Passive millimeter-wave (PMMW) is a significant potential technique for human
security screening. Several popular object detection networks have been used
for PMMW images. However, restricted by the low resolution and high noise of
PMMW images, PMMW hidden object detection based on deep learning usually
suffers from low accuracy and low classification confidence. To tackle the
above problems, this paper proposes a Task-Aligned Detection Transformer
network, named PMMW-DETR. In the first stage, a Denoising Coarse-to-Fine
Transformer (DCFT) backbone is designed to extract long- and short-range
features in the different scales. In the second stage, we propose the Query
Selection module to introduce learned spatial features into the network as
prior knowledge, which enhances the semantic perception capability of the
network. In the third stage, aiming to improve the classification performance,
we perform a Task-Aligned Dual-Head block to decouple the classification and
regression tasks. Based on our self-developed PMMW security screening dataset,
experimental results including comparison with State-Of-The-Art (SOTA) methods
and ablation study demonstrate that the PMMW-DETR obtains higher accuracy and
classification confidence than previous works, and exhibits robustness to the
PMMW images of low quality.
- Abstract(参考訳): パッシブミリ波(PMMW)は、人間のセキュリティスクリーニングにおいて重要な技術である。
PMMW画像にはいくつかの一般的な物体検出ネットワークが使われている。
しかし,PMMW画像の低分解能化や高ノイズ化により,深層学習に基づくPMMW隠れ物体検出は通常,低精度・低分類信頼性に悩まされる。
そこで本稿では,pmmw-detrと呼ばれるタスクアライメント検出トランスフォーマーネットワークを提案する。
最初の段階では、DCFT(Denoising Coarse-to-Fine Transformer)バックボーンは、異なるスケールで長短の特徴を抽出するように設計されている。
第2段階では,学習した空間的特徴を事前知識としてネットワークに導入し,ネットワークの意味知覚能力を高めるクエリ選択モジュールを提案する。
第3段階では,分類性能の向上を目的としたタスクアライメント型デュアルヘッドブロックを実施し,分類と回帰タスクを分離する。
自己開発PMMWセキュリティスクリーニングデータセットに基づいて, PMMW-DETRが従来よりも精度が高く, 分類信頼性が高く, 低品質のPMMW画像に対して堅牢性を示すことを示す。
関連論文リスト
- Looking for Tiny Defects via Forward-Backward Feature Transfer [12.442574943138794]
そこで本研究では,従来の高解像度画像と地中トラスマスクの手法を評価する新しいベンチマークを提案する。
私たちのベンチマークには、欠陥サイズに関する堅牢性をキャプチャするメトリクスが含まれています。
提案手法は,欠陥サイズに対する高いロバスト性,高速動作,最先端セグメンテーション性能を特徴とする。
論文 参考訳(メタデータ) (2024-07-04T17:59:26Z) - MoE-FFD: Mixture of Experts for Generalized and Parameter-Efficient Face Forgery Detection [54.545054873239295]
ディープフェイクは、最近、国民の間で重大な信頼問題とセキュリティ上の懸念を提起した。
ViT法はトランスの表現性を生かし,優れた検出性能を実現する。
この研究は、汎用的でパラメータ効率のよいViTベースのアプローチであるFace Forgery Detection (MoE-FFD)のためのMixture-of-Expertsモジュールを導入する。
論文 参考訳(メタデータ) (2024-04-12T13:02:08Z) - The Blind Normalized Stein Variational Gradient Descent-Based Detection for Intelligent Massive Random Access [0.7655800373514546]
本稿では,MLEモデルに基づく早期プリアンブル検出手法を提案する。
MLEモデルに対する近似解を得るために,新しい盲点正規化スタイン変分勾配勾配検出器(SVGD)を提案する。
提案したブロックMHT層は、コストと性能の劣化の観点から、他の変換方式よりも優れている。
論文 参考訳(メタデータ) (2024-03-08T04:08:40Z) - Multidomain transformer-based deep learning for early detection of
network intrusion [15.99260480348544]
ネットワーク侵入検知システム(NIDS)のタイムリー応答は、フロー生成プロセスによって制限される。
提案する特徴抽出器であるTime Series Network Flow Meter (TS-NFM) は,ネットワークフローを説明可能な特徴を持つMSSとして表現する。
周波数領域をTransformerに組み込んだMulti-Domain Transformer(MDT)と呼ばれる,ディープラーニングに基づく新しい早期検出モデルを提案する。
論文 参考訳(メタデータ) (2023-09-03T04:18:08Z) - Towards Large-scale Single-shot Millimeter-wave Imaging for Low-cost
Security Inspection [4.970957539542638]
安全検査のための有望な技術としてミリ波イメージング(MMW)が登場している。
近年の進歩にもかかわらず、要求される大規模アンテナアレイの高コストは、MMWイメージングの実用化を妨げている。
スパースアンテナアレイを用いた大規模単発MMWイメージングフレームワークについて報告する。
論文 参考訳(メタデータ) (2023-05-25T06:00:29Z) - Photovoltaic Panel Defect Detection Based on Ghost Convolution with
BottleneckCSP and Tiny Target Prediction Head Incorporating YOLOv5 [5.632384612137748]
本稿では,Ghost convolution with BottleneckCSPとPVパネル欠陥検出のための小さなターゲット予測ヘッドを提案する。
BottleneckCSPモジュールは、小さなターゲット検出のための予測ヘッドを追加して、小さな欠陥ミスを軽減するために導入された。
提案するPVパネル表面欠陥検出ネットワークは、mAPの性能を少なくとも27.8%向上させる。
論文 参考訳(メタデータ) (2023-03-02T01:06:35Z) - Active Gaze Control for Foveal Scene Exploration [124.11737060344052]
本研究では,葉型カメラを用いた人間とロボットが現場を探索する方法をエミュレートする手法を提案する。
提案手法は,同数の視線シフトに対してF1スコアを2~3ポイント増加させる。
論文 参考訳(メタデータ) (2022-08-24T14:59:28Z) - Efficient Decoder-free Object Detection with Transformers [75.00499377197475]
視覚変換器(ViT)は、物体検出アプローチのランドスケープを変化させている。
本稿では,デコーダフリー完全トランス(DFFT)オブジェクト検出器を提案する。
DFFT_SMALLは、トレーニングおよび推論段階で高い効率を達成する。
論文 参考訳(メタデータ) (2022-06-14T13:22:19Z) - Integral Migrating Pre-trained Transformer Encoder-decoders for Visual
Object Detection [78.2325219839805]
imTEDは、数発のオブジェクト検出の最先端を最大7.6%改善する。
MS COCOデータセットの実験は、imTEDが一貫してそのデータセットを2.8%上回っていることを示している。
論文 参考訳(メタデータ) (2022-05-19T15:11:20Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。