論文の概要: Multi-Class 3D Object Detection Within Volumetric 3D Computed Tomography
Baggage Security Screening Imagery
- arxiv url: http://arxiv.org/abs/2008.01218v1
- Date: Mon, 3 Aug 2020 21:54:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 06:13:52.181329
- Title: Multi-Class 3D Object Detection Within Volumetric 3D Computed Tomography
Baggage Security Screening Imagery
- Title(参考訳): 容積3次元ct手荷物検診画像におけるマルチクラス3次元物体検出
- Authors: Qian Wang, Neelanjan Bhowmik, Toby P. Breckon
- Abstract要約: 我々は、一つの統合されたフレームワークを用いて、複数の対象カテゴリの関心事を検出することを検討する。
3D RetinaNetと一連の好ましい戦略を組み合わせることで、5つのオブジェクトクラスの平均平均精度(mAP)は65.3%に達する。
- 参考スコア(独自算出の注目度): 19.62794187456967
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic detection of prohibited objects within passenger baggage is
important for aviation security. X-ray Computed Tomography (CT) based 3D
imaging is widely used in airports for aviation security screening whilst prior
work on automatic prohibited item detection focus primarily on 2D X-ray
imagery. These works have proven the possibility of extending deep
convolutional neural networks (CNN) based automatic prohibited item detection
from 2D X-ray imagery to volumetric 3D CT baggage security screening imagery.
However, previous work on 3D object detection in baggage security screening
imagery focused on the detection of one specific type of objects (e.g., either
{\it bottles} or {\it handguns}). As a result, multiple models are needed if
more than one type of prohibited item is required to be detected in practice.
In this paper, we consider the detection of multiple object categories of
interest using one unified framework. To this end, we formulate a more
challenging multi-class 3D object detection problem within 3D CT imagery and
propose a viable solution (3D RetinaNet) to tackle this problem. To enhance the
performance of detection we investigate a variety of strategies including data
augmentation and varying backbone networks. Experimentation carried out to
provide both quantitative and qualitative evaluations of the proposed approach
to multi-class 3D object detection within 3D CT baggage security screening
imagery. Experimental results demonstrate the combination of the 3D RetinaNet
and a series of favorable strategies can achieve a mean Average Precision (mAP)
of 65.3\% over five object classes (i.e. {\it bottles, handguns, binoculars,
glock frames, iPods}). The overall performance is affected by the poor
performance on {\it glock frames} and {\it iPods} due to the lack of data and
their resemblance with the baggage clutter.
- Abstract(参考訳): 旅客荷物内の禁止対象の自動検出は航空安全にとって重要である。
x線ct(x-ray ct)ベースの3dイメージングは空港の航空防犯スクリーニングに広く使われているが、自動禁止アイテム検出は2dx線画像が中心である。
これらの研究により、深層畳み込みニューラルネットワーク(cnn)による2次元x線画像から体積3次元ct手荷物検診画像への自動禁止項目検出の可能性が証明された。
しかし、以前のバッグセキュリティスクリーニング画像における3Dオブジェクト検出の研究は、特定の種類の物体(例えば、ボトルや拳銃など)の検出に焦点を当てていた。
その結果,複数種類の禁止項目を実際に検出する必要がある場合,複数のモデルが必要となる。
本稿では,一つの統一フレームワークを用いて,関心対象の複数のカテゴリの検出について検討する。
この目的のために,3次元CT画像内により困難な3次元物体検出問題を定式化し,この問題に対処するための実現可能なソリューション(3D RetinaNet)を提案する。
検出性能を向上させるため,データ拡張やバックボーンネットワークの変更など,様々な戦略を検討する。
提案手法を定量的・定性的に評価するために, 3次元ct手荷物検診画像におけるマルチクラス3次元物体検出実験を行った。
実験の結果、3d retinanetと一連の好ましい戦略の組み合わせは、5つのオブジェクトクラス(つまり、ボトル、拳銃、双眼鏡、グロックフレーム、ipod)の平均平均精度(map)を65.3\%達成できることが示されている。
全体的なパフォーマンスは、データ不足とバッグクラッタとの類似性により、 {\it glock frame} と {\it iPods} の低パフォーマンスの影響を受けている。
関連論文リスト
- Sparse Points to Dense Clouds: Enhancing 3D Detection with Limited LiDAR Data [68.18735997052265]
単分子と点雲に基づく3次元検出の利点を組み合わせたバランスの取れたアプローチを提案する。
本手法では,低コストで低解像度のセンサから得られる3Dポイントを少数必要としている。
3次元検出の精度は最先端の単分子検出法と比較して20%向上する。
論文 参考訳(メタデータ) (2024-04-10T03:54:53Z) - Joint object detection and re-identification for 3D obstacle
multi-camera systems [47.87501281561605]
本研究は,カメラとライダー情報を用いた物体検出ネットワークに新たな改良を加えたものである。
同じ車両内の隣のカメラにまたがって物体を再識別する作業のために、追加のブランチが組み込まれている。
その結果,従来の非最大抑圧(NMS)技術よりも,この手法が優れていることが示された。
論文 参考訳(メタデータ) (2023-10-09T15:16:35Z) - AdvMono3D: Advanced Monocular 3D Object Detection with Depth-Aware
Robust Adversarial Training [64.14759275211115]
そこで本研究では,DART3Dと呼ばれるモノクル3次元物体検出のための,深度対応の頑健な対向学習法を提案する。
我々の敵の訓練アプローチは、本質的な不確実性に乗じて、敵の攻撃に対する堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2023-09-03T07:05:32Z) - A Comprehensive Study of the Robustness for LiDAR-based 3D Object
Detectors against Adversarial Attacks [84.10546708708554]
3Dオブジェクト検出器は、セキュリティクリティカルなタスクにおいてますます重要になっている。
敵の攻撃に対する強固さを理解することが不可欠である。
本稿では,LiDARをベースとした3次元検出器の対角攻撃時のロバスト性評価と解析を行った。
論文 参考訳(メタデータ) (2022-12-20T13:09:58Z) - CMR3D: Contextualized Multi-Stage Refinement for 3D Object Detection [57.44434974289945]
本稿では,3次元オブジェクト検出(CMR3D)フレームワークのためのコンテキスト型マルチステージリファインメントを提案する。
我々のフレームワークは3Dシーンを入力として取り、シーンの有用なコンテキスト情報を明示的に統合しようと試みている。
3Dオブジェクトの検出に加えて,3Dオブジェクトカウント問題に対するフレームワークの有効性について検討する。
論文 参考訳(メタデータ) (2022-09-13T05:26:09Z) - Contraband Materials Detection Within Volumetric 3D Computed Tomography
Baggage Security Screening Imagery [29.253322915780362]
材料シグネチャに基づく3次元コントラバンド物質検出にDeep Neural Networksを適用することを提案する。
まず,3D U-Netなどの3D CNNに基づくセマンティックセマンティックセグメンテーションアルゴリズムとその変種について検討する。
体積3次元CTデータの元の密度密度表現形式とは対照的に,CTボリュームをスパース点雲に変換することを提案する。
論文 参考訳(メタデータ) (2020-12-21T23:48:06Z) - Single-Shot 3D Detection of Vehicles from Monocular RGB Images via
Geometry Constrained Keypoints in Real-Time [6.82446891805815]
単眼RGB画像における車両検出のための新しい3次元単発物体検出法を提案する。
提案手法は,3次元空間への2次元検出を付加回帰および分類パラメータの予測により引き上げる。
KITTI 3D Object Detection と新しい nuScenes Object Detection ベンチマークを用いて,自律走行のための異なるデータセットに対するアプローチを検証し,その評価を行った。
論文 参考訳(メタデータ) (2020-06-23T15:10:19Z) - On the Evaluation of Prohibited Item Classification and Detection in
Volumetric 3D Computed Tomography Baggage Security Screening Imagery [19.62794187456967]
我々は,2次元X線画像からボリューム3次元CTバッグセキュリティスクリーニング画像への自動禁止項目検出の可能性を評価する。
我々は3D Convolutional Neural Neworks(CNN)とRetinaNetやFaster R-CNNといった一般的なオブジェクト検出フレームワークを活用しています。
論文 参考訳(メタデータ) (2020-03-27T20:17:58Z) - BirdNet+: End-to-End 3D Object Detection in LiDAR Bird's Eye View [117.44028458220427]
自動運転車のオンボード3Dオブジェクト検出は、LiDARデバイスが捉えた幾何学情報に依存することが多い。
本稿では,BEV画像のみから指向性3Dボックスを推測可能な,エンドツーエンドの3Dオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-09T15:08:40Z) - SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint
Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。
SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。
構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文 参考訳(メタデータ) (2020-02-24T08:15:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。