論文の概要: Operationalizing Convolutional Neural Network Architectures for
Prohibited Object Detection in X-Ray Imagery
- arxiv url: http://arxiv.org/abs/2110.04906v1
- Date: Sun, 10 Oct 2021 21:20:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 15:18:58.595618
- Title: Operationalizing Convolutional Neural Network Architectures for
Prohibited Object Detection in X-Ray Imagery
- Title(参考訳): X線画像における物体検出のための畳み込みニューラルネットワークアーキテクチャの運用
- Authors: Thomas W. Webb, Neelanjan Bhowmik, Yona Falinie A. Gaus, Toby P.
Breckon
- Abstract要約: 本稿では,近年の2つのエンドツーエンドオブジェクト検出CNNアーキテクチャ,Cascade R-CNNとFreeAnchorの実現可能性について検討する。
パラメータが少なく訓練時間も少ないため、FreeAnchorは13 fps (3.9 ms)の最大検出速度を達成している。
CNNモデルは、損失のある圧縮に対してかなりのレジリエンスを示し、JPEG圧縮レベル50においてmAPの1.1%しか減少しない。
- 参考スコア(独自算出の注目度): 15.694880385913534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent advancement in deep Convolutional Neural Network (CNN) has brought
insight into the automation of X-ray security screening for aviation security
and beyond. Here, we explore the viability of two recent end-to-end object
detection CNN architectures, Cascade R-CNN and FreeAnchor, for prohibited item
detection by balancing processing time and the impact of image data compression
from an operational viewpoint. Overall, we achieve maximal detection
performance using a FreeAnchor architecture with a ResNet50 backbone, obtaining
mean Average Precision (mAP) of 87.7 and 85.8 for using the OPIXray and SIXray
benchmark datasets, showing superior performance over prior work on both. With
fewer parameters and less training time, FreeAnchor achieves the highest
detection inference speed of ~13 fps (3.9 ms per image). Furthermore, we
evaluate the impact of lossy image compression upon detector performance. The
CNN models display substantial resilience to the lossy compression, resulting
in only a 1.1% decrease in mAP at the JPEG compression level of 50.
Additionally, a thorough evaluation of data augmentation techniques is
provided, including adaptions of MixUp and CutMix strategy as well as other
standard transformations, further improving the detection accuracy.
- Abstract(参考訳): 深層畳み込みニューラルネットワーク(cnn)の最近の進歩は、航空安全のためのx線セキュリティスクリーニングの自動化に関する洞察をもたらした。
本稿では,最近の2つのエンドツーエンドオブジェクト検出CNNアーキテクチャであるCascade R-CNNとFreeAnchorの実現可能性について検討する。
全体としては、resnet50バックボーンを持つfreeanchorアーキテクチャを用いて最大検出性能を達成し、opixrayおよびsixrayベンチマークデータセットを使用する平均平均精度(マップ)87.7および85.8を取得し、両者の以前の作業よりも優れたパフォーマンスを示す。
パラメータの削減とトレーニング時間の短縮により、freeanchorは13fps(画像あたり3.9ミリ秒)の最大検出速度を達成している。
さらに,画像圧縮の損失が検出器性能に及ぼす影響を評価する。
CNNモデルは、損失のある圧縮に対してかなりのレジリエンスを示し、JPEG圧縮レベル50においてmAPの1.1%しか低下しない。
さらに、ミックスアップおよびカットミックス戦略の適応、その他の標準変換を含むデータ拡張技術の徹底的な評価が行われ、検出精度がさらに向上する。
関連論文リスト
- Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。
これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。
高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文 参考訳(メタデータ) (2023-08-24T12:32:46Z) - Attention-based Feature Compression for CNN Inference Offloading in Edge
Computing [93.67044879636093]
本稿では,デバイスエッジ共振器におけるCNN推論の計算負荷について検討する。
エンドデバイスにおける効率的な特徴抽出のための新しいオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
実験の結果、AECNNは中間データを約4%の精度で256倍圧縮できることがわかった。
論文 参考訳(メタデータ) (2022-11-24T18:10:01Z) - From Environmental Sound Representation to Robustness of 2D CNN Models
Against Adversarial Attacks [82.21746840893658]
本稿では, 各種環境音響表現(スペクトログラム)が, 被害者残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
DWTスペクトログラムでトレーニングしたResNet-18モデルでは高い認識精度が得られたが、このモデルに対する攻撃は敵にとって比較的コストがかかる。
論文 参考訳(メタデータ) (2022-04-14T15:14:08Z) - EResFD: Rediscovery of the Effectiveness of Standard Convolution for
Lightweight Face Detection [13.357235715178584]
顔検出のための軽量バックボーンアーキテクチャとして,標準的な畳み込みブロックの有効性を再検討する。
チャネル切断された標準畳み込み層は精度と推論速度を向上できることを示す。
提案する検出器EResFDは,CPU上でのVGA画像推測に37.7msしか要しないWIDER FACE Hardサブセット上で80.4%のmAPを得た。
論文 参考訳(メタデータ) (2022-04-04T02:30:43Z) - NeighCNN: A CNN based SAR Speckle Reduction using Feature preserving
Loss Function [1.7188280334580193]
NeighCNNは、乗法ノイズを処理するディープラーニングベースのスペックル削減アルゴリズムである。
様々な合成、および実際のSAR画像は、NeighCNNアーキテクチャのテストに使用される。
論文 参考訳(メタデータ) (2021-08-26T04:20:07Z) - Efficient CNN-LSTM based Image Captioning using Neural Network
Compression [0.0]
CNN-LSTMベースの画像キャプションモデルの非従来のエンドツーエンド圧縮パイプラインを紹介します。
次に、異なる圧縮アーキテクチャがモデルに与える影響を検討し、73.1%のモデルサイズ削減を実現する圧縮アーキテクチャを設計する。
論文 参考訳(メタデータ) (2020-12-17T16:25:09Z) - Boosting High-Level Vision with Joint Compression Artifacts Reduction
and Super-Resolution [10.960291115491504]
任意の品質係数で圧縮された低解像度画像から、アーティファクトフリーの高解像度画像を生成する。
文脈認識型CARとSRニューラルネットワーク(CAJNN)は、局所的特徴と非局所的特徴を統合し、CARとSRを1段階で解く。
高品質で高解像度な画像を予測するために、ディープ・リコンストラクション・ネットワークが採用されている。
論文 参考訳(メタデータ) (2020-10-18T04:17:08Z) - On the Impact of Lossy Image and Video Compression on the Performance of
Deep Convolutional Neural Network Architectures [17.349420462716886]
本研究では,画像と映像の圧縮技術がディープラーニングアーキテクチャの性能に与える影響について検討する。
本研究では,人間のポーズ推定,セマンティックセグメンテーション,オブジェクト検出,行動認識,単眼深度推定の5つのタスクにおけるパフォーマンスへの影響について検討する。
その結果,ネットワーク性能と損失圧縮のレベルとの間には,非線形および不均一な関係が認められた。
論文 参考訳(メタデータ) (2020-07-28T15:37:37Z) - Perceptually Optimizing Deep Image Compression [53.705543593594285]
平均二乗誤差(MSE)と$ell_p$ノルムは、ニューラルネットワークの損失の測定で大きく支配されている。
本稿では,定量的知覚モデルに対して,画像解析ネットワークを最適化するための異なるプロキシ手法を提案する。
論文 参考訳(メタデータ) (2020-07-03T14:33:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。