論文の概要: Over-sampling De-occlusion Attention Network for Prohibited Items
Detection in Noisy X-ray Images
- arxiv url: http://arxiv.org/abs/2103.00809v1
- Date: Mon, 1 Mar 2021 07:17:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 16:38:34.987695
- Title: Over-sampling De-occlusion Attention Network for Prohibited Items
Detection in Noisy X-ray Images
- Title(参考訳): ノイズX線画像における禁止項目検出のための過剰サンプリング脱閉塞注意ネットワーク
- Authors: Renshuai Tao, Yanlu Wei, Hainan Li, Aishan Liu, Yifu Ding, Haotong Qin
and Xianglong Liu
- Abstract要約: セキュリティ検査は、スーツケースの個人持ち物のX線スキャンです。
一般的な画像認識データセットを通じてトレーニングされた従来のCNNベースのモデルは、このシナリオで十分なパフォーマンスを達成できない。
新規な脱閉塞注意モジュールと新しいオーバーサンプリングトレーニング戦略からなるオーバーサンプリング脱閉塞注意ネットワーク(DOAM-O)を提案する。
- 参考スコア(独自算出の注目度): 35.35752470993847
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Security inspection is X-ray scanning for personal belongings in suitcases,
which is significantly important for the public security but highly
time-consuming for human inspectors. Fortunately, deep learning has greatly
promoted the development of computer vision, offering a possible way of
automatic security inspection. However, items within a luggage are randomly
overlapped resulting in noisy X-ray images with heavy occlusions. Thus,
traditional CNN-based models trained through common image recognition datasets
fail to achieve satisfactory performance in this scenario. To address these
problems, we contribute the first high-quality prohibited X-ray object
detection dataset named OPIXray, which contains 8885 X-ray images from 5
categories of the widely-occurred prohibited item ``cutters''. The images are
gathered from an airport and these prohibited items are annotated manually by
professional inspectors, which can be used as a benchmark for model training
and further facilitate future research. To better improve occluded X-ray object
detection, we further propose an over-sampling de-occlusion attention network
(DOAM-O), which consists of a novel de-occlusion attention module and a new
over-sampling training strategy. Specifically, our de-occlusion module, namely
DOAM, simultaneously leverages the different appearance information of the
prohibited items; the over-sampling training strategy forces the model to put
more emphasis on these hard samples consisting these items of high occlusion
levels, which is more suitable for this scenario. We comprehensively evaluated
DOAM-O on the OPIXray dataset, which proves that our model can stably improve
the performance of the famous detection models such as SSD, YOLOv3, and FCOS,
and outperform many extensively-used attention mechanisms.
- Abstract(参考訳): セキュリティ検査は、スーツケース内の個人の持ち物に対するx線スキャンであり、公衆の安全には極めて重要であるが、人間の検査官には非常に時間がかかる。
幸いなことに、ディープラーニングはコンピュータビジョンの開発を大幅に促進し、自動セキュリティ検査の可能性を提供します。
しかし、荷物内のアイテムがランダムに重なり、ノイズの多いX線画像と大きな閉塞が発生します。
したがって、一般的な画像認識データセットを通じて訓練された従来のCNNベースのモデルは、このシナリオで満足のいくパフォーマンスを達成できません。
これらの問題に対処するため, OPIXray という, 広範に普及している禁止項目 ``cutters'' の5カテゴリから8885個のX線画像を含む, 初の高品質な禁止対象検出データセットを寄贈した。
空港から集めた画像は、プロの検査員が手作業で注釈を付け、モデルトレーニングのベンチマークとして使用し、今後の研究を促進します。
また、入射X線物体検出を改善するため、新たな脱入注意モジュールと新しいオーバーサンプリングトレーニング戦略からなるオーバーサンプリング脱閉塞注意ネットワーク(DOAM-O)も提案しています。
具体的には,禁断モジュールであるdoamが禁止項目の異なる外観情報を同時に活用し,過度にサンプリングされたトレーニング戦略により,このシナリオに適合する高い咬合レベルの項目からなるこれらのハードサンプルに重きを置くことを余儀なくされた。
我々はOPIXrayデータセット上でDOAM-Oを総合的に評価し,SSD,YOLOv3,FCOSなどの有名な検出モデルの性能を安定的に向上できることを示す。
関連論文リスト
- Visual inspection for illicit items in X-ray images using Deep Learning [7.350725076596881]
X線画像におけるコントラバンドアイテムの自動検出は、公共の安全を著しく向上させる。
ディープニューラルネットワーク(DNN)に依存する現代のコンピュータビジョンアルゴリズムは、このタスクを遂行できることを証明している。
論文 参考訳(メタデータ) (2023-10-05T16:35:27Z) - Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images
with Free Attention Masks [64.67735676127208]
テキストと画像の拡散モデルは、画像認識の恩恵を受ける大きな可能性を示している。
有望ではあるが、拡散生成画像の教師なし学習に特化した調査は不十分である。
上記フリーアテンションマスクをフル活用することで、カスタマイズされたソリューションを導入する。
論文 参考訳(メタデータ) (2023-08-13T10:07:46Z) - X-Adv: Physical Adversarial Object Attacks against X-ray Prohibited Item
Detection [113.10386151761682]
テクスチャフリーなX線画像を対象とした敵攻撃は未発見である。
本稿では,X線禁止項目検出を目的とした敵攻撃の研究に向けて第一歩を踏み出す。
我々は,X線検出器を消毒できる対向剤として機能する物理的に印刷可能な金属を生成するために,X-Advを提案する。
論文 参考訳(メタデータ) (2023-02-19T06:31:17Z) - Temporal Fusion Based Mutli-scale Semantic Segmentation for Detecting
Concealed Baggage Threats [12.895636885728852]
時間的手荷物X線画像を利用して、隠蔽されたオブジェクトを効果的にスクリーニングするフレームワークは存在しない。
本稿では, 連続したスキャンを入力として行う, 時間融合駆動型マルチスケール残留型エンコーダデコーダを提案する。
提案するフレームワークは,GDXrayデータセット上で,さまざまなメトリクスで競合する。
論文 参考訳(メタデータ) (2021-11-04T06:19:52Z) - Towards Real-world X-ray Security Inspection: A High-Quality Benchmark
and Lateral Inhibition Module for Prohibited Items Detection [37.66855218659698]
まず,8つのカテゴリの102,928個の共通禁止項目を含む,高品質なX線(HiXray)セキュリティ検査画像データセットを提案する。
正確な禁止項目検出のために,不適切な情報を無視することで,人間がこれらの項目を認識するという事実に触発された横方向抑制モジュール(LIM)を提案する。
論文 参考訳(メタデータ) (2021-08-23T03:59:23Z) - Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark [53.9819155669618]
本稿では,PIDrayと命名された大規模データセットについて述べる。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
論文 参考訳(メタデータ) (2021-08-16T11:14:16Z) - Beyond the Spectrum: Detecting Deepfakes via Re-Synthesis [69.09526348527203]
ディープフェイク(Deepfakes)として知られる非常に現実的なメディアは、現実の目から人間の目まで区別できない。
本研究では,テスト画像を再合成し,検出のための視覚的手がかりを抽出する,新しい偽検出手法を提案する。
種々の検出シナリオにおいて,提案手法の摂動に対する有効性の向上,GANの一般化,堅牢性を示す。
論文 参考訳(メタデータ) (2021-05-29T21:22:24Z) - Occluded Prohibited Items Detection: an X-ray Security Inspection
Benchmark and De-occlusion Attention Module [50.75589128518707]
我々はOPIXrayというセキュリティ検査のための最初の高品質なオブジェクト検出データセットをコントリビュートする。
OPIXrayは、空港のプロの検査官が手動で注記した「カッター」に焦点をあてた。
本稿では,プラグイン・アンド・プレイモジュールであるデオクルージョン・アテンション・モジュール(DOAM)を提案する。
論文 参考訳(メタデータ) (2020-04-18T16:10:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。