論文の概要: Over-sampling De-occlusion Attention Network for Prohibited Items
Detection in Noisy X-ray Images
- arxiv url: http://arxiv.org/abs/2103.00809v1
- Date: Mon, 1 Mar 2021 07:17:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 16:38:34.987695
- Title: Over-sampling De-occlusion Attention Network for Prohibited Items
Detection in Noisy X-ray Images
- Title(参考訳): ノイズX線画像における禁止項目検出のための過剰サンプリング脱閉塞注意ネットワーク
- Authors: Renshuai Tao, Yanlu Wei, Hainan Li, Aishan Liu, Yifu Ding, Haotong Qin
and Xianglong Liu
- Abstract要約: セキュリティ検査は、スーツケースの個人持ち物のX線スキャンです。
一般的な画像認識データセットを通じてトレーニングされた従来のCNNベースのモデルは、このシナリオで十分なパフォーマンスを達成できない。
新規な脱閉塞注意モジュールと新しいオーバーサンプリングトレーニング戦略からなるオーバーサンプリング脱閉塞注意ネットワーク(DOAM-O)を提案する。
- 参考スコア(独自算出の注目度): 35.35752470993847
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Security inspection is X-ray scanning for personal belongings in suitcases,
which is significantly important for the public security but highly
time-consuming for human inspectors. Fortunately, deep learning has greatly
promoted the development of computer vision, offering a possible way of
automatic security inspection. However, items within a luggage are randomly
overlapped resulting in noisy X-ray images with heavy occlusions. Thus,
traditional CNN-based models trained through common image recognition datasets
fail to achieve satisfactory performance in this scenario. To address these
problems, we contribute the first high-quality prohibited X-ray object
detection dataset named OPIXray, which contains 8885 X-ray images from 5
categories of the widely-occurred prohibited item ``cutters''. The images are
gathered from an airport and these prohibited items are annotated manually by
professional inspectors, which can be used as a benchmark for model training
and further facilitate future research. To better improve occluded X-ray object
detection, we further propose an over-sampling de-occlusion attention network
(DOAM-O), which consists of a novel de-occlusion attention module and a new
over-sampling training strategy. Specifically, our de-occlusion module, namely
DOAM, simultaneously leverages the different appearance information of the
prohibited items; the over-sampling training strategy forces the model to put
more emphasis on these hard samples consisting these items of high occlusion
levels, which is more suitable for this scenario. We comprehensively evaluated
DOAM-O on the OPIXray dataset, which proves that our model can stably improve
the performance of the famous detection models such as SSD, YOLOv3, and FCOS,
and outperform many extensively-used attention mechanisms.
- Abstract(参考訳): セキュリティ検査は、スーツケース内の個人の持ち物に対するx線スキャンであり、公衆の安全には極めて重要であるが、人間の検査官には非常に時間がかかる。
幸いなことに、ディープラーニングはコンピュータビジョンの開発を大幅に促進し、自動セキュリティ検査の可能性を提供します。
しかし、荷物内のアイテムがランダムに重なり、ノイズの多いX線画像と大きな閉塞が発生します。
したがって、一般的な画像認識データセットを通じて訓練された従来のCNNベースのモデルは、このシナリオで満足のいくパフォーマンスを達成できません。
これらの問題に対処するため, OPIXray という, 広範に普及している禁止項目 ``cutters'' の5カテゴリから8885個のX線画像を含む, 初の高品質な禁止対象検出データセットを寄贈した。
空港から集めた画像は、プロの検査員が手作業で注釈を付け、モデルトレーニングのベンチマークとして使用し、今後の研究を促進します。
また、入射X線物体検出を改善するため、新たな脱入注意モジュールと新しいオーバーサンプリングトレーニング戦略からなるオーバーサンプリング脱閉塞注意ネットワーク(DOAM-O)も提案しています。
具体的には,禁断モジュールであるdoamが禁止項目の異なる外観情報を同時に活用し,過度にサンプリングされたトレーニング戦略により,このシナリオに適合する高い咬合レベルの項目からなるこれらのハードサンプルに重きを置くことを余儀なくされた。
我々はOPIXrayデータセット上でDOAM-Oを総合的に評価し,SSD,YOLOv3,FCOSなどの有名な検出モデルの性能を安定的に向上できることを示す。
関連論文リスト
- BGM: Background Mixup for X-ray Prohibited Items Detection [75.58709178012502]
本稿では,X線画像固有の特徴を活かして,禁止項目検出に適した新しいデータ拡張手法を提案する。
1) X線透過画像: 反射光画像とは異なり、透過X線画素は、撮像経路に沿った複数の材料からの合成情報を表す。
本稿では,セキュリティスクリーニングにおけるアイテム検出の禁止を目的とした,単純かつ効果的なX線画像強調手法であるバックグラウンドミキサップ(BGM)を提案する。
論文 参考訳(メタデータ) (2024-11-30T12:26:55Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Dual-Level Boost Network for Long-Tail Prohibited Items Detection in X-ray Security Inspection [81.11400642272976]
X線検査における禁止項目の長期分布は,検出モデルにとって大きな課題となる。
我々は,X線セキュリティスクリーニングにおけるこれらの課題を克服するために,DBNet(Dual-level Boost Network)を提案する。
提案手法では,(1) X線画像の特徴にインスパイアされた,ポアソンブレンディングを用いた特定のデータ拡張戦略を導入し,データ不均衡を効果的に軽減できるレアアイテムのリアルな合成例を生成する。
論文 参考訳(メタデータ) (2024-11-27T06:13:56Z) - Temporal Fusion Based Mutli-scale Semantic Segmentation for Detecting
Concealed Baggage Threats [12.895636885728852]
時間的手荷物X線画像を利用して、隠蔽されたオブジェクトを効果的にスクリーニングするフレームワークは存在しない。
本稿では, 連続したスキャンを入力として行う, 時間融合駆動型マルチスケール残留型エンコーダデコーダを提案する。
提案するフレームワークは,GDXrayデータセット上で,さまざまなメトリクスで競合する。
論文 参考訳(メタデータ) (2021-11-04T06:19:52Z) - Towards Real-world X-ray Security Inspection: A High-Quality Benchmark
and Lateral Inhibition Module for Prohibited Items Detection [37.66855218659698]
まず,8つのカテゴリの102,928個の共通禁止項目を含む,高品質なX線(HiXray)セキュリティ検査画像データセットを提案する。
正確な禁止項目検出のために,不適切な情報を無視することで,人間がこれらの項目を認識するという事実に触発された横方向抑制モジュール(LIM)を提案する。
論文 参考訳(メタデータ) (2021-08-23T03:59:23Z) - Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark [53.9819155669618]
本稿では,PIDrayと命名された大規模データセットについて述べる。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
論文 参考訳(メタデータ) (2021-08-16T11:14:16Z) - Occluded Prohibited Items Detection: an X-ray Security Inspection
Benchmark and De-occlusion Attention Module [50.75589128518707]
我々はOPIXrayというセキュリティ検査のための最初の高品質なオブジェクト検出データセットをコントリビュートする。
OPIXrayは、空港のプロの検査官が手動で注記した「カッター」に焦点をあてた。
本稿では,プラグイン・アンド・プレイモジュールであるデオクルージョン・アテンション・モジュール(DOAM)を提案する。
論文 参考訳(メタデータ) (2020-04-18T16:10:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。