論文の概要: Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark
- arxiv url: http://arxiv.org/abs/2108.07020v1
- Date: Mon, 16 Aug 2021 11:14:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 15:00:39.763290
- Title: Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark
- Title(参考訳): 実世界の禁止項目検出に向けて:大規模X線ベンチマーク
- Authors: Boying Wang and Libo Zhang and Longyin Wen and Xianglong Liu and
Yanjun Wu
- Abstract要約: 本稿では,PIDrayと命名された大規模データセットについて述べる。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
- 参考スコア(独自算出の注目度): 53.9819155669618
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic security inspection using computer vision technology is a
challenging task in real-world scenarios due to various factors, including
intra-class variance, class imbalance, and occlusion. Most of the previous
methods rarely solve the cases that the prohibited items are deliberately
hidden in messy objects due to the lack of large-scale datasets, restricted
their applications in real-world scenarios. Towards real-world prohibited item
detection, we collect a large-scale dataset, named as PIDray, which covers
various cases in real-world scenarios for prohibited item detection, especially
for deliberately hidden items. With an intensive amount of effort, our dataset
contains $12$ categories of prohibited items in $47,677$ X-ray images with
high-quality annotated segmentation masks and bounding boxes. To the best of
our knowledge, it is the largest prohibited items detection dataset to date.
Meanwhile, we design the selective dense attention network (SDANet) to
construct a strong baseline, which consists of the dense attention module and
the dependency refinement module. The dense attention module formed by the
spatial and channel-wise dense attentions, is designed to learn the
discriminative features to boost the performance. The dependency refinement
module is used to exploit the dependencies of multi-scale features. Extensive
experiments conducted on the collected PIDray dataset demonstrate that the
proposed method performs favorably against the state-of-the-art methods,
especially for detecting the deliberately hidden items.
- Abstract(参考訳): コンピュータビジョン技術を用いた自動セキュリティ検査は,クラス内分散,クラス不均衡,オクルージョンといったさまざまな要因により,現実のシナリオでは難しい課題である。
以前の方法のほとんどは、大規模なデータセットがないため、禁止されたアイテムが故意に乱雑なオブジェクトに隠れているケースをほとんど解決しません。
実世界の禁止アイテム検出に向けて,PIDrayという名の大規模データセットを収集し,特に故意に隠蔽されたアイテムの検出を実世界のシナリオでカバーする。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
我々の知る限りでは、これまでで最大の禁止アイテム検出データセットである。
一方,我々は,sdanet (selective dense attention network) を設計して,集中型注意モジュールと依存的リファインメントモジュールからなる,強いベースラインを構築する。
空間的およびチャネル的に密着した注意によって形成される密着モジュールは、性能を高めるための識別的特徴を学習するために設計されている。
依存性リファインメントモジュールは、マルチスケール機能の依存関係を利用するために使用される。
収集したPIDrayデータセットで行った大規模な実験により,提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能することが示された。
関連論文リスト
- Bayesian Detector Combination for Object Detection with Crowdsourced Annotations [49.43709660948812]
制約のない画像できめ細かなオブジェクト検出アノテーションを取得するのは、時間がかかり、コストがかかり、ノイズに悩まされる。
ノイズの多いクラウドソースアノテーションでオブジェクト検出をより効果的に訓練するための新しいベイズ検出結合(BDC)フレームワークを提案する。
BDCはモデルに依存しず、アノテータのスキルレベルに関する事前の知識を必要とせず、既存のオブジェクト検出モデルとシームレスに統合される。
論文 参考訳(メタデータ) (2024-07-10T18:00:54Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい手法のモジュラーフレームワークであるADerを包括的視覚異常検出ベンチマークとして紹介する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - Transcending Forgery Specificity with Latent Space Augmentation for Generalizable Deepfake Detection [57.646582245834324]
LSDAと呼ばれる簡易で効果的なディープフェイク検出器を提案する。
より多様な偽の表現は、より一般化可能な決定境界を学べるべきである。
提案手法は驚くほど有効であり, 広く使用されている複数のベンチマークで最先端の検出器を超越することを示す。
論文 参考訳(メタデータ) (2023-11-19T09:41:10Z) - Towards End-to-End Unsupervised Saliency Detection with Self-Supervised
Top-Down Context [25.85453873366275]
トップダウンコンテキストを介し、自己教師付きエンドツーエンドの有能なオブジェクト検出フレームワークを提案する。
最も深い特徴から自己ローカライゼーションを生かして位置マップを構築し,最も指導的なセグメンテーション指導を学習する。
提案手法は,近年のエンド・ツー・エンド手法と,多段階ソリューションの大部分において,先行的な性能を実現する。
論文 参考訳(メタデータ) (2023-10-14T08:43:22Z) - PIDray: A Large-scale X-ray Benchmark for Real-World Prohibited Item
Detection [21.055813365091662]
PIDrayという名前の大規模データセットを提示し、実世界の様々なケースを対象とし、アイテム検出を禁止している。
具体的には、PIDrayは禁止アイテムの12ドルのカテゴリに対して124,486枚のX線画像を収集する。
そこで本研究では,PIDrayに基づくベースラインアルゴリズムを開発するために,汎用的な分割・コンカレントパイプラインを提案する。
論文 参考訳(メタデータ) (2022-11-19T18:31:34Z) - Towards Real-world X-ray Security Inspection: A High-Quality Benchmark
and Lateral Inhibition Module for Prohibited Items Detection [37.66855218659698]
まず,8つのカテゴリの102,928個の共通禁止項目を含む,高品質なX線(HiXray)セキュリティ検査画像データセットを提案する。
正確な禁止項目検出のために,不適切な情報を無視することで,人間がこれらの項目を認識するという事実に触発された横方向抑制モジュール(LIM)を提案する。
論文 参考訳(メタデータ) (2021-08-23T03:59:23Z) - Over-sampling De-occlusion Attention Network for Prohibited Items
Detection in Noisy X-ray Images [35.35752470993847]
セキュリティ検査は、スーツケースの個人持ち物のX線スキャンです。
一般的な画像認識データセットを通じてトレーニングされた従来のCNNベースのモデルは、このシナリオで十分なパフォーマンスを達成できない。
新規な脱閉塞注意モジュールと新しいオーバーサンプリングトレーニング戦略からなるオーバーサンプリング脱閉塞注意ネットワーク(DOAM-O)を提案する。
論文 参考訳(メタデータ) (2021-03-01T07:17:37Z) - SoDA: Multi-Object Tracking with Soft Data Association [75.39833486073597]
マルチオブジェクトトラッキング(MOT)は、自動運転車の安全な配備の前提条件である。
観測対象間の依存関係をエンコードするトラック埋め込みの計算に注目するMOTに対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-08-18T03:40:25Z) - Occluded Prohibited Items Detection: an X-ray Security Inspection
Benchmark and De-occlusion Attention Module [50.75589128518707]
我々はOPIXrayというセキュリティ検査のための最初の高品質なオブジェクト検出データセットをコントリビュートする。
OPIXrayは、空港のプロの検査官が手動で注記した「カッター」に焦点をあてた。
本稿では,プラグイン・アンド・プレイモジュールであるデオクルージョン・アテンション・モジュール(DOAM)を提案する。
論文 参考訳(メタデータ) (2020-04-18T16:10:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。