論文の概要: Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark
- arxiv url: http://arxiv.org/abs/2108.07020v1
- Date: Mon, 16 Aug 2021 11:14:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 15:00:39.763290
- Title: Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark
- Title(参考訳): 実世界の禁止項目検出に向けて:大規模X線ベンチマーク
- Authors: Boying Wang and Libo Zhang and Longyin Wen and Xianglong Liu and
Yanjun Wu
- Abstract要約: 本稿では,PIDrayと命名された大規模データセットについて述べる。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
- 参考スコア(独自算出の注目度): 53.9819155669618
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic security inspection using computer vision technology is a
challenging task in real-world scenarios due to various factors, including
intra-class variance, class imbalance, and occlusion. Most of the previous
methods rarely solve the cases that the prohibited items are deliberately
hidden in messy objects due to the lack of large-scale datasets, restricted
their applications in real-world scenarios. Towards real-world prohibited item
detection, we collect a large-scale dataset, named as PIDray, which covers
various cases in real-world scenarios for prohibited item detection, especially
for deliberately hidden items. With an intensive amount of effort, our dataset
contains $12$ categories of prohibited items in $47,677$ X-ray images with
high-quality annotated segmentation masks and bounding boxes. To the best of
our knowledge, it is the largest prohibited items detection dataset to date.
Meanwhile, we design the selective dense attention network (SDANet) to
construct a strong baseline, which consists of the dense attention module and
the dependency refinement module. The dense attention module formed by the
spatial and channel-wise dense attentions, is designed to learn the
discriminative features to boost the performance. The dependency refinement
module is used to exploit the dependencies of multi-scale features. Extensive
experiments conducted on the collected PIDray dataset demonstrate that the
proposed method performs favorably against the state-of-the-art methods,
especially for detecting the deliberately hidden items.
- Abstract(参考訳): コンピュータビジョン技術を用いた自動セキュリティ検査は,クラス内分散,クラス不均衡,オクルージョンといったさまざまな要因により,現実のシナリオでは難しい課題である。
以前の方法のほとんどは、大規模なデータセットがないため、禁止されたアイテムが故意に乱雑なオブジェクトに隠れているケースをほとんど解決しません。
実世界の禁止アイテム検出に向けて,PIDrayという名の大規模データセットを収集し,特に故意に隠蔽されたアイテムの検出を実世界のシナリオでカバーする。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
我々の知る限りでは、これまでで最大の禁止アイテム検出データセットである。
一方,我々は,sdanet (selective dense attention network) を設計して,集中型注意モジュールと依存的リファインメントモジュールからなる,強いベースラインを構築する。
空間的およびチャネル的に密着した注意によって形成される密着モジュールは、性能を高めるための識別的特徴を学習するために設計されている。
依存性リファインメントモジュールは、マルチスケール機能の依存関係を利用するために使用される。
収集したPIDrayデータセットで行った大規模な実験により,提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能することが示された。
関連論文リスト
- Transcending Forgery Specificity with Latent Space Augmentation for
Generalizable Deepfake Detection [61.845902530915325]
LSDAと呼ばれる簡易で効果的なディープフェイク検出器を提案する。
それは偽りの考えに基づいており、より多様な偽の表現はより一般化可能な決定境界を学べるべきである。
提案手法は驚くほど有効であり, 広く使用されている複数のベンチマークで最先端の検出器を超越することを示す。
論文 参考訳(メタデータ) (2023-11-19T09:41:10Z) - Towards End-to-End Unsupervised Saliency Detection with Self-Supervised
Top-Down Context [25.85453873366275]
トップダウンコンテキストを介し、自己教師付きエンドツーエンドの有能なオブジェクト検出フレームワークを提案する。
最も深い特徴から自己ローカライゼーションを生かして位置マップを構築し,最も指導的なセグメンテーション指導を学習する。
提案手法は,近年のエンド・ツー・エンド手法と,多段階ソリューションの大部分において,先行的な性能を実現する。
論文 参考訳(メタデータ) (2023-10-14T08:43:22Z) - PIDray: A Large-scale X-ray Benchmark for Real-World Prohibited Item
Detection [21.055813365091662]
PIDrayという名前の大規模データセットを提示し、実世界の様々なケースを対象とし、アイテム検出を禁止している。
具体的には、PIDrayは禁止アイテムの12ドルのカテゴリに対して124,486枚のX線画像を収集する。
そこで本研究では,PIDrayに基づくベースラインアルゴリズムを開発するために,汎用的な分割・コンカレントパイプラインを提案する。
論文 参考訳(メタデータ) (2022-11-19T18:31:34Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Scene-Aware
Ambidextrous Bin Picking via Physics-based Metaverse Synthesis [72.85526892440251]
本稿では,物理に基づくメタバース合成により構築した大規模写真リアリスティックビンピックデータセットであるMetaGraspNetを紹介する。
提案データセットは,82種類の記事に対して217kのRGBD画像を含み,オブジェクト検出,アモーダル認識,キーポイント検出,操作順序,および並列ジャウと真空グリップパー用のアンビデクストグリップラベルの完全なアノテーションを備える。
また,2.3k以上の完全アノテートされた高品質なRGBD画像からなる実際のデータセットを5段階の難易度と,異なるオブジェクトおよびレイアウト特性を評価するための見えないオブジェクトセットに分割する。
論文 参考訳(メタデータ) (2022-08-08T08:15:34Z) - Towards Real-world X-ray Security Inspection: A High-Quality Benchmark
and Lateral Inhibition Module for Prohibited Items Detection [37.66855218659698]
まず,8つのカテゴリの102,928個の共通禁止項目を含む,高品質なX線(HiXray)セキュリティ検査画像データセットを提案する。
正確な禁止項目検出のために,不適切な情報を無視することで,人間がこれらの項目を認識するという事実に触発された横方向抑制モジュール(LIM)を提案する。
論文 参考訳(メタデータ) (2021-08-23T03:59:23Z) - Over-sampling De-occlusion Attention Network for Prohibited Items
Detection in Noisy X-ray Images [35.35752470993847]
セキュリティ検査は、スーツケースの個人持ち物のX線スキャンです。
一般的な画像認識データセットを通じてトレーニングされた従来のCNNベースのモデルは、このシナリオで十分なパフォーマンスを達成できない。
新規な脱閉塞注意モジュールと新しいオーバーサンプリングトレーニング戦略からなるオーバーサンプリング脱閉塞注意ネットワーク(DOAM-O)を提案する。
論文 参考訳(メタデータ) (2021-03-01T07:17:37Z) - SoDA: Multi-Object Tracking with Soft Data Association [75.39833486073597]
マルチオブジェクトトラッキング(MOT)は、自動運転車の安全な配備の前提条件である。
観測対象間の依存関係をエンコードするトラック埋め込みの計算に注目するMOTに対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-08-18T03:40:25Z) - Occluded Prohibited Items Detection: an X-ray Security Inspection
Benchmark and De-occlusion Attention Module [50.75589128518707]
我々はOPIXrayというセキュリティ検査のための最初の高品質なオブジェクト検出データセットをコントリビュートする。
OPIXrayは、空港のプロの検査官が手動で注記した「カッター」に焦点をあてた。
本稿では,プラグイン・アンド・プレイモジュールであるデオクルージョン・アテンション・モジュール(DOAM)を提案する。
論文 参考訳(メタデータ) (2020-04-18T16:10:55Z) - Object Detection as a Positive-Unlabeled Problem [78.2955013126312]
本稿では,未ラベル領域が負でなければならないという仮定を排除し,対象検出を正の未ラベル(PU)問題として扱うことを提案する。
提案するPU分類の損失は, PASCAL VOCやMS COCO, Visual GenomeやDeepLesionなど, ラベルの欠如により, 標準的なPN損失よりも優れていた。
論文 参考訳(メタデータ) (2020-02-11T20:49:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。