Fugu-MT 論文翻訳(概要): Over-sampling De-occlusion Attention Network for Prohibited Items Detection in Noisy X-ray Images

論文の概要: Over-sampling De-occlusion Attention Network for Prohibited Items Detection in Noisy X-ray Images

arxiv url: http://arxiv.org/abs/2103.00809v1
Date: Mon, 1 Mar 2021 07:17:37 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-03 16:38:34.987695
Title: Over-sampling De-occlusion Attention Network for Prohibited Items Detection in Noisy X-ray Images
Title（参考訳）: ノイズX線画像における禁止項目検出のための過剰サンプリング脱閉塞注意ネットワーク
Authors: Renshuai Tao, Yanlu Wei, Hainan Li, Aishan Liu, Yifu Ding, Haotong Qin and Xianglong Liu
Abstract要約: セキュリティ検査は、スーツケースの個人持ち物のX線スキャンです。一般的な画像認識データセットを通じてトレーニングされた従来のCNNベースのモデルは、このシナリオで十分なパフォーマンスを達成できない。新規な脱閉塞注意モジュールと新しいオーバーサンプリングトレーニング戦略からなるオーバーサンプリング脱閉塞注意ネットワーク(DOAM-O)を提案する。
参考スコア（独自算出の注目度）: 35.35752470993847
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Security inspection is X-ray scanning for personal belongings in suitcases, which is significantly important for the public security but highly time-consuming for human inspectors. Fortunately, deep learning has greatly promoted the development of computer vision, offering a possible way of automatic security inspection. However, items within a luggage are randomly overlapped resulting in noisy X-ray images with heavy occlusions. Thus, traditional CNN-based models trained through common image recognition datasets fail to achieve satisfactory performance in this scenario. To address these problems, we contribute the first high-quality prohibited X-ray object detection dataset named OPIXray, which contains 8885 X-ray images from 5 categories of the widely-occurred prohibited item ``cutters''. The images are gathered from an airport and these prohibited items are annotated manually by professional inspectors, which can be used as a benchmark for model training and further facilitate future research. To better improve occluded X-ray object detection, we further propose an over-sampling de-occlusion attention network (DOAM-O), which consists of a novel de-occlusion attention module and a new over-sampling training strategy. Specifically, our de-occlusion module, namely DOAM, simultaneously leverages the different appearance information of the prohibited items; the over-sampling training strategy forces the model to put more emphasis on these hard samples consisting these items of high occlusion levels, which is more suitable for this scenario. We comprehensively evaluated DOAM-O on the OPIXray dataset, which proves that our model can stably improve the performance of the famous detection models such as SSD, YOLOv3, and FCOS, and outperform many extensively-used attention mechanisms.
Abstract（参考訳）: セキュリティ検査は、スーツケース内の個人の持ち物に対するx線スキャンであり、公衆の安全には極めて重要であるが、人間の検査官には非常に時間がかかる。幸いなことに、ディープラーニングはコンピュータビジョンの開発を大幅に促進し、自動セキュリティ検査の可能性を提供します。しかし、荷物内のアイテムがランダムに重なり、ノイズの多いX線画像と大きな閉塞が発生します。したがって、一般的な画像認識データセットを通じて訓練された従来のCNNベースのモデルは、このシナリオで満足のいくパフォーマンスを達成できません。これらの問題に対処するため, OPIXray という, 広範に普及している禁止項目 ``cutters'' の5カテゴリから8885個のX線画像を含む, 初の高品質な禁止対象検出データセットを寄贈した。空港から集めた画像は、プロの検査員が手作業で注釈を付け、モデルトレーニングのベンチマークとして使用し、今後の研究を促進します。また、入射X線物体検出を改善するため、新たな脱入注意モジュールと新しいオーバーサンプリングトレーニング戦略からなるオーバーサンプリング脱閉塞注意ネットワーク(DOAM-O)も提案しています。具体的には,禁断モジュールであるdoamが禁止項目の異なる外観情報を同時に活用し,過度にサンプリングされたトレーニング戦略により,このシナリオに適合する高い咬合レベルの項目からなるこれらのハードサンプルに重きを置くことを余儀なくされた。我々はOPIXrayデータセット上でDOAM-Oを総合的に評価し,SSD,YOLOv3,FCOSなどの有名な検出モデルの性能を安定的に向上できることを示す。

関連論文リスト

Augmentation Matters: A Mix-Paste Method for X-Ray Prohibited Item Detection under Noisy Annotations [52.065764858163476]
公共の安全のためには、自動X線禁止アイテム検出が不可欠である。既存のディープラーニングベースの手法はすべて、X線画像のトレーニングのアノテーションが正しいことを前提としている。ラベル対応混合パッチペースト増量法(Mix-Paste)を提案する。我々は,ノイズの多いアノテーションの下で,X線データセット上での手法の優位性を示す。
論文参考訳（メタデータ） (2025-01-03T09:51:51Z)
BGM: Background Mixup for X-ray Prohibited Items Detection [75.58709178012502]
本稿では,X線画像固有の特徴を活かして,禁止項目検出に適した新しいデータ拡張手法を提案する。 1) X線透過画像: 反射光画像とは異なり、透過X線画素は、撮像経路に沿った複数の材料からの合成情報を表す。本稿では,セキュリティスクリーニングにおけるアイテム検出の禁止を目的とした,単純かつ効果的なX線画像強調手法であるバックグラウンドミキサップ(BGM)を提案する。
論文参考訳（メタデータ） (2024-11-30T12:26:55Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
Dual-view X-ray Detection: Can AI Detect Prohibited Items from Dual-view X-ray Images like Humans? [78.26435264182763]
大規模デュアルビューX線(LDXray)を導入し,12のカテゴリで353,646個のインスタンスで構成されている。デュアルビュー検出におけるヒューマンインテリジェンスをエミュレートするために,補助ビュー拡張ネットワーク(AENet)を提案する。 LDXrayデータセットの実験では、デュアルビュー機構が検出性能を大幅に向上することを示した。
論文参考訳（メタデータ） (2024-11-27T06:36:20Z)
Visual inspection for illicit items in X-ray images using Deep Learning [7.350725076596881]
X線画像におけるコントラバンドアイテムの自動検出は、公共の安全を著しく向上させる。ディープニューラルネットワーク(DNN)に依存する現代のコンピュータビジョンアルゴリズムは、このタスクを遂行できることを証明している。
論文参考訳（メタデータ） (2023-10-05T16:35:27Z)
Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images with Free Attention Masks [64.67735676127208]
テキストと画像の拡散モデルは、画像認識の恩恵を受ける大きな可能性を示している。有望ではあるが、拡散生成画像の教師なし学習に特化した調査は不十分である。上記フリーアテンションマスクをフル活用することで、カスタマイズされたソリューションを導入する。
論文参考訳（メタデータ） (2023-08-13T10:07:46Z)
X-Adv: Physical Adversarial Object Attacks against X-ray Prohibited Item Detection [113.10386151761682]
テクスチャフリーなX線画像を対象とした敵攻撃は未発見である。本稿では,X線禁止項目検出を目的とした敵攻撃の研究に向けて第一歩を踏み出す。我々は,X線検出器を消毒できる対向剤として機能する物理的に印刷可能な金属を生成するために,X-Advを提案する。
論文参考訳（メタデータ） (2023-02-19T06:31:17Z)
Temporal Fusion Based Mutli-scale Semantic Segmentation for Detecting Concealed Baggage Threats [12.895636885728852]
時間的手荷物X線画像を利用して、隠蔽されたオブジェクトを効果的にスクリーニングするフレームワークは存在しない。本稿では, 連続したスキャンを入力として行う, 時間融合駆動型マルチスケール残留型エンコーダデコーダを提案する。提案するフレームワークは,GDXrayデータセット上で,さまざまなメトリクスで競合する。
論文参考訳（メタデータ） (2021-11-04T06:19:52Z)
Towards Real-world X-ray Security Inspection: A High-Quality Benchmark and Lateral Inhibition Module for Prohibited Items Detection [37.66855218659698]
まず,8つのカテゴリの102,928個の共通禁止項目を含む,高品質なX線(HiXray)セキュリティ検査画像データセットを提案する。正確な禁止項目検出のために,不適切な情報を無視することで,人間がこれらの項目を認識するという事実に触発された横方向抑制モジュール(LIM)を提案する。
論文参考訳（メタデータ） (2021-08-23T03:59:23Z)
Towards Real-World Prohibited Item Detection: A Large-Scale X-ray Benchmark [53.9819155669618]
本稿では,PIDrayと命名された大規模データセットについて述べる。大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
論文参考訳（メタデータ） (2021-08-16T11:14:16Z)
Beyond the Spectrum: Detecting Deepfakes via Re-Synthesis [69.09526348527203]
ディープフェイク(Deepfakes)として知られる非常に現実的なメディアは、現実の目から人間の目まで区別できない。本研究では,テスト画像を再合成し,検出のための視覚的手がかりを抽出する,新しい偽検出手法を提案する。種々の検出シナリオにおいて,提案手法の摂動に対する有効性の向上,GANの一般化,堅牢性を示す。
論文参考訳（メタデータ） (2021-05-29T21:22:24Z)
Occluded Prohibited Items Detection: an X-ray Security Inspection Benchmark and De-occlusion Attention Module [50.75589128518707]
我々はOPIXrayというセキュリティ検査のための最初の高品質なオブジェクト検出データセットをコントリビュートする。 OPIXrayは、空港のプロの検査官が手動で注記した「カッター」に焦点をあてた。本稿では,プラグイン・アンド・プレイモジュールであるデオクルージョン・アテンション・モジュール(DOAM)を提案する。
論文参考訳（メタデータ） (2020-04-18T16:10:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。