論文の概要: BGM: Background Mixup for X-ray Prohibited Items Detection
- arxiv url: http://arxiv.org/abs/2412.00460v1
- Date: Sat, 30 Nov 2024 12:26:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:45:55.517992
- Title: BGM: Background Mixup for X-ray Prohibited Items Detection
- Title(参考訳): BGM:X線禁止項目検出のための背景混合
- Authors: Weizhe Liu, Renshuai Tao, Hongguang Zhu, Yunda Sun, Yao Zhao, Yunchao Wei,
- Abstract要約: 本稿では,X線画像固有の特徴を活かして,禁止項目検出に適した新しいデータ拡張手法を提案する。
1) X線透過画像: 反射光画像とは異なり、透過X線画素は、撮像経路に沿った複数の材料からの合成情報を表す。
本稿では,セキュリティスクリーニングにおけるアイテム検出の禁止を目的とした,単純かつ効果的なX線画像強調手法であるバックグラウンドミキサップ(BGM)を提案する。
- 参考スコア(独自算出の注目度): 75.58709178012502
- License:
- Abstract: Prohibited item detection is crucial for ensuring public safety, yet current X-ray image-based detection methods often lack comprehensive data-driven exploration. This paper introduces a novel data augmentation approach tailored for prohibited item detection, leveraging unique characteristics inherent to X-ray imagery. Our method is motivated by observations of physical properties including: 1) X-ray Transmission Imagery: Unlike reflected light images, transmitted X-ray pixels represent composite information from multiple materials along the imaging path. 2) Material-based Pseudo-coloring: Pseudo-color rendering in X-ray images correlates directly with material properties, aiding in material distinction. Building on a novel perspective from physical properties, we propose a simple yet effective X-ray image augmentation technique, Background Mixup (BGM), for prohibited item detection in security screening contexts. The essence is the rich background simulation of X-ray images to induce the model to increase its attention to the foreground. The approach introduces 1) contour information of baggage and 2) variation of material information into the original image by Mixup at patch level. Background Mixup is plug-and-play, parameter-free, highly generalizable and provides an effective solution to the limitations of classical visual augmentations in non-reflected light imagery. When implemented with different high-performance detectors, our augmentation method consistently boosts performance across diverse X-ray datasets from various devices and environments. Extensive experimental results demonstrate that our approach surpasses strong baselines while maintaining similar training resources.
- Abstract(参考訳): 禁止されたアイテムの検出は公共の安全を確保するために重要であるが、現在のX線画像に基づく検出方法は、包括的なデータ駆動探索を欠いていることが多い。
本稿では,X線画像固有の特徴を活かして,禁止項目検出に適した新しいデータ拡張手法を提案する。
我々の手法は、以下を含む物理的特性の観察によって動機づけられる。
1)X線透過画像: 反射光画像とは異なり、透過X線画素は、撮像経路に沿った複数の材料からの合成情報を表す。
2) Pseudo-coloring: Pseudo-color rendering in X-ray images は, 材料特性と直接相関し, 材料識別に寄与する。
物理特性からの新たな視点から,セキュリティスクリーニングにおけるアイテム検出の禁止を目的とした,単純かつ効果的なX線画像強調手法であるバックグラウンドミキサップ(BGM)を提案する。
本研究の本質は、X線画像の背景の豊かなシミュレーションにより、モデルが前景への注意を増すよう誘導することである。
アプローチの紹介
1)荷物の輪郭情報及び
2) パッチレベルでのMixupによる原画像への材料情報のばらつき
background Mixupは、プラグアンドプレイ、パラメータフリー、高一般化可能であり、非反射光画像における古典的な視覚増強の限界に対する効果的な解決策を提供する。
異なる高性能検出器で実装すると、拡張法は様々なデバイスや環境からの多様なX線データセットのパフォーマンスを継続的に向上させる。
実験結果から,本手法はトレーニング資源を維持しながら,強いベースラインを超えていることが明らかとなった。
関連論文リスト
- Augmentation Matters: A Mix-Paste Method for X-Ray Prohibited Item Detection under Noisy Annotations [52.065764858163476]
公共の安全のためには、自動X線禁止アイテム検出が不可欠である。
既存のディープラーニングベースの手法はすべて、X線画像のトレーニングのアノテーションが正しいことを前提としている。
ラベル対応混合パッチペースト増量法(Mix-Paste)を提案する。
我々は,ノイズの多いアノテーションの下で,X線データセット上での手法の優位性を示す。
論文 参考訳(メタデータ) (2025-01-03T09:51:51Z) - Dual-view X-ray Detection: Can AI Detect Prohibited Items from Dual-view X-ray Images like Humans? [78.26435264182763]
大規模デュアルビューX線(LDXray)を導入し,12のカテゴリで353,646個のインスタンスで構成されている。
デュアルビュー検出におけるヒューマンインテリジェンスをエミュレートするために,補助ビュー拡張ネットワーク(AENet)を提案する。
LDXrayデータセットの実験では、デュアルビュー機構が検出性能を大幅に向上することを示した。
論文 参考訳(メタデータ) (2024-11-27T06:36:20Z) - Parents and Children: Distinguishing Multimodal DeepFakes from Natural Images [60.34381768479834]
近年の拡散モデルの発展により、自然言語のテキストプロンプトから現実的なディープフェイクの生成が可能になった。
我々は、最先端拡散モデルにより生成されたディープフェイク検出に関する体系的研究を開拓した。
論文 参考訳(メタデータ) (2023-04-02T10:25:09Z) - On the impact of using X-ray energy response imagery for object
detection via Convolutional Neural Networks [17.639472693362926]
我々は,X線エネルギー応答(高,低)と有効Zの影響について,測地値と比較して検討した。
我々は、CNNアーキテクチャを評価し、そのような「Raw」変種画像で訓練されたモデルの転送可能性について検討する。
論文 参考訳(メタデータ) (2021-08-27T21:28:28Z) - Cross-Modal Contrastive Learning for Abnormality Classification and
Localization in Chest X-rays with Radiomics using a Feedback Loop [63.81818077092879]
医療画像のためのエンドツーエンドのセミスーパーバイスドクロスモーダルコントラスト学習フレームワークを提案する。
まず、胸部X線を分類し、画像特徴を生成するために画像エンコーダを適用する。
放射能の特徴は別の専用エンコーダを通過し、同じ胸部x線から生成された画像の特徴の正のサンプルとして機能する。
論文 参考訳(メタデータ) (2021-04-11T09:16:29Z) - Image Separation with Side Information: A Connected Auto-Encoders Based
Approach [18.18248997032482]
両面画像のX線画像から混合X線画像を分離する問題に対処する。
本稿では,混合X線画像を両面に対応する2つの模擬X線画像に分離する「接続型」オートエンコーダに基づくニューラルニューラルネットワークアーキテクチャを提案する。
これらの実験により, 提案手法は, 最先端のX線画像分離法よりも高い性能を示した。
論文 参考訳(メタデータ) (2020-09-16T18:39:42Z) - Occluded Prohibited Items Detection: an X-ray Security Inspection
Benchmark and De-occlusion Attention Module [50.75589128518707]
我々はOPIXrayというセキュリティ検査のための最初の高品質なオブジェクト検出データセットをコントリビュートする。
OPIXrayは、空港のプロの検査官が手動で注記した「カッター」に焦点をあてた。
本稿では,プラグイン・アンド・プレイモジュールであるデオクルージョン・アテンション・モジュール(DOAM)を提案する。
論文 参考訳(メタデータ) (2020-04-18T16:10:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。