論文の概要: PAD-F: Prior-Aware Debiasing Framework for Long-Tailed X-ray Prohibited Item Detection
- arxiv url: http://arxiv.org/abs/2411.18078v3
- Date: Tue, 12 Aug 2025 11:40:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 14:32:15.886787
- Title: PAD-F: Prior-Aware Debiasing Framework for Long-Tailed X-ray Prohibited Item Detection
- Title(参考訳): PAD-F:長距離X線禁止項目検出のための事前認識脱バイアスフレームワーク
- Authors: Haoyu Wang, Renshuai Tao, Wei Wang, Yunchao Wei,
- Abstract要約: 実世界の禁止アイテム検出シナリオにおけるオブジェクトクラスの分布は、しばしばはっきりとした長い尾の分布を示す。
本稿では,2つの戦略を取り入れた新しいアプローチであるPAD-F(Presideed-Aware Debiasing Framework)を紹介する。
PAD-Fは複数の一般的な検出器の性能を大幅に向上させる。
- 参考スコア(独自算出の注目度): 56.25222232778367
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting prohibited items in X-ray security imagery is a challenging yet crucial task. With the rapid advancement of deep learning, object detection algorithms have been widely applied in this area. However, the distribution of object classes in real-world prohibited item detection scenarios often exhibits a distinct long-tailed distribution. Due to the unique principles of X-ray imaging, conventional methods for long-tailed object detection are often ineffective in this domain. To tackle these challenges, we introduce the Prior-Aware Debiasing Framework (PAD-F), a novel approach that employs a two-pronged strategy leveraging both material and co-occurrence priors. At the data level, our Explicit Material-Aware Augmentation (EMAA) component generates numerous challenging training samples for tail classes. It achieves this through a placement strategy guided by material-specific absorption rates and a gradient-based Poisson blending technique. At the feature level, the Implicit Co-occurrence Aggregator (ICA) acts as a plug-in module that enhances features for ambiguous objects by implicitly learning and aggregating statistical co-occurrence relationships within the image. Extensive experiments on the HiXray and PIDray datasets demonstrate that PAD-F significantly boosts the performance of multiple popular detectors. It achieves an absolute improvement of up to +17.2% in AP50 for tail classes and comprehensively outperforms existing state-of-the-art methods. Our work provides an effective and versatile solution to the critical problem of long-tailed detection in X-ray security.
- Abstract(参考訳): X線セキュリティ画像における禁止アイテムの検出は、難しいが重要な課題である。
ディープラーニングの急速な進歩により、この領域ではオブジェクト検出アルゴリズムが広く適用されている。
しかし、現実世界の禁止アイテム検出シナリオにおけるオブジェクトクラスの分布は、しばしばはっきりとした長い尾の分布を示す。
X線イメージングのユニークな原理により、この領域では、長い尾の物体検出の従来の方法がしばしば有効ではない。
これらの課題に対処するために,物質的および共起的両方の先駆的手法を両立させる新しいアプローチであるPrior-Aware Debiasing Framework (PAD-F)を導入する。
データレベルでは、EMAA(Explicit Material-Aware Augmentation)コンポーネントは、テールクラスのための多くの挑戦的なトレーニングサンプルを生成します。
これは、物質固有の吸収率と勾配に基づくポアソンブレンディング技術によって導かれる配置戦略によって達成される。
特徴レベルでは、Implicit Co-occurrence Aggregator (ICA) は、画像内の統計的共起関係を暗黙的に学習し集約することにより、あいまいなオブジェクトの特徴を高めるプラグインモジュールとして機能する。
HiXrayとPIDrayのデータセットに関する大規模な実験は、PAD-Fが複数の一般的な検出器の性能を大幅に向上させることを示した。
テールクラスではAP50で最大+17.2%の絶対的な改善を実現し、既存の最先端の手法を総合的に上回っている。
我々の研究は、X線セキュリティにおける長い尾検出の致命的な問題に対して、効果的で汎用的な解決策を提供する。
関連論文リスト
- Self-Supervised Multiview Xray Matching [4.033064933995391]
現在の方法は、しばしば異なるX線ビュー間の堅牢な対応を確立するのに苦労する。
手動のアノテーションを必要としない新しい自己教師型パイプラインを提案する。
提案手法では,2つ以上のX線ビューの対応を正確に予測するために,トランスフォーマーベースのトレーニングフェーズを組み込む。
論文 参考訳(メタデータ) (2025-06-30T21:56:14Z) - Superpowering Open-Vocabulary Object Detectors for X-ray Vision [53.07098133237041]
オープンボキャブラリオブジェクト検出(OvOD)は、X線スキャンで任意のアイテムを認識できるようにすることで、セキュリティスクリーニングに革命をもたらす。
RAXOは市販のRGB OvOD検出器を高強度X線検出に活用するフレームワークである。
RAXOはデュアルソース検索戦略を用いて高品質なX線クラス記述子を構築する。
論文 参考訳(メタデータ) (2025-03-21T11:54:16Z) - AdverX-Ray: Ensuring X-Ray Integrity Through Frequency-Sensitive Adversarial VAEs [7.0477485974331895]
AdverX-Rayは画像品質評価層として機能する。
特定のマシンモデルのX線画像からのパッチに基づいて訓練される。
スキャンがトレーニング分布にマッチするかどうか、あるいは同じマシンからスキャンが異なる設定でキャプチャされるかどうかを評価することができる。
論文 参考訳(メタデータ) (2025-02-23T15:32:40Z) - BGM: Background Mixup for X-ray Prohibited Items Detection [75.58709178012502]
本稿では,X線画像固有の特徴を活かして,禁止項目検出に適した新しいデータ拡張手法を提案する。
1) X線透過画像: 反射光画像とは異なり、透過X線画素は、撮像経路に沿った複数の材料からの合成情報を表す。
本稿では,セキュリティスクリーニングにおけるアイテム検出の禁止を目的とした,単純かつ効果的なX線画像強調手法であるバックグラウンドミキサップ(BGM)を提案する。
論文 参考訳(メタデータ) (2024-11-30T12:26:55Z) - Dual-view X-ray Detection: Can AI Detect Prohibited Items from Dual-view X-ray Images like Humans? [78.26435264182763]
大規模デュアルビューX線(LDXray)を導入し,12のカテゴリで353,646個のインスタンスで構成されている。
デュアルビュー検出におけるヒューマンインテリジェンスをエミュレートするために,補助ビュー拡張ネットワーク(AENet)を提案する。
LDXrayデータセットの実験では、デュアルビュー機構が検出性能を大幅に向上することを示した。
論文 参考訳(メタデータ) (2024-11-27T06:36:20Z) - Model X-ray:Detecting Backdoored Models via Decision Boundary [62.675297418960355]
バックドア攻撃はディープニューラルネットワーク(DNN)に重大な脆弱性をもたらす
図形化された2次元(2次元)決定境界の解析に基づく新しいバックドア検出手法であるモデルX線を提案する。
提案手法は,クリーンサンプルが支配する意思決定領域とラベル分布の集中度に着目した2つの戦略を含む。
論文 参考訳(メタデータ) (2024-02-27T12:42:07Z) - Spatial-Frequency Discriminability for Revealing Adversarial Perturbations [53.279716307171604]
敵の摂動に対するディープニューラルネットワークの脆弱性は、コンピュータビジョンコミュニティで広く認識されている。
現在のアルゴリズムは、通常、自然および敵対的なデータの識別的分解を通じて、敵のパターンを検出する。
空間周波数Krawtchouk分解に基づく識別検出器を提案する。
論文 参考訳(メタデータ) (2023-05-18T10:18:59Z) - Illicit item detection in X-ray images for security applications [7.519872646378835]
X線画像におけるコントラバンドアイテムの自動検出は、公共の安全を著しく向上させる。
ディープニューラルネットワーク(DNN)に依存する現代のコンピュータビジョンアルゴリズムは、このタスクを遂行できることを証明している。
本稿では,X線解析領域におけるそのようなアルゴリズムの2倍の改良を提案する。
論文 参考訳(メタデータ) (2023-05-03T07:28:05Z) - Joint Sub-component Level Segmentation and Classification for Anomaly
Detection within Dual-Energy X-Ray Security Imagery [14.785070524184649]
この性能は、散在したX線バッグセキュリティ画像のデータセット上で評価される。
提案手法は, 異常検出タスクに対して, 99%の真正, 5%の偽正を達成できる。
論文 参考訳(メタデータ) (2022-10-29T00:44:50Z) - Generative Residual Attention Network for Disease Detection [51.60842580044539]
本稿では, 条件付き生成逆学習を用いたX線疾患発生のための新しいアプローチを提案する。
我々は,患者の身元を保存しながら,対象領域に対応する放射線画像を生成する。
次に、ターゲット領域で生成されたX線画像を用いてトレーニングを増強し、検出性能を向上させる。
論文 参考訳(メタデータ) (2021-10-25T14:15:57Z) - On the impact of using X-ray energy response imagery for object
detection via Convolutional Neural Networks [17.639472693362926]
我々は,X線エネルギー応答(高,低)と有効Zの影響について,測地値と比較して検討した。
我々は、CNNアーキテクチャを評価し、そのような「Raw」変種画像で訓練されたモデルの転送可能性について検討する。
論文 参考訳(メタデータ) (2021-08-27T21:28:28Z) - Towards Real-world X-ray Security Inspection: A High-Quality Benchmark
and Lateral Inhibition Module for Prohibited Items Detection [37.66855218659698]
まず,8つのカテゴリの102,928個の共通禁止項目を含む,高品質なX線(HiXray)セキュリティ検査画像データセットを提案する。
正確な禁止項目検出のために,不適切な情報を無視することで,人間がこれらの項目を認識するという事実に触発された横方向抑制モジュール(LIM)を提案する。
論文 参考訳(メタデータ) (2021-08-23T03:59:23Z) - Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark [53.9819155669618]
本稿では,PIDrayと命名された大規模データセットについて述べる。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
論文 参考訳(メタデータ) (2021-08-16T11:14:16Z) - Cross-Modal Contrastive Learning for Abnormality Classification and
Localization in Chest X-rays with Radiomics using a Feedback Loop [63.81818077092879]
医療画像のためのエンドツーエンドのセミスーパーバイスドクロスモーダルコントラスト学習フレームワークを提案する。
まず、胸部X線を分類し、画像特徴を生成するために画像エンコーダを適用する。
放射能の特徴は別の専用エンコーダを通過し、同じ胸部x線から生成された画像の特徴の正のサンプルとして機能する。
論文 参考訳(メタデータ) (2021-04-11T09:16:29Z) - Over-sampling De-occlusion Attention Network for Prohibited Items
Detection in Noisy X-ray Images [35.35752470993847]
セキュリティ検査は、スーツケースの個人持ち物のX線スキャンです。
一般的な画像認識データセットを通じてトレーニングされた従来のCNNベースのモデルは、このシナリオで十分なパフォーマンスを達成できない。
新規な脱閉塞注意モジュールと新しいオーバーサンプリングトレーニング戦略からなるオーバーサンプリング脱閉塞注意ネットワーク(DOAM-O)を提案する。
論文 参考訳(メタデータ) (2021-03-01T07:17:37Z) - Occluded Prohibited Items Detection: an X-ray Security Inspection
Benchmark and De-occlusion Attention Module [50.75589128518707]
我々はOPIXrayというセキュリティ検査のための最初の高品質なオブジェクト検出データセットをコントリビュートする。
OPIXrayは、空港のプロの検査官が手動で注記した「カッター」に焦点をあてた。
本稿では,プラグイン・アンド・プレイモジュールであるデオクルージョン・アテンション・モジュール(DOAM)を提案する。
論文 参考訳(メタデータ) (2020-04-18T16:10:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。