論文の概要: BGM: Background Mixup for X-ray Prohibited Items Detection
- arxiv url: http://arxiv.org/abs/2412.00460v3
- Date: Fri, 25 Jul 2025 03:07:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-28 12:12:30.170391
- Title: BGM: Background Mixup for X-ray Prohibited Items Detection
- Title(参考訳): BGM:X線禁止項目検出のための背景混合
- Authors: Weizhe Liu, Renshuai Tao, Hongguang Zhu, Yunda Sun, Yao Zhao, Yunchao Wei,
- Abstract要約: background Mixup (BGM) は、X線セキュリティ画像領域に適したバックグラウンドベースの拡張技術である。
従来の方法とは異なり、BGMは物理特性の詳細な分析に基づいている。
BGMは,1) テクスチャ構造と2) 材料の変化の両方の領域に背景パッチを混合し,複雑な背景手がかりのモデルに役立てる。
- 参考スコア(独自算出の注目度): 75.58709178012502
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current data-driven approaches for X-ray prohibited items detection remain under-explored, particularly in the design of effective data augmentations. Existing natural image augmentations for reflected light imaging neglect the data characteristics of X-ray security images. Moreover, prior X-ray augmentation methods have predominantly focused on foreground prohibited items, overlooking informative background cues. In this paper, we propose Background Mixup (BGM), a background-based augmentation technique tailored for X-ray security imaging domain. Unlike conventional methods, BGM is founded on an in-depth analysis of physical properties including: 1) X-ray Transmission Imagery: Transmitted X-ray pixels represent composite information from multiple materials along the imaging path. 2) Material-based Pseudo-coloring: Pseudo-coloring in X-ray images correlates directly with material properties, aiding in material distinction. Building upon the above insights, BGM mixes background patches across regions on both 1) texture structure and 2) material variation, to benefit models from complicated background cues. This enhances the model's capability to handle domain-specific challenges such as occlusion-induced discriminative imbalance. Importantly, BGM is orthogonal and fully compatible with existing foreground-focused augmentation techniques, enabling joint use to further enhance detection performance. Extensive experiments on multiple X-ray security benchmarks show that BGM consistently surpasses strong baselines, without additional annotations or significant training overhead. This work pioneers the exploration of background-aware augmentation in X-ray prohibited items detection and provides a lightweight, plug-and-play solution with broad applicability.
- Abstract(参考訳): 現在のデータ駆動によるX線検出禁止項目の検出は、特に効果的なデータ拡張の設計において未調査のままである。
反射光画像のための既存の自然画像拡張は、X線セキュリティ画像のデータ特性を無視する。
また, 従来のX線増進法は, 前景禁止項目を中心に, 情報的背景手がかりを見越して, 主に焦点を絞っている。
本稿では,X線セキュリティ画像領域に適したバックグラウンドベース拡張技術であるバックグラウンド・ミックスアップ(BGM)を提案する。
従来の方法とは異なり、BGMは次のような物理特性の詳細な分析に基づいて構築されている。
1) 透過X線画像: 透過X線画素は、撮像経路に沿った複数の材料からの合成情報を表す。
2) 材料による擬似着色:X線画像における擬似着色は, 材料特性と直接相関し, 材料識別に寄与する。
上記の知見に基づいて、BGMは両方のリージョンに背景パッチを混ぜる
1)テクスチャの構造と構造
2) 複雑な背景条件からモデルを構築するため, 材料の変化を考慮に入れた。
これにより、オクルージョンによって引き起こされる差別的不均衡のようなドメイン固有の課題を扱うモデルの性能が向上する。
重要なことは、BGMは直交しており、既存の前景に焦点を当てた拡張技術と完全に互換性があり、共同使用により検出性能がさらに向上する。
複数のX線セキュリティベンチマークに関する大規模な実験は、BGMが強いベースラインを一貫して上回り、追加のアノテーションやトレーニングのオーバーヘッドを伴わないことを示している。
この研究は、X線による禁止アイテムの検出における背景認識強化の探索の先駆者であり、幅広い適用性を備えた軽量なプラグアンドプレイソリューションを提供する。
関連論文リスト
- Superpowering Open-Vocabulary Object Detectors for X-ray Vision [53.07098133237041]
オープンボキャブラリオブジェクト検出(OvOD)は、X線スキャンで任意のアイテムを認識できるようにすることで、セキュリティスクリーニングに革命をもたらす。
RAXOは市販のRGB OvOD検出器を高強度X線検出に活用するフレームワークである。
RAXOはデュアルソース検索戦略を用いて高品質なX線クラス記述子を構築する。
論文 参考訳(メタデータ) (2025-03-21T11:54:16Z) - X-Field: A Physically Grounded Representation for 3D X-ray Reconstruction [25.13707706037451]
医療診断にはX線撮影が不可欠であるが、その使用は潜在的な健康リスクのために厳しく規制されている。
最近の研究は、スパース入力から新しいビューを生成し、CT(Computed Tomography)ボリュームを再構築することに焦点を当てている。
我々はX線画像に特化して設計された最初の3D表現であるX-Fieldを紹介する。
論文 参考訳(メタデータ) (2025-03-11T16:31:56Z) - Augmentation Matters: A Mix-Paste Method for X-Ray Prohibited Item Detection under Noisy Annotations [52.065764858163476]
公共の安全のためには、自動X線禁止アイテム検出が不可欠である。
既存のディープラーニングベースの手法はすべて、X線画像のトレーニングのアノテーションが正しいことを前提としている。
ラベル対応混合パッチペースト増量法(Mix-Paste)を提案する。
我々は,ノイズの多いアノテーションの下で,X線データセット上での手法の優位性を示す。
論文 参考訳(メタデータ) (2025-01-03T09:51:51Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Dual-view X-ray Detection: Can AI Detect Prohibited Items from Dual-view X-ray Images like Humans? [78.26435264182763]
大規模デュアルビューX線(LDXray)を導入し,12のカテゴリで353,646個のインスタンスで構成されている。
デュアルビュー検出におけるヒューマンインテリジェンスをエミュレートするために,補助ビュー拡張ネットワーク(AENet)を提案する。
LDXrayデータセットの実験では、デュアルビュー機構が検出性能を大幅に向上することを示した。
論文 参考訳(メタデータ) (2024-11-27T06:36:20Z) - Enhancing Prohibited Item Detection through X-ray-Specific Augmentation and Contextual Feature Integration [81.11400642272976]
X線は、長い尾の分布とX線イメージングの特徴のために、アイテム検出が禁止されている。
コピーペーストやミックスアップのような従来のデータ拡張戦略は、まれなアイテムの検出を改善するのに効果がない。
これらの課題に対処するために,X-ray Imaging-driven Detection Network (XIDNet)を提案する。
論文 参考訳(メタデータ) (2024-11-27T06:13:56Z) - HF-Fed: Hierarchical based customized Federated Learning Framework for X-Ray Imaging [0.0]
臨床応用では、X線技術はマンモグラフィーのような非侵襲的な検査に不可欠であり、重要な解剖学的情報を提供する。
X線再構成は、内部構造の詳細な視覚的表現、診断や治療を侵襲的に行うことなく行うための医療画像において重要である。
近年の深層学習の進歩はX線再構成において有望であるが,従来のDL手法では大規模なデータセットの集約を必要とすることが多い。
本稿では,HF-Fed(Hierarchical Framework-based Federated Learning method)を導入し,X線画像のカスタマイズを行う。
論文 参考訳(メタデータ) (2024-07-25T05:21:48Z) - Parents and Children: Distinguishing Multimodal DeepFakes from Natural Images [60.34381768479834]
近年の拡散モデルの発展により、自然言語のテキストプロンプトから現実的なディープフェイクの生成が可能になった。
我々は、最先端拡散モデルにより生成されたディープフェイク検出に関する体系的研究を開拓した。
論文 参考訳(メタデータ) (2023-04-02T10:25:09Z) - Employing similarity to highlight differences: On the impact of
anatomical assumptions in chest X-ray registration methods [2.080328156648695]
我々は,国立衛生研究所(NIH)データセット上に,解剖学的にペナル化した畳み込み型多段階解を開発した。
本手法は,ワープフィールドの折り畳み率を技術状態の1/6に制限する自然な方法であることを示す。
本手法の利点を統計的に評価し,胸部X線登録における現在使用されている指標の限界を強調した。
論文 参考訳(メタデータ) (2023-01-23T09:42:49Z) - On the impact of using X-ray energy response imagery for object
detection via Convolutional Neural Networks [17.639472693362926]
我々は,X線エネルギー応答(高,低)と有効Zの影響について,測地値と比較して検討した。
我々は、CNNアーキテクチャを評価し、そのような「Raw」変種画像で訓練されたモデルの転送可能性について検討する。
論文 参考訳(メタデータ) (2021-08-27T21:28:28Z) - Cross-Modal Contrastive Learning for Abnormality Classification and
Localization in Chest X-rays with Radiomics using a Feedback Loop [63.81818077092879]
医療画像のためのエンドツーエンドのセミスーパーバイスドクロスモーダルコントラスト学習フレームワークを提案する。
まず、胸部X線を分類し、画像特徴を生成するために画像エンコーダを適用する。
放射能の特徴は別の専用エンコーダを通過し、同じ胸部x線から生成された画像の特徴の正のサンプルとして機能する。
論文 参考訳(メタデータ) (2021-04-11T09:16:29Z) - Image Separation with Side Information: A Connected Auto-Encoders Based
Approach [18.18248997032482]
両面画像のX線画像から混合X線画像を分離する問題に対処する。
本稿では,混合X線画像を両面に対応する2つの模擬X線画像に分離する「接続型」オートエンコーダに基づくニューラルニューラルネットワークアーキテクチャを提案する。
これらの実験により, 提案手法は, 最先端のX線画像分離法よりも高い性能を示した。
論文 参考訳(メタデータ) (2020-09-16T18:39:42Z) - Occluded Prohibited Items Detection: an X-ray Security Inspection
Benchmark and De-occlusion Attention Module [50.75589128518707]
我々はOPIXrayというセキュリティ検査のための最初の高品質なオブジェクト検出データセットをコントリビュートする。
OPIXrayは、空港のプロの検査官が手動で注記した「カッター」に焦点をあてた。
本稿では,プラグイン・アンド・プレイモジュールであるデオクルージョン・アテンション・モジュール(DOAM)を提案する。
論文 参考訳(メタデータ) (2020-04-18T16:10:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。