論文の概要: Superpowering Open-Vocabulary Object Detectors for X-ray Vision
- arxiv url: http://arxiv.org/abs/2503.17071v1
- Date: Fri, 21 Mar 2025 11:54:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 14:56:40.548037
- Title: Superpowering Open-Vocabulary Object Detectors for X-ray Vision
- Title(参考訳): X線ビジョンのための超高出力オープンボキャブラリ物体検出器
- Authors: Pablo Garcia-Fernandez, Lorenzo Vaquero, Mingxuan Liu, Feng Xue, Daniel Cores, Nicu Sebe, Manuel Mucientes, Elisa Ricci,
- Abstract要約: オープンボキャブラリオブジェクト検出(OvOD)は、X線スキャンで任意のアイテムを認識できるようにすることで、セキュリティスクリーニングに革命をもたらす。
RAXOは市販のRGB OvOD検出器を高強度X線検出に活用するフレームワークである。
RAXOはデュアルソース検索戦略を用いて高品質なX線クラス記述子を構築する。
- 参考スコア(独自算出の注目度): 53.07098133237041
- License:
- Abstract: Open-vocabulary object detection (OvOD) is set to revolutionize security screening by enabling systems to recognize any item in X-ray scans. However, developing effective OvOD models for X-ray imaging presents unique challenges due to data scarcity and the modality gap that prevents direct adoption of RGB-based solutions. To overcome these limitations, we propose RAXO, a training-free framework that repurposes off-the-shelf RGB OvOD detectors for robust X-ray detection. RAXO builds high-quality X-ray class descriptors using a dual-source retrieval strategy. It gathers relevant RGB images from the web and enriches them via a novel X-ray material transfer mechanism, eliminating the need for labeled databases. These visual descriptors replace text-based classification in OvOD, leveraging intra-modal feature distances for robust detection. Extensive experiments demonstrate that RAXO consistently improves OvOD performance, providing an average mAP increase of up to 17.0 points over base detectors. To further support research in this emerging field, we also introduce DET-COMPASS, a new benchmark featuring bounding box annotations for over 300 object categories, enabling large-scale evaluation of OvOD in X-ray. Code and dataset available at: https://github.com/PAGF188/RAXO.
- Abstract(参考訳): オープンボキャブラリオブジェクト検出(OvOD)は、X線スキャンで任意のアイテムを認識できるようにすることで、セキュリティスクリーニングに革命をもたらす。
しかし、X線画像のための有効なOvODモデルの開発は、データ不足とRGBベースのソリューションの直接適用を妨げるモダリティギャップにより、ユニークな課題を呈している。
これらの制限を克服するため, RAXOは, 既製のRGB OvOD検出器を有効利用し, 堅牢なX線検出を行う。
RAXOはデュアルソース検索戦略を用いて高品質なX線クラス記述子を構築する。
ウェブから関連するRGB画像を収集し、新しいX線物質移動機構を通じて強化し、ラベル付きデータベースの必要性をなくす。
これらの視覚ディスクリプタはOvODのテキストベースの分類を置き換え、モダル内特徴距離を利用してロバストな検出を行う。
大規模な実験により、RAXOはOvODの性能を一貫して改善し、ベース検出器よりも平均17.0ポイントまで平均的なmAP向上をもたらすことが示されている。
この新興分野の研究をさらに支援するために,300以上のオブジェクトカテゴリに対するバウンディングボックスアノテーションを備えた新しいベンチマークであるDET-COMPASSを導入し,X線におけるOvODの大規模評価を可能にした。
コードとデータセットは、https://github.com/PAGF188/RAXO.comで入手できる。
関連論文リスト
- Fan-Beam CT Reconstruction for Unaligned Sparse-View X-ray Baggage Dataset [0.0]
不整合多視点X線バッグデータを用いたキャリブレーションと再構成手法を提案する。
提案手法は,多スペクトル神経減衰場再構成とLinear pushbroom (LPB) カメラモデルを用いたポーズ最適化を組み合わせたものである。
論文 参考訳(メタデータ) (2024-12-04T05:16:54Z) - BGM: Background Mixup for X-ray Prohibited Items Detection [75.58709178012502]
本稿では,X線画像固有の特徴を活かして,禁止項目検出に適した新しいデータ拡張手法を提案する。
1) X線透過画像: 反射光画像とは異なり、透過X線画素は、撮像経路に沿った複数の材料からの合成情報を表す。
本稿では,セキュリティスクリーニングにおけるアイテム検出の禁止を目的とした,単純かつ効果的なX線画像強調手法であるバックグラウンドミキサップ(BGM)を提案する。
論文 参考訳(メタデータ) (2024-11-30T12:26:55Z) - Enhancing Prohibited Item Detection through X-ray-Specific Augmentation and Contextual Feature Integration [81.11400642272976]
X線は、長い尾の分布とX線イメージングの特徴のために、アイテム検出が禁止されている。
コピーペーストやミックスアップのような従来のデータ拡張戦略は、まれなアイテムの検出を改善するのに効果がない。
これらの課題に対処するために,X-ray Imaging-driven Detection Network (XIDNet)を提案する。
論文 参考訳(メタデータ) (2024-11-27T06:13:56Z) - Open-Vocabulary X-ray Prohibited Item Detection via Fine-tuning CLIP [6.934570446284497]
蒸留をベースとしたオープン語彙オブジェクト検出タスクをX線セキュリティ検査領域に導入する。
検知器が訓練された基準カテゴリを超えた、新しい禁止アイテムカテゴリを検出することを目的としている。
X線機能アダプタをOVODフレームワーク内のCLIPに適用し、OVXDモデルを開発する。
論文 参考訳(メタデータ) (2024-06-16T14:42:52Z) - AO-DETR: Anti-Overlapping DETR for X-Ray Prohibited Items Detection [6.603436370737025]
本稿では,最先端の汎用物体検出器であるDINOをベースとした抗オーバーラップ型DETR(AO-DETR)を提案する。
重なり合う現象に起因する特徴結合問題に対処するために,カテゴリー特化ワン・ツー・ワン・アサインメント(CSA)戦略を導入する。
重複現象によるエッジのぼかし問題に対処するため,Look Forwardlyスキームを提案する。
論文 参考訳(メタデータ) (2024-03-07T08:30:17Z) - Generative Residual Attention Network for Disease Detection [51.60842580044539]
本稿では, 条件付き生成逆学習を用いたX線疾患発生のための新しいアプローチを提案する。
我々は,患者の身元を保存しながら,対象領域に対応する放射線画像を生成する。
次に、ターゲット領域で生成されたX線画像を用いてトレーニングを増強し、検出性能を向上させる。
論文 参考訳(メタデータ) (2021-10-25T14:15:57Z) - On the impact of using X-ray energy response imagery for object
detection via Convolutional Neural Networks [17.639472693362926]
我々は,X線エネルギー応答(高,低)と有効Zの影響について,測地値と比較して検討した。
我々は、CNNアーキテクチャを評価し、そのような「Raw」変種画像で訓練されたモデルの転送可能性について検討する。
論文 参考訳(メタデータ) (2021-08-27T21:28:28Z) - Tensor Pooling Driven Instance Segmentation Framework for Baggage Threat
Recognition [39.40595024569702]
バッグX線スキャンにおける乱雑なコントラバンドデータを識別するためのマルチスケール・コントラル・インスタンス・セグメンテーション・フレームワークを提案する。
提案されたフレームワークは、GDXray、SIXray、OPIXrayと呼ばれる3つの公開データセットで厳格に検証されている。
我々の知る限りでは、マルチスケール情報を活用する最初の輪郭インスタンスセグメンテーションフレームワークであり、乱れや隠蔽されたコントラバンドデータを認識する。
論文 参考訳(メタデータ) (2021-08-22T00:04:58Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Occluded Prohibited Items Detection: an X-ray Security Inspection
Benchmark and De-occlusion Attention Module [50.75589128518707]
我々はOPIXrayというセキュリティ検査のための最初の高品質なオブジェクト検出データセットをコントリビュートする。
OPIXrayは、空港のプロの検査官が手動で注記した「カッター」に焦点をあてた。
本稿では,プラグイン・アンド・プレイモジュールであるデオクルージョン・アテンション・モジュール(DOAM)を提案する。
論文 参考訳(メタデータ) (2020-04-18T16:10:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。