論文の概要: XSeg: A Large-scale X-ray Contraband Segmentation Benchmark For Real-World Security Screening
- arxiv url: http://arxiv.org/abs/2604.03706v1
- Date: Sat, 04 Apr 2026 12:23:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.732148
- Title: XSeg: A Large-scale X-ray Contraband Segmentation Benchmark For Real-World Security Screening
- Title(参考訳): XSeg: 大規模X線コントラバンドセグメンテーションベンチマーク
- Authors: Hongxia Gao, Litao Li, Yixin Chen, Jiali Wen, Kaijie Zhang, Qianyun Liu,
- Abstract要約: XSegは、98,644枚の画像と295,932枚のインスタンスマスクを含む、これまでで最大のX線コントラバンドセグメンテーションデータセットである。
APSAMはSegment Anything Model (SAM)上に構築された特殊なマスクアノテーションモデルである
XSegの実験では、APSAMの優れた性能が実証された。
- 参考スコア(独自算出の注目度): 6.574249234224137
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: X-ray contraband detection is critical for public safety. However, current methods primarily rely on bounding box annotations, which limit model generalization and performance due to the lack of pixel-level supervision and real-world data. To address these limitations, we introduce XSeg. To the best of our knowledge, XSeg is the largest X-ray contraband segmentation dataset to date, including 98,644 images and 295,932 instance masks, and contains the latest 30 common contraband categories. The images are sourced from public datasets and our synthesized data, filtered through a custom data cleaning pipeline to remove low-quality samples. To enable accurate and efficient annotation and reduce manual labeling effort, we propose Adaptive Point SAM (APSAM), a specialized mask annotation model built upon the Segment Anything Model (SAM). We address SAM's poor cross-domain generalization and limited capability in detecting stacked objects by introducing an Energy-Aware Encoder that enhances the initialization of the mask decoder, significantly improving sensitivity to overlapping items. Additionally, we design an Adaptive Point Generator that allows users to obtain precise mask labels with only a single coarse point prompt. Extensive experiments on XSeg demonstrate the superior performance of APSAM.
- Abstract(参考訳): X線コントラバンド検出は公共の安全のために重要である。
しかし、現在の手法は主にバウンディングボックスアノテーションに依存しており、ピクセルレベルの監視と実世界のデータがないため、モデルの一般化と性能が制限されている。
これらの制限に対処するため、XSegを導入します。
我々の知る限り、XSegは98,644の画像と295,932のインスタンスマスクを含む、これまでで最大のX線コントラバンドセグメンテーションデータセットであり、最新の30のコントラバンドカテゴリを含んでいる。
画像は、公開データセットと合成データからソースされ、カスタムデータクリーニングパイプラインを通してフィルタリングされ、低品質のサンプルを除去します。
そこで我々は,Segment Anything Model (SAM) 上に構築された特殊マスクアノテーションモデルであるAdaptive Point SAM (APSAM)を提案する。
本稿では,マスクデコーダの初期化を向上し,重なり合う項目に対する感度を著しく向上するEnergy-Aware Encoderを導入することで,SAMのクロスドメイン一般化とスタックオブジェクト検出能力の限界に対処する。
さらに,1つの粗い点プロンプトだけで正確なマスクラベルを取得できる適応点生成器を設計する。
XSegに関する大規模な実験は、APSAMの優れた性能を示している。
関連論文リスト
- Superpowering Open-Vocabulary Object Detectors for X-ray Vision [52.22062383117114]
オープンボキャブラリオブジェクト検出(OvOD)は、X線スキャンで任意のアイテムを認識できるようにすることで、セキュリティスクリーニングに革命をもたらす。
RAXOは市販のRGB OvOD検出器を高強度X線検出に活用するフレームワークである。
RAXOはデュアルソース検索戦略を用いて高品質なX線クラス記述子を構築する。
論文 参考訳(メタデータ) (2025-03-21T11:54:16Z) - Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - From Generalization to Precision: Exploring SAM for Tool Segmentation in
Surgical Environments [7.01085327371458]
セグメンテーションモデルでは, 汚損レベルの高い画像が大幅に過大評価され, 性能が低下する。
我々は,最高の単一マスクを予測として選択した場合のSAMの結果を分析するために,接地型ツールマスクを用いている。
本研究では,様々な強みの合成汚損データを用いて,Endovis18とEndovis17の計器セグメンテーションデータセットを解析した。
論文 参考訳(メタデータ) (2024-02-28T01:33:49Z) - PWISeg: Point-based Weakly-supervised Instance Segmentation for Surgical
Instruments [27.89003436883652]
我々はPWISeg (Point-based Weakly-supervised Instance) という,弱制御型手術器具セグメンテーション手法を提案する。
PWISegは、特徴点とバウンディングボックスの関係をモデル化するために、ポイント・ツー・ボックスとポイント・ツー・マスクのブランチを備えたFCNベースのアーキテクチャを採用している。
そこで本研究では,キー・ツー・マスク・ブランチを駆動し,より正確なセグメンテーション予測を生成するキー・ピクセル・アソシエーション・ロスとキー・ピクセル・アソシエーション・ロスを提案する。
論文 参考訳(メタデータ) (2023-11-16T11:48:29Z) - Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark [53.9819155669618]
本稿では,PIDrayと命名された大規模データセットについて述べる。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
論文 参考訳(メタデータ) (2021-08-16T11:14:16Z) - Occluded Prohibited Items Detection: an X-ray Security Inspection
Benchmark and De-occlusion Attention Module [50.75589128518707]
我々はOPIXrayというセキュリティ検査のための最初の高品質なオブジェクト検出データセットをコントリビュートする。
OPIXrayは、空港のプロの検査官が手動で注記した「カッター」に焦点をあてた。
本稿では,プラグイン・アンド・プレイモジュールであるデオクルージョン・アテンション・モジュール(DOAM)を提案する。
論文 参考訳(メタデータ) (2020-04-18T16:10:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。