論文の概要: Prohibited Items Segmentation via Occlusion-aware Bilayer Modeling
- arxiv url: http://arxiv.org/abs/2506.11661v1
- Date: Fri, 13 Jun 2025 10:48:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 17:50:49.755143
- Title: Prohibited Items Segmentation via Occlusion-aware Bilayer Modeling
- Title(参考訳): Occlusion-aware Bilayer Modeling による禁物セグメンテーション
- Authors: Yunhan Ren, Ruihuang Li, Lingbo Liu, Changwen Chen,
- Abstract要約: セキュリティX線画像における禁止アイテムのインスタンスセグメンテーションは、非常に重要な課題である。
これは主に、X線画像における禁止アイテムと自然物との間の顕著な外見ギャップによって引き起こされる。
本稿では,X線画像中の禁止項目を識別するオクルージョン対応のインスタンスセグメンテーションパイプラインを提案する。
- 参考スコア(独自算出の注目度): 31.75566926799125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Instance segmentation of prohibited items in security X-ray images is a critical yet challenging task. This is mainly caused by the significant appearance gap between prohibited items in X-ray images and natural objects, as well as the severe overlapping among objects in X-ray images. To address these issues, we propose an occlusion-aware instance segmentation pipeline designed to identify prohibited items in X-ray images. Specifically, to bridge the representation gap, we integrate the Segment Anything Model (SAM) into our pipeline, taking advantage of its rich priors and zero-shot generalization capabilities. To address the overlap between prohibited items, we design an occlusion-aware bilayer mask decoder module that explicitly models the occlusion relationships. To supervise occlusion estimation, we manually annotated occlusion areas of prohibited items in two large-scale X-ray image segmentation datasets, PIDray and PIXray. We then reorganized these additional annotations together with the original information as two occlusion-annotated datasets, PIDray-A and PIXray-A. Extensive experimental results on these occlusion-annotated datasets demonstrate the effectiveness of our proposed method. The datasets and codes are available at: https://github.com/Ryh1218/Occ
- Abstract(参考訳): セキュリティX線画像における禁止アイテムのインスタンスセグメンテーションは、非常に重要な課題である。
これは主に、X線画像における禁止アイテムと自然物との間の顕著な外見ギャップと、X線画像におけるオブジェクト間の重なり合いによって引き起こされる。
これらの問題に対処するために,X線画像中の禁止項目を識別するオクルージョン対応のインスタンスセグメンテーションパイプラインを提案する。
具体的には、表現ギャップを埋めるために、Segment Anything Model(SAM)をパイプラインに統合し、その豊富な事前とゼロショットの一般化機能を活用します。
禁止アイテム間の重複に対処するため,オクルージョン関係を明示的にモデル化したオクルージョン対応の2層マスクデコーダモジュールを設計する。
咬合推定を監督するため,2つの大規模X線画像分割データセット,PIDrayとPIXrayにおいて,禁止項目の咬合領域を手動でアノベートした。
次に、これらの追加アノテーションと元の情報を2つのオクルージョンアノテートデータセットであるPIDray-AとPIXray-Aとして再編成した。
これらのオクルージョンアノテートデータセットの大規模な実験結果から,提案手法の有効性が示された。
データセットとコードは、https://github.com/Ryh1218/Occ.comで公開されている。
関連論文リスト
- Augmentation Matters: A Mix-Paste Method for X-Ray Prohibited Item Detection under Noisy Annotations [52.065764858163476]
公共の安全のためには、自動X線禁止アイテム検出が不可欠である。
既存のディープラーニングベースの手法はすべて、X線画像のトレーニングのアノテーションが正しいことを前提としている。
ラベル対応混合パッチペースト増量法(Mix-Paste)を提案する。
我々は,ノイズの多いアノテーションの下で,X線データセット上での手法の優位性を示す。
論文 参考訳(メタデータ) (2025-01-03T09:51:51Z) - BGM: Background Mixup for X-ray Prohibited Items Detection [75.58709178012502]
本稿では,X線画像固有の特徴を活かして,禁止項目検出に適した新しいデータ拡張手法を提案する。
1) X線透過画像: 反射光画像とは異なり、透過X線画素は、撮像経路に沿った複数の材料からの合成情報を表す。
本稿では,セキュリティスクリーニングにおけるアイテム検出の禁止を目的とした,単純かつ効果的なX線画像強調手法であるバックグラウンドミキサップ(BGM)を提案する。
論文 参考訳(メタデータ) (2024-11-30T12:26:55Z) - SQUID: Deep Feature In-Painting for Unsupervised Anomaly Detection [76.01333073259677]
無線画像からの異常検出のための空間認識型メモリキューを提案する(略してSQUID)。
SQUIDは, 微細な解剖学的構造を逐次パターンに分類でき, 推測では画像中の異常(見えない/修正されたパターン)を識別できる。
論文 参考訳(メタデータ) (2021-11-26T13:47:34Z) - Tensor Pooling Driven Instance Segmentation Framework for Baggage Threat
Recognition [39.40595024569702]
バッグX線スキャンにおける乱雑なコントラバンドデータを識別するためのマルチスケール・コントラル・インスタンス・セグメンテーション・フレームワークを提案する。
提案されたフレームワークは、GDXray、SIXray、OPIXrayと呼ばれる3つの公開データセットで厳格に検証されている。
我々の知る限りでは、マルチスケール情報を活用する最初の輪郭インスタンスセグメンテーションフレームワークであり、乱れや隠蔽されたコントラバンドデータを認識する。
論文 参考訳(メタデータ) (2021-08-22T00:04:58Z) - Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark [53.9819155669618]
本稿では,PIDrayと命名された大規模データセットについて述べる。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
論文 参考訳(メタデータ) (2021-08-16T11:14:16Z) - Cross-Modal Contrastive Learning for Abnormality Classification and
Localization in Chest X-rays with Radiomics using a Feedback Loop [63.81818077092879]
医療画像のためのエンドツーエンドのセミスーパーバイスドクロスモーダルコントラスト学習フレームワークを提案する。
まず、胸部X線を分類し、画像特徴を生成するために画像エンコーダを適用する。
放射能の特徴は別の専用エンコーダを通過し、同じ胸部x線から生成された画像の特徴の正のサンプルとして機能する。
論文 参考訳(メタデータ) (2021-04-11T09:16:29Z) - Over-sampling De-occlusion Attention Network for Prohibited Items
Detection in Noisy X-ray Images [35.35752470993847]
セキュリティ検査は、スーツケースの個人持ち物のX線スキャンです。
一般的な画像認識データセットを通じてトレーニングされた従来のCNNベースのモデルは、このシナリオで十分なパフォーマンスを達成できない。
新規な脱閉塞注意モジュールと新しいオーバーサンプリングトレーニング戦略からなるオーバーサンプリング脱閉塞注意ネットワーク(DOAM-O)を提案する。
論文 参考訳(メタデータ) (2021-03-01T07:17:37Z) - Weakly-Supervised Segmentation for Disease Localization in Chest X-Ray
Images [0.0]
医用胸部X線画像のセマンティックセグメンテーションに対する新しいアプローチを提案する。
本手法は肺と胸壁の間の異常な空気量を検出するための胸部X線検査に適用可能である。
論文 参考訳(メタデータ) (2020-07-01T20:48:35Z) - Occluded Prohibited Items Detection: an X-ray Security Inspection
Benchmark and De-occlusion Attention Module [50.75589128518707]
我々はOPIXrayというセキュリティ検査のための最初の高品質なオブジェクト検出データセットをコントリビュートする。
OPIXrayは、空港のプロの検査官が手動で注記した「カッター」に焦点をあてた。
本稿では,プラグイン・アンド・プレイモジュールであるデオクルージョン・アテンション・モジュール(DOAM)を提案する。
論文 参考訳(メタデータ) (2020-04-18T16:10:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。