論文の概要: GSA-YOLO: A High-Efficiency Framework via Structured Sparsity and Adaptive Knowledge Distillation for Real-Time X-ray Security Inspection
- arxiv url: http://arxiv.org/abs/2605.20669v1
- Date: Wed, 20 May 2026 03:36:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.464119
- Title: GSA-YOLO: A High-Efficiency Framework via Structured Sparsity and Adaptive Knowledge Distillation for Real-Time X-ray Security Inspection
- Title(参考訳): GSA-YOLO: リアルタイムX線セキュリティ検査のための構造化空間と適応的知識蒸留による高効率フレームワーク
- Authors: Jiahao Kong,
- Abstract要約: 本稿では,YOLOv8nアーキテクチャ上に構築された軽量なフレームワークであるGSA-YOLOを提案する。
GSA-YOLOは3つのコアコンポーネントを通して構造化された空間性と適応的な知識伝達を戦略的に統合する。
予測速度は189.62 FPSで、計算コストは8.7Gから8.0Gに削減された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: X-ray security inspection requires accurate real-time detection of prohibited items, but existing models often struggle to balance the challenges of severe occlusion, complex clutter, and strict speed requirements. To overcome these challenges, this paper proposes GSA-YOLO, a novel lightweight framework built upon the YOLOv8n architecture, specifically engineered to enhance detection robustness and inference efficiency. GSA-YOLO strategically integrates structured sparsity and adaptive knowledge transfer through three core components: Group Lasso (GL) applied to the network neck for robust feature extraction; Sparse Structure Selection (SSS) applied to the detection head for significant model slimming; and an Adaptive Knowledge Distillation (Ada-KD) mechanism for comprehensive accuracy recovery. This integrated approach synergistically enhances feature representation while pruning redundant channels, maximizing model efficiency without sacrificing performance. Rigorous evaluations on the HiXray and PIDray datasets confirm GSA-YOLO's comprehensive capability, achieving a leading inference speed of 189.62 FPS, accompanied by a reduction in computational cost from 8.7G to 8.0G. Crucially, GSA-YOLO secures mAP50:95 results of 0.531 and 0.679 on HiXray and PIDray, demonstrating 2.4% and 1.8% improvements over the baseline, respectively. Compared to other models, GSA-YOLO exhibits enhanced accuracy while maintaining computational efficiency, making it a promising solution for practical X-ray security inspection.
- Abstract(参考訳): X線セキュリティ検査は、禁止アイテムの正確なリアルタイム検出を必要とするが、既存のモデルは、厳密な閉塞、複雑な乱雑、厳密な速度要求の課題のバランスをとるのに苦労することが多い。
これらの課題を克服するために, YOLOv8nアーキテクチャ上に構築された新しい軽量フレームワークであるGSA-YOLOを提案する。
GSA-YOLOは、ネットワークネックに印加されたグループラッソ(GL)、重要なモデルスリム化のための検出ヘッドに印加されたスパース構造選択(SSS)、包括的精度回復のための適応的知識蒸留(Ada-KD)メカニズムの3つのコアコンポーネントを通して構造化されたスパーシティと適応的知識伝達を戦略的に統合する。
この統合アプローチは、冗長チャネルをプルーニングしながら特徴表現を相乗的に強化し、性能を犠牲にすることなくモデル効率を最大化する。
HiXrayとPIDrayのデータセットの厳密な評価により、GSA-YOLOの総合的な能力が確認され、計算コストが8.7Gから8.0Gに削減された189.62 FPSの予測速度が達成された。
GSA-YOLOは、HXrayとPIDrayで0.531と0.679のmAP50:95結果を確保し、それぞれ2.4%と1.8%の改善を示した。
他のモデルと比較すると、GSA-YOLOは計算効率を保ちながら精度が向上しており、実用的なX線セキュリティ検査には有望なソリューションである。
関連論文リスト
- RSGMamba: Reliability-Aware Self-Gated State Space Model for Multimodal Semantic Segmentation [41.11292233905035]
シーン理解を強化するための強力なパラダイムとして、クロスモーダルなセマンティックセマンティックセマンティクスが登場した。
本稿では、信頼性を考慮した自己ゲート状態空間モデル(RSGMamba)と呼ばれる新しいフレームワークを提案する。
本手法のコアとなるのは、信頼性を意識した自己ゲート型マンバブロック(RSGMB)であり、モダリティの信頼性を明示的にモデル化し、相互モーダル相互作用を動的に制御する。
論文 参考訳(メタデータ) (2026-04-14T05:51:15Z) - Amped: Adaptive Multi-stage Non-edge Pruning for Edge Detection [53.59823657644554]
エッジ検出のための適応型多段非エッジプルーニングフレームワーク(Amped)を提案する。
Ampedは高信頼の非エッジトークンを識別し、可能な限り早く削除し、計算を大幅に削減する。
既存のエッジ検出ネットワークの構造的複雑さを軽減するため,Streamline Edge Detector(SED)と呼ばれる,シンプルながら高性能なTransformerベースのモデルを導入する。
論文 参考訳(メタデータ) (2026-03-29T12:26:35Z) - Adaptive Enhancement and Dual-Pooling Sequential Attention for Lightweight Underwater Object Detection with YOLOv10 [0.0]
この原稿では、YOLOv10アーキテクチャを基盤として、水中オブジェクト検出のための合理化されながら堅牢なフレームワークを紹介している。
提案手法は,画像品質向上のためのマルチステージ適応拡張モジュールと,マルチスケール特徴表現を強化するためのデュアルプールシーケンスアテンション機構を統合した。
論文 参考訳(メタデータ) (2026-03-04T07:39:57Z) - Modified TSception for Analyzing Driver Drowsiness and Mental Workload from EEG [6.767263284839525]
ドライバーの眠気は依然として交通事故の主な原因であり、リアルタイムで信頼性の高い検知システムの開発を必要としている。
本研究は,脳波を用いたドライバ疲労のロバスト評価を目的とした改良型TSceptionアーキテクチャを提案する。
アーキテクチャの一般化性は、STEWのメンタルワークロードデータセットで検証される。
論文 参考訳(メタデータ) (2025-12-25T17:48:11Z) - Fitness aligned structural modeling enables scalable virtual screening with AuroBind [56.720030595081845]
AuroBindは、100万規模のケモゲノミクスデータ上に、カスタム原子レベルの構造モデルを微調整するスケーラブルな仮想スクリーニングフレームワークである。
AuroBindは、直接選好最適化、高信頼錯体からの自己蒸留、教師-学生加速戦略を統合している。
AuroBindは10の疾患関連目標に対して、実験的なヒット率7-69%を達成し、トップ化合物はナノモラール下からピコモラールに到達した。
論文 参考訳(メタデータ) (2025-08-04T07:34:48Z) - SEEA-R1: Tree-Structured Reinforcement Fine-Tuning for Self-Evolving Embodied Agents [58.174206358223415]
自己進化型エボダイドエージェント(SeEA-R1)は、自己進化型エボダイドエージェント用に設計された最初の強化微細調整フレームワークである。
本研究は,SEEA-R1が自律適応と報酬駆動型自己進化をサポートすることを示す。
論文 参考訳(メタデータ) (2025-06-26T18:00:07Z) - An Optimal Cascade Feature-Level Spatiotemporal Fusion Strategy for Anomaly Detection in CAN Bus [2.8151714475955263]
インテリジェントトランスポートシステム(ITS)は、現代のインフラにおいて重要な役割を担っているが、車内コントローラエリアネットワーク(CAN)バスの放送特性により、セキュリティ上のリスクに直面している。
提案したフレームワークは、100%精度で全ての攻撃タイプを検出し、最先端の手法より優れている。
論文 参考訳(メタデータ) (2025-01-31T00:36:08Z) - Enhanced PEC-YOLO for Detecting Improper Safety Gear Wearing Among Power Line Workers [0.0]
本稿では,PEC-YOLOオブジェクト検出アルゴリズムを提案する。
この手法は、深層認識とマルチスケール特徴融合を統合する。
CPCAアテンションメカニズムはSPPFモジュールに組み込まれ、重要な情報にフォーカスするモデルの能力を向上させる。
論文 参考訳(メタデータ) (2025-01-23T04:40:08Z) - UncertaintyRAG: Span-Level Uncertainty Enhanced Long-Context Modeling for Retrieval-Augmented Generation [93.38604803625294]
IncertaintyRAG, a novel approach for long-context Retrieval-Augmented Generation (RAG)について紹介する。
我々は、SNR(Signal-to-Noise Ratio)ベースのスパン不確実性を用いて、テキストチャンク間の類似性を推定する。
不確かさRAGはLLaMA-2-7Bでベースラインを2.03%上回り、最先端の結果を得る。
論文 参考訳(メタデータ) (2024-10-03T17:39:38Z) - A Computer Vision Enabled damage detection model with improved YOLOv5
based on Transformer Prediction Head [0.0]
現在の最先端ディープラーニング(DL)に基づく損傷検出モデルは、複雑でノイズの多い環境では優れた特徴抽出能力を欠いていることが多い。
DenseSPH-YOLOv5は、DenseNetブロックをバックボーンに統合したリアルタイムDLベースの高性能損傷検出モデルである。
DenseSPH-YOLOv5は平均平均精度(mAP)が85.25%、F1スコアが81.18%、精度(P)が89.51%である。
論文 参考訳(メタデータ) (2023-03-07T22:53:36Z) - HERO: Hessian-Enhanced Robust Optimization for Unifying and Improving
Generalization and Quantization Performance [43.478851400266926]
我々は、勾配に基づく学習プロセスを通じて、ヘッセン固有値を最小限に抑えるため、ヘッセンで強化された頑健な最適化手法HEROを提案する。
HEROは試験精度を最大3.8%向上させ、80%のトレーニングラベル摂動で最大30%高い精度を達成し、幅広い精度で最高のトレーニング後の量子化精度を実現する。
論文 参考訳(メタデータ) (2021-11-23T16:32:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。