論文の概要: Attention-Augmented YOLOv8 with Ghost Convolution for Real-Time Vehicle Detection in Intelligent Transportation Systems
- arxiv url: http://arxiv.org/abs/2604.22856v1
- Date: Wed, 22 Apr 2026 14:09:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:06.999267
- Title: Attention-Augmented YOLOv8 with Ghost Convolution for Real-Time Vehicle Detection in Intelligent Transportation Systems
- Title(参考訳): 知的交通システムにおけるリアルタイム車両検出のためのゴーストコンボリューションを用いた注意増強型YOLOv8
- Authors: Syed Sajid Ullah, Muhammad Zunair Zamir, Ahsan Ishfaq, Salman Khan,
- Abstract要約: 本稿では,Ghost Module, Convolutional Block Attention Module, Deformable Convolutional Networks v2を統合したYOLOv8nベースの拡張モデルを提案する。
提案されたモデルは、ベースラインのYOLOv8nよりも8.97%、精度96.2%、リコール93.7%、F1スコア94.93%向上している。
- 参考スコア(独自算出の注目度): 11.507914098454421
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate vehicle detection is a critical component of autonomous driving, traffic surveillance, and intelligent transportation systems. This paper presents an enhanced YOLOv8n-based model that integrates the Ghost Module, Convolutional Block Attention Module (CBAM), and Deformable Convolutional Networks v2 (DCNv2) to improve detection performance. The Ghost Module reduces feature redundancy through efficient feature generation, CBAM refines feature representation via channel and spatial attention, and DCNv2 enhances adaptability to geometric variations in vehicle structures. Evaluated on the KITTI dataset, the proposed model achieves 95.4% mAP@0.5, representing an 8.97% improvement over the baseline YOLOv8n, along with 96.2% precision, 93.7% recall, and a 94.93% F1-score. Comparative analysis against seven state-of-the-art detectors demonstrates consistent superiority across key performance metrics, while ablation studies validate the individual and combined contributions of the integrated modules. By addressing feature redundancy, attention refinement, and spatial adaptability, the proposed approach offers a robust and computationally efficient solution for vehicle detection in diverse and complex traffic environments.
- Abstract(参考訳): 正確な車両検出は、自動運転、交通監視、インテリジェント交通システムにおいて重要な要素である。
本稿では,Ghost Module, Convolutional Block Attention Module (CBAM), Deformable Convolutional Networks v2 (DCNv2)を統合したYOLOv8nモデルを提案する。
ゴーストモジュールは効率的な特徴生成によって特徴の冗長性を低減し、CBAMはチャネルと空間的注意を通して特徴の表現を洗練し、DCNv2は車両構造の幾何学的変動への適応性を高める。
KITTIデータセットに基づいて、提案されたモデルは95.4% mAP@0.5を達成し、ベースラインのYOLOv8nよりも8.97%改善し、96.2%の精度、93.7%のリコール、94.93%のF1スコアを記録した。
7つの最先端検出器の比較分析は、主要な性能指標間で一貫した優位性を示す一方、アブレーション研究では、統合されたモジュールの個々のコントリビューションと組み合わせたコントリビューションを検証する。
特徴冗長性,注目度向上,空間適応性に対処することにより,多様な複雑な交通環境下での車両検出に対して,頑健で効率的な解法を提案する。
関連論文リスト
- YOLO-DS: Fine-Grained Feature Decoupling via Dual-Statistic Synergy Operator for Object Detection [55.58092342624062]
DSO(Dual-Statistic Synergy Operator)を中心に構築されたYOLO-DSを提案する。
YOLO-DSは、チャネル平均とピーク平均差を共同でモデル化することにより、オブジェクトの特徴を分離する。
MS-COCOベンチマークでは、YOLO-DSは5つのモデルスケールでYOLOv8を上回っている。
論文 参考訳(メタデータ) (2026-01-26T05:50:32Z) - Vehicle-to-Infrastructure Collaborative Spatial Perception via Multimodal Large Language Models [41.00138090010061]
大型言語モデル (MLLM) の限界を克服するために, 軽量でプラグアンドプレイの鳥眼ビュー (BEV) インジェクションコネクタを提案する。
レイトレーシングはRGB、LiDAR、GPS、無線信号データを様々なセンシングシナリオで生成するために開発された。
シミュレーションの結果,提案したBEVインジェクションフレームワークは全タスクのパフォーマンスを継続的に改善していることがわかった。
論文 参考訳(メタデータ) (2025-09-04T02:57:47Z) - A Lightweight Convolution and Vision Transformer integrated model with Multi-scale Self-attention Mechanism [41.02402160100821]
Vision Transformer (ViT) は、長距離依存モデリング能力の強いコンピュータビジョンタスクで普及している。
本稿では,細かな注意(SAEViTと呼ばれる)と畳み込みブロックを持つ効率的なViTモデルを提案する。
主流データセットの実験では、SAEViTはImageNet-1K分類タスクで76.3%と79.6%のTop-1アキュラシーを達成した。
論文 参考訳(メタデータ) (2025-08-23T03:05:34Z) - YOLO11-CR: a Lightweight Convolution-and-Attention Framework for Accurate Fatigue Driving Detection [0.0]
本稿では,リアルタイム疲労モニタリングに適した軽量で効率的な物体検出モデルYOLO11-CRを提案する。
YOLO11-CR は Convolution-and-Attention Fusion Module (CAFM) と Rectangular Module (RCM) の2つの重要なモジュールを導入した。
DSMデータセットの実験では、YOLO11-CRは87.17%の精度、83.86%のリコール、88.09%のmAP@50、55.93%のmAP@50-95を達成した。
論文 参考訳(メタデータ) (2025-08-16T07:19:04Z) - YOLO-APD: Enhancing YOLOv8 for Robust Pedestrian Detection on Complex Road Geometries [0.0]
本稿では,この課題に特化してYOLOv8フレームワークを改良した新しいディープラーニングアーキテクチャであるYOLO-APDを紹介する。
YOLO-APDは最先端の精度を達成し、77.7% mAP@0.5:0.95、例外的な歩行者リコールは96%を超えた。
リアルタイム処理能力を100 FPSで維持し、精度と効率のバランスが優れていることを示す。
論文 参考訳(メタデータ) (2025-07-07T18:03:40Z) - Enhancing Traffic Sign Recognition On The Performance Based On Yolov8 [0.0]
この論文では、高度なデータ拡張技術を統合する拡張YOLOv8ベースの検出システムを提案する。
GTSRB、TT100K、GTSDBなどのデータセットで実施された実験では、検出精度、悪条件下での堅牢性、エッジデバイス上でのリアルタイム推論が著しく改善された。
論文 参考訳(メタデータ) (2025-04-02T07:28:05Z) - YOLO-LLTS: Real-Time Low-Light Traffic Sign Detection via Prior-Guided Enhancement and Multi-Branch Feature Interaction [45.79993863157494]
YOLO-LLTSは、低照度環境向けに設計されたエンドツーエンドのリアルタイム信号検出アルゴリズムである。
YOLO-LLTSは、HRFM-SOD(High-Resolution Feature Map for Small Object Detection)、MFIA(Multi-branch Feature Interaction Attention)、PGFE(Presideed-Guided Feature Enhancement Module)の3つの主要なコントリビューションを紹介している。
実験の結果、YOLO-LLTSは最新技術の性能を達成し、TT100K-nightでは2.7% mAP50:95と1.6% mAP50:95よりも優れていた。
論文 参考訳(メタデータ) (2025-03-18T04:28:05Z) - Research on vehicle detection based on improved YOLOv8 network [0.0]
本稿では,改良型YOLOv8車両検出手法を提案する。
改良されたモデルは98.3%、89.1%、そして88.4%の精度で車、人、オートバイを検出できる。
論文 参考訳(メタデータ) (2024-12-31T06:19:26Z) - Optimization of Autonomous Driving Image Detection Based on RFAConv and Triplet Attention [1.345669927504424]
本稿では, YOLOv8モデルの拡張のための総合的アプローチを提案する。
C2f_RFAConvモジュールは、機能の抽出効率を高めるために元のモジュールを置き換える。
Triplet Attentionメカニズムは、ターゲット検出の強化のための特徴焦点を強化する。
論文 参考訳(メタデータ) (2024-06-25T08:59:33Z) - DR-TANet: Dynamic Receptive Temporal Attention Network for Street Scene
Change Detection [35.29786193920396]
本稿では,時間的注意の提示と時間的注意の依存性スコープサイズが変化検出の性能に及ぼす影響について検討する。
GSV', TSUNAMI', VL-CMU-CD'のストリートシーンデータセットでは, ベルや笛を使わずに新たな最先端のスコアが確立され, 優れた性能が得られる。
論文 参考訳(メタデータ) (2021-03-01T10:01:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。