論文の概要: A Novel Compression Framework for YOLOv8: Achiev-ing Real-Time Aerial Object Detection on Edge Devices via Structured Pruning and Channel-Wise Distillation
- arxiv url: http://arxiv.org/abs/2509.12918v1
- Date: Tue, 16 Sep 2025 10:11:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:53.026197
- Title: A Novel Compression Framework for YOLOv8: Achiev-ing Real-Time Aerial Object Detection on Edge Devices via Structured Pruning and Channel-Wise Distillation
- Title(参考訳): YOLOv8のための新しい圧縮フレームワーク:構造化プルーニングとチャネルワイズ蒸留によるエッジデバイス上のリアルタイム空中物体検出
- Authors: Melika Sabaghian, Mohammad Ali Keyvanrad, Seyyedeh Mahila Moghadami,
- Abstract要約: YOLOv8オブジェクト検出モデルのための新しい3段階圧縮パイプラインを提案する。
スパシティ対応トレーニング、構造化チャネルプルーニング、CWD(Channel-Wise Knowledge Distillation)が使用されている。
VisDroneデータセットの実験では、複数のYOLOv8変種にまたがるアプローチの有効性が示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient deployment of deep learning models for aerial object detection on resource-constrained devices requires significant compression without com-promising performance. In this study, we propose a novel three-stage compression pipeline for the YOLOv8 object detection model, integrating sparsity-aware training, structured channel pruning, and Channel-Wise Knowledge Distillation (CWD). First, sparsity-aware training introduces dynamic sparsity during model optimization, effectively balancing parameter reduction and detection accuracy. Second, we apply structured channel pruning by leveraging batch normalization scaling factors to eliminate redundant channels, significantly reducing model size and computational complexity. Finally, to mitigate the accuracy drop caused by pruning, we employ CWD to transfer knowledge from the original model, using an adjustable temperature and loss weighting scheme tailored for small and medium object detection. Extensive experiments on the VisDrone dataset demonstrate the effectiveness of our approach across multiple YOLOv8 variants. For YOLOv8m, our method reduces model parameters from 25.85M to 6.85M (a 73.51% reduction), FLOPs from 49.6G to 13.3G, and MACs from 101G to 34.5G, while reducing AP50 by only 2.7%. The resulting compressed model achieves 47.9 AP50 and boosts inference speed from 26 FPS (YOLOv8m baseline) to 45 FPS, enabling real-time deployment on edge devices. We further apply TensorRT as a lightweight optimization step. While this introduces a minor drop in AP50 (from 47.9 to 47.6), it significantly improves inference speed from 45 to 68 FPS, demonstrating the practicality of our approach for high-throughput, re-source-constrained scenarios.
- Abstract(参考訳): 資源制約されたデバイス上での空中物体検出のためのディープラーニングモデルの効率的な展開には、性能を損なうことなくかなりの圧縮が必要である。
本研究では, YOLOv8オブジェクト検出モデルのための新しい3段階圧縮パイプラインを提案し, 空間認識トレーニング, 構造化チャネルプルーニング, チャネルワイズ知識蒸留(CWD)を統合した。
まず,パラメータの削減と検出精度の効果的なバランスをとることで,モデル最適化時の動的疎結合を実現する。
第2に、バッチ正規化スケーリング因子を活用して、冗長チャネルを排除し、モデルサイズと計算複雑性を著しく低減し、構造化チャネルプルーニングを適用する。
最後に, 刈り込みによる精度低下を軽減するため, 小型・中型物体検出に適した温度・損失重み付け方式を用いて, CWDを用いて元のモデルから知識を伝達する。
VisDroneデータセットの大規模な実験は、複数のYOLOv8変種にまたがるアプローチの有効性を実証している。
YOLOv8mの場合、モデルパラメータを25.85Mから6.85M(73.51%削減)、FLOPを49.6Gから13.3Gに、MACを101Gから34.5Gに削減し、AP50をわずか2.7%削減する。
その結果、圧縮されたモデルは47.9 AP50を達成し、推論速度を26 FPS (YOLOv8m baseline) から45 FPSに引き上げ、エッジデバイスへのリアルタイムデプロイを可能にした。
さらに、軽量な最適化ステップとしてTensorRTを適用します。
これはAP50(47.9から47.6まで)の微減をもたらすが、推論速度を45から68FPSに大幅に改善し、高スループットで再ソース制約のあるシナリオに対する我々のアプローチの実践性を実証した。
関連論文リスト
- YOLO-ROC: A High-Precision and Ultra-Lightweight Model for Real-Time Road Damage Detection [0.0]
道路損傷検出は、交通安全を確保し、インフラの整合性を維持するための重要な課題である。
本稿では, 道路直交コンパクト(YOLO-ROC)の高精度軽量モデルを提案する。
論文 参考訳(メタデータ) (2025-07-31T03:35:19Z) - You Sense Only Once Beneath: Ultra-Light Real-Time Underwater Object Detection [2.5249064981269296]
超軽量リアルタイム水中物体検出フレームワークYSOOB(You Sense Only Beneath)を提案する。
具体的には、マルチスペクトルウェーブレット(MSWE)を用いて入力画像の周波数領域符号化を行い、水中光色歪みによる意味損失を最小限に抑える。
また、単純で効果的なチャネル圧縮によりモデル冗長性を排除し、モデル軽量化のために大カーネル畳み込み(RLKC)を再構築する。
論文 参考訳(メタデータ) (2025-04-22T08:26:35Z) - A lightweight model FDM-YOLO for small target improvement based on YOLOv8 [0.0]
小さいターゲットは、低いピクセル数、複雑な背景、様々な射撃角度のために検出が困難である。
本稿では,小目標検出に焦点をあて,低計算制約下での物体検出手法について検討する。
論文 参考訳(メタデータ) (2025-03-06T14:06:35Z) - LeYOLO, New Embedded Architecture for Object Detection [0.0]
MSCOCOをベース検証セットとして用いたオブジェクト検出モデルに2つの重要な貢献点を紹介する。
まず,SSDLiteに匹敵する推論速度を維持する汎用検出フレームワークであるLeNeckを提案する。
第2に, YOLOアーキテクチャにおける計算効率の向上を目的とした, 効率的なオブジェクト検出モデルであるLeYOLOを提案する。
論文 参考訳(メタデータ) (2024-06-20T12:08:24Z) - Data-Free Dynamic Compression of CNNs for Tractable Efficiency [46.498278084317704]
構造化プルーニング手法は, 精度が大幅に低下することなく浮動小数点演算を低下させる可能性を示唆している。
HASTE(Hashing for Tractable Efficiency)は,データフリーでプラグイン・アンド・プレイのコンボリューションモジュールで,トレーニングや微調整なしにネットワークのテスト時間推論コストを瞬時に低減する。
CIFAR-10とImageNetでは46.72%のFLOPを1.25%の精度で削減した。
論文 参考訳(メタデータ) (2023-09-29T13:09:40Z) - EdgeYOLO: An Edge-Real-Time Object Detector [69.41688769991482]
本稿では, 最先端のYOLOフレームワークをベースとした, 効率的で低複雑さかつアンカーフリーな物体検出器を提案する。
我々は,訓練中の過剰適合を効果的に抑制する拡張データ拡張法を開発し,小型物体の検出精度を向上させるためにハイブリッドランダム損失関数を設計する。
私たちのベースラインモデルは、MS 2017データセットで50.6%のAP50:95と69.8%のAP50、VisDrone 2019-DETデータセットで26.4%のAP50と44.8%のAP50に達し、エッジコンピューティングデバイスNvidia上でリアルタイム要求(FPS>=30)を満たす。
論文 参考訳(メタデータ) (2023-02-15T06:05:14Z) - Quantized Neural Networks for Low-Precision Accumulation with Guaranteed
Overflow Avoidance [68.8204255655161]
本稿では,推定時のアキュムレータの精度を下げる際に,数値オーバーフローを回避する量子化学習アルゴリズムを提案する。
本手法は,浮動小数点点ベースラインに対するモデル精度を維持しつつ,アキュムレータの精度を低減できることを示す。
論文 参考訳(メタデータ) (2023-01-31T02:46:57Z) - Channel Pruned YOLOv5-based Deep Learning Approach for Rapid and
Accurate Outdoor Obstacles Detection [6.703770367794502]
1段階のアルゴリズムは、大量のデータをトレーニングする必要があるターゲット検出システムで広く使われている。
畳み込み構造のため、より多くの計算能力とメモリ消費が必要である。
対象検出ネットワークにプルーニング戦略を適用し,パラメータ数とモデルサイズを削減した。
論文 参考訳(メタデータ) (2022-04-27T21:06:04Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - Non-Parametric Adaptive Network Pruning [125.4414216272874]
アルゴリズム設計を簡略化するノンパラメトリックモデリングを導入。
顔認識コミュニティに触発されて,メッセージパッシングアルゴリズムを用いて,適応的な例示数を求める。
EPrunerは「重要」フィルタを決定する際にトレーニングデータへの依存を壊します。
論文 参考訳(メタデータ) (2021-01-20T06:18:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。