論文の概要: Edge AI for Automotive Vulnerable Road User Safety: Deployable Detection via Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2604.26857v1
- Date: Wed, 29 Apr 2026 16:24:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.489107
- Title: Edge AI for Automotive Vulnerable Road User Safety: Deployable Detection via Knowledge Distillation
- Title(参考訳): 自動車用脆弱性のある道路安全のためのエッジAI:知識蒸留によるデプロイ可能な検出
- Authors: Akshay Karjol, Darrin M. Hanna,
- Abstract要約: 本稿では, YOLOv8-L 教師を模倣するために, コンパクトな YOLOv8-S 学生を訓練する知識蒸留フレームワークを提案する。
実際のBDD100K (70Kのトレーニング画像) について, INT8へのポストトレーニング量子化による評価を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deploying accurate object detection for Vulnerable Road User (VRU) safety on edge hardware requires balancing model capacity against computational constraints. Large models achieve high accuracy but fail under INT8 quantization required for edge deployment, while small models sacrifice detection performance. This paper presents a knowledge distillation (KD) framework that trains a compact YOLOv8-S student (11.2M parameters) to mimic a YOLOv8-L teacher (43.7M parameters), achieving 3.9x compression while preserving quantization robustness. We evaluate on full-scale BDD100K (70K training images) with Post-Training Quantization to INT8. The teacher suffers catastrophic degradation under INT8 (-23% mAP), while the KD student retains accuracy (-5.6% mAP). Analysis reveals that KD transfers precision calibration rather than raw detection capacity: the KD student achieves 0.748 precision versus 0.653 for direct training at INT8, a 14.5% gain at equivalent recall, reducing false alarms by 44% versus the collapsed teacher. At INT8, the KD student exceeds the teacher's FP32 precision (0.748 vs. 0.718) in a model 3.9x smaller. These findings establish knowledge distillation as a requirement for deploying accurate, safety-critical VRU detection on edge hardware.
- Abstract(参考訳): Vulnerable Road User(VRU)の安全性のための正確なオブジェクト検出をエッジハードウェアにデプロイするには、計算制約に対するモデルのキャパシティのバランスが必要である。
大きなモデルは高い精度を達成するが、エッジ展開に必要なINT8量子化では失敗し、小さなモデルは検出性能を犠牲にする。
本稿では,YOLOv8-L教師(43.7Mパラメータ)を模倣するために,コンパクトなYOLOv8-S学生(11.2Mパラメータ)を訓練し,量子化ロバスト性を維持しながら3.9倍の圧縮を実現する知識蒸留(KD)フレームワークを提案する。
実際のBDD100K (70Kのトレーニング画像) について, INT8へのポストトレーニング量子化による評価を行った。
教師はINT8(23% mAP)で破滅的な劣化を経験し、KD学生は5.6% mAP(5.6% mAP)の精度を維持している。
KDの学生は、INT8の直接訓練で0.748の精度で0.653の精度を達成した。
INT8では、KD学生は教師のFP32精度(0.748対0.718)を3.9倍小さいモデルで上回る。
これらの知見は,エッジハードウェア上での高精度かつ安全に重要なVRU検出を実現するための要件として,知識蒸留を確立した。
関連論文リスト
- Distillation Traps and Guards: A Calibration Knob for LLM Distillability [54.90137955363471]
そこで本研究では,教師の蒸留性を制御するためのポストホック校正法を提案する。
我々の目標は、タスクユーティリティ、KLアンカー、およびクロストケナイザーキャリブレーション報酬を組み合わせることである。
実験により、蒸留可能な教師から蒸留した学生は、SFTおよびKDベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-04-21T01:22:35Z) - Sharpness-Aware Surrogate Training for On-Sensor Spiking Neural Networks [0.0]
シュロゲートフォワードSNNにシャープネス対応シャープネス認識(SAST)を導入し,トレーニング対象がスムーズで勾配が正確であることを示す。
2つのイベントカメラベンチマークでは、スワップのみのハードスパイク精度が、N-MNISTでは65.7%から94.7%に改善され、DVS Gestureでは31.8%から63.3%に改善された。
これらの結果は、SASTがテスト設定下でのオンセンサースパイク推論のためのより広範なツールボックスの有望なコンポーネントであることを示唆している。
論文 参考訳(メタデータ) (2026-04-06T23:32:17Z) - Breaking the Geometric Bottleneck: Contrastive Expansion in Asymmetric Cross-Modal Distillation [0.0]
グローバルビジョン変換器をキャパシティ制約CNNに蒸留する際の次元崩壊現象について検討する。
厳密な集中型SVDとエフェクトランクを用いることで、CIFAR-10上でキャパシティ非依存の位相遷移を示す。
さらに、DINOv2の均一な幾何は部分的に崩壊を防ぐが、コントラスト展開はCNNのトポロジカルキャパシティ限界に達する普遍的な要件であることを示す。
論文 参考訳(メタデータ) (2026-03-05T05:37:51Z) - Understanding vision transformer robustness through the lens of out-of-distribution detection [59.72757235382676]
量子化はメモリと推論コストを削減し、性能損失のリスクを負う。
本稿では, 量子化小型可変ビジョントランス (DeiT, DeiT3, ViT) の共通アウト・オブ・ディストリビューション (OOD) データセットにおける挙動について検討する。
論文 参考訳(メタデータ) (2026-02-01T22:00:59Z) - INTACT: Inducing Noise Tolerance through Adversarial Curriculum Training for LiDAR-based Safety-Critical Perception and Autonomy [0.4124847249415279]
本稿では、雑音の多いLiDARデータに対するディープニューラルネットワーク(DNN)の堅牢性を高めるために設計された新しいフレームワークを提案する。
IntACTは、メタラーニングと、敵対的なカリキュラムトレーニング(ACT)を組み合わせることで、3Dポイントクラウドにおけるデータの破損とスパーシリティによる課題に対処する。
IntACTの有効性は、オブジェクトの検出、追跡、分類ベンチマークに関する包括的な評価を通じて実証される。
論文 参考訳(メタデータ) (2025-02-04T00:02:16Z) - An Effective Two-stage Training Paradigm Detector for Small Dataset [13.227589864946477]
YOLOv8のバックボーンはマスク画像モデリング技術を用いてエンコーダとして事前訓練されている。
テスト段階では、各モデルを強化するためにテスト時間拡張(TTA)が使用され、さらに性能を高めるために重み付きボックス融合(WBF)が実装される。
良く設計された構造で、私たちのアプローチはDelftBikesテストセットで0.50から0.95までの平均精度を30.4%達成し、リーダーボードで4位になった。
論文 参考訳(メタデータ) (2023-09-11T17:43:11Z) - Patch-Level Contrasting without Patch Correspondence for Accurate and
Dense Contrastive Representation Learning [79.43940012723539]
ADCLRは、正確で高密度な視覚表現を学習するための自己教師型学習フレームワークである。
提案手法は, コントラッシブな手法のための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-23T07:38:09Z) - CrossKD: Cross-Head Knowledge Distillation for Object Detection [69.16346256926842]
知識蒸留(KD)は、コンパクト物体検出器の学習に有効なモデル圧縮技術として検証されている。
そこで本研究では,学生の検知ヘッドの中間的特徴を教師の検知ヘッドに伝達する,CrossKDと呼ばれる蒸留方式を模倣する予測手法を提案する。
われわれのCrossKDはGFL ResNet-50の平均精度を40.2から43.7に向上させ、既存のKD手法を上回ります。
論文 参考訳(メタデータ) (2023-06-20T08:19:51Z) - How and When Adversarial Robustness Transfers in Knowledge Distillation? [137.11016173468457]
本稿では,教師モデルから学生モデルへの知識蒸留(KD)における対向ロバスト性の移行について検討する。
我々は,標準的なKDトレーニングが対向的堅牢性を維持するのに失敗することを示すとともに,KDIGA(入力勾配アライメント)を併用したKDを提案する。
特定の前提の下では、提案したKDIGAを用いた学生モデルは、少なくとも教師モデルと同じ確証された堅牢性を達成することができることを証明している。
論文 参考訳(メタデータ) (2021-10-22T21:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。