論文の概要: HumP-KD: A Hybrid Uncertainty-Aware Multi-Stage Progressive Knowledge Distillation Framework for Efficient Fire Classification
- arxiv url: http://arxiv.org/abs/2606.14684v1
- Date: Fri, 12 Jun 2026 17:48:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:43.021637
- Title: HumP-KD: A Hybrid Uncertainty-Aware Multi-Stage Progressive Knowledge Distillation Framework for Efficient Fire Classification
- Title(参考訳): HumP-KD:効率的な火災分類のためのハイブリッド不確実性対応多段階プログレッシブ知識蒸留フレームワーク
- Authors: Mohammed Arif Mainuddin, Najifa Tabassum, Omar Ibne Shahid, Riasat Khan,
- Abstract要約: 本研究は,効率的な火災分類のためのハイブリッド不確実性を考慮した多段階プログレッシブ知識蒸留フレームワークである textbfHumP-KD を提案する。
提案モデルでは,Swin-Tiny と ViT-Base と Meta-MLP アンサンブルの2つの冷凍変圧器教師の知識を,3つの密に統合されたコンポーネントを通じて軽量な MobileViT-S 学生に抽出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-time fire classification systems require models that are simultaneously accurate, computationally efficient, and deployable on resource-constrained hardware. This work proposes \textbf{HumP-KD}, a Hybrid Uncertainty-aware Multi-stage Progressive Knowledge Distillation framework for efficient fire classification. Two datasets, FlameVision and Dataset-II, containing 8,600 and 31,309 images, are used. Various CNN and transformer baselines are applied under standard preprocessing, online augmentation, Gaussian noise and motion blur robustness conditions. The proposed HumP-KD model distills knowledge from two frozen heterogeneous transformer teachers, Swin-Tiny and ViT-Base, along with their Meta-MLP ensemble, into a lightweight MobileViT-S student via three tightly integrated components. Hierarchical Progressive Knowledge Distillation employs a Hierarchical Feature Builder. It generates a fused spatial attention mask to guide distillation toward discriminative regions selectively. Multi-Stage Knowledge Distillation progressively activates three distillation stages across training. On Dataset-II, HumP-KD achieves a mean F1 score of $0.9876 \pm 0.0063$ across 10 independent trials, significantly outperforming the MobileViT-S baseline trained without distillation ($0.9537 \pm 0.0351$), with statistical significance confirmed by both independent t-test ($p = 0.0195$) and Wilcoxon signed-rank test ($W = 1$, $p = 0.0039$). The proposed method also demonstrates strong generalization across datasets and robustness under degraded visual conditions. The student model retains only 4.94M parameters and 19.01Mb model size, representing a $5.7\times$ parameter reduction over Swin-Tiny and a $17.5\times$ reduction over ViT-Base, while achieving 37.72 CPU FPS, making it suitable for real-time deployment.
- Abstract(参考訳): リアルタイム火災分類システムは、リソース制約のあるハードウェア上で同時に正確で、計算効率が良く、デプロイ可能なモデルを必要とする。
本研究では,効率的な火災分類のためのハイブリッド不確実性を考慮した多段階プログレッシブ知識蒸留フレームワークであるtextbf{HumP-KD}を提案する。
FlameVisionとDataset-IIという,8,600と31,309のイメージを含む2つのデータセットが使用されている。
各種CNNおよびトランスフォーマーベースラインは、標準前処理、オンライン拡張、ガウス雑音、動きの曖昧さ条件下で適用される。
提案したHumP-KDモデルは、Swin-TinyとViT-Baseの2人の凍結した異種トランスフォーマー教師とMeta-MLPアンサンブルからの知識を、3つの密に統合されたコンポーネントを通して軽量なMobileViT-S学生に蒸留する。
階層的プログレッシブ・ナレッジ蒸留は階層的特徴ビルダーを採用している。
融合した空間注意マスクを生成し、蒸留を識別領域に向けて選択的に誘導する。
マルチステージ知識蒸留は、訓練中に3つの蒸留段階を段階的に活性化する。
Dataset-IIでは、HumP-KDの平均F1スコアが0.9876 \pm 0.0063$で、蒸留なしで訓練されたMobileViT-Sベースライン(0.9537 \pm 0.0351$)を著しく上回り、独立したtテスト(p = 0.0195$)とウィルコクソンのサインインランクテスト(W = 1$, $p = 0.0039$)の両方で統計的に確認されている。
提案手法はまた、劣化した視覚条件下でのデータセット間の強い一般化とロバスト性を示す。
学生モデルは4.94Mのパラメータと19.01Mbのモデルサイズしか保持せず、Swin-Tinyよりも5.7\times$パラメータ削減、ViT-Baseより17.5\times$パラメータ削減、そして37.72 CPU FPSを達成し、リアルタイム展開に適している。
関連論文リスト
- Balancing Centralized Learning and Distributed Self-Organization: A Hybrid Model for Embodied Morphogenesis [0.0]
本研究では,学習可能な脳様のコントローラを細胞様のグレースコット基質に結合して,最小限の努力でステアパターン形成を行う方法について検討する。
コンパクトな畳み込みポリシは、微分可能なPyTorch反応拡散シミュレータに埋め込まれる。
論文 参考訳(メタデータ) (2025-11-13T09:05:27Z) - Overclocking Electrostatic Generative Models [59.271136356755996]
PFGM++は補助次元$D$で拡張データ空間で動作し、拡散モデルフレームワークを$Dtoinfty$として回復する。
Inverse Poisson Flow Matching (IPFM, Inverse Poisson Flow Matching)を提案する。
IPFMは、ごく少数の機能評価だけで、ほぼ教師に近い、あるいは優れたサンプル品質を実現する蒸留発電機を生産する。
論文 参考訳(メタデータ) (2025-09-26T15:07:23Z) - ArtifactGen: Benchmarking WGAN-GP vs Diffusion for Label-Aware EEG Artifact Synthesis [0.0]
エレクトロ脳波(EEG)の成果は、いまだに大規模なラベル付けに費用がかかる。
本研究では,現代の生成モデルが,拡張とストレステストに適した,現実的なラベル対応アーティファクトセグメントを合成できるかどうかを考察する。
論文 参考訳(メタデータ) (2025-09-09T23:25:33Z) - AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification [51.525891360380285]
AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。
2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。
分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-07T07:47:16Z) - Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - Discovery of Fatigue Strength Models via Feature Engineering and automated eXplainable Machine Learning applied to the welded Transverse Stiffener [0.0]
本研究では、自動機械学習(AutoML)と説明可能な人工知能(XAI)を組み合わせた統一的なアプローチを提案する。
専門家主導の機能エンジニアリングとアルゴリズムによる特徴生成を統合して、精度と説明可能性を高める。
データ駆動モデリングをエンジニアリング検証にブリッジし、AIによる設計と評価を可能にする。
論文 参考訳(メタデータ) (2025-07-01T21:57:12Z) - MGD$^3$: Mode-Guided Dataset Distillation using Diffusion Models [50.2406741245418]
本稿では,事前学習した拡散モデルを利用したモード誘導拡散モデルを提案する。
提案手法は,異なるデータモードを識別するモード発見,クラス内多様性を高めるモード誘導,および合成試料中のアーティファクトを緩和するモード誘導という3段階のデータセットの多様性に対処する。
本手法は, 蒸留損失を伴う微調整拡散モデルの必要性を排除し, 計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2025-05-25T03:40:23Z) - Few-Step Diffusion via Score identity Distillation [67.07985339442703]
拡散蒸留は, テキスト・ツー・イメージ(T2I)拡散モデルを促進するための有望な戦略として浮上している。
既存の方法は、高分解能T2I拡散モデルを蒸留する際に、実像や教師合成画像に頼っている。
教師のCFGを無効にし、偽スコアネットワークでテキストコンディショニングを除去するZero-CFGと、偽スコアネットワークで否定的なCFGを適用するAnti-CFGの2つの新しいガイダンス戦略を提案する。
論文 参考訳(メタデータ) (2025-05-19T03:45:16Z) - Foundation Models for Structural Health Monitoring [14.36493796970864]
本稿では,トランスフォーマーニューラルネットワークをMasked Auto-Encoderアーキテクチャを用いて,構造的健康モニタリングのための基礎モデルとして初めて利用することを提案する。
自己教師付き事前学習を通じて、複数の大規模データセットから一般化可能な表現を学習する能力を実証する。
本研究は,3つの運用用インダクトのデータを用いた基礎モデルの有効性を示す。
論文 参考訳(メタデータ) (2024-04-03T13:32:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。