論文の概要: DANCE: Dynamic 3D CNN Pruning: Joint Frame, Channel, and Feature Adaptation for Energy Efficiency on the Edge
- arxiv url: http://arxiv.org/abs/2603.17275v1
- Date: Wed, 18 Mar 2026 01:57:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.477599
- Title: DANCE: Dynamic 3D CNN Pruning: Joint Frame, Channel, and Feature Adaptation for Energy Efficiency on the Edge
- Title(参考訳): DANCE: 動的3次元CNNプルーニング:エッジのエネルギー効率向上のためのジョイントフレーム,チャネル,特徴適応
- Authors: Mohamed Mejri, Ashiqur Rasul, Abhijit Chatterjee,
- Abstract要約: 3次元CNNのための細粒度で入力対応の動的プルーニングフレームワークであるDANCEを提案する。
本手法は,乗算累積(MAC)演算とメモリアクセスの大幅な削減を実現する。
NVIDIA Jetson Nano GPUとQualcomm Snapdragon 8 Gen 1プラットフォームのハードウェア検証では、それぞれ1.37Xと2.22Xのスピードアップが示されている。
- 参考スコア(独自算出の注目度): 0.5964436882344727
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Modern convolutional neural networks (CNNs) are workhorses for video and image processing, but fail to adapt to the computational complexity of input samples in a dynamic manner to minimize energy consumption. In this research, we propose DANCE, a fine-grained, input-aware, dynamic pruning framework for 3D CNNs to maximize power efficiency with negligible to zero impact on performance. In the proposed two-step approach, the first step is called activation variability amplification (AVA), and the 3D CNN model is retrained to increase the variance of the magnitude of neuron activations across the network in this step, facilitating pruning decisions across diverse CNN input scenarios. In the second step, called adaptive activation pruning (AAP), a lightweight activation controller network is trained to dynamically prune frames, channels, and features of 3D convolutional layers of the network (different for each layer), based on statistics of the outputs of the first layer of the network. Our method achieves substantial savings in multiply-accumulate (MAC) operations and memory accesses by introducing sparsity within convolutional layers. Hardware validation on the NVIDIA Jetson Nano GPU and the Qualcomm Snapdragon 8 Gen 1 platform demonstrates respective speedups of 1.37X and 2.22X, achieving up to 1.47X higher energy efficiency compared to the state of the art.
- Abstract(参考訳): 現代の畳み込みニューラルネットワーク(CNN)は、ビデオや画像処理のためのワークホースであるが、エネルギー消費を最小限に抑えるために、動的に入力サンプルの計算複雑性に適応できない。
本研究では,3次元CNNのための細粒度で入力対応の動的プルーニングフレームワークであるDANCEを提案し,性能への影響を無視して電力効率を最大化する。
提案した2段階のアプローチでは、最初のステップはアクティベーション変数増幅(AVA)と呼ばれ、3次元CNNモデルは、このステップでネットワーク全体にわたるニューロン活性化の大きさのばらつきを増大させ、多様なCNN入力シナリオにおける決定の突破を容易にするために再訓練される。
適応型アクティベーションプルーニング(AAP)と呼ばれる第2ステップでは、軽量なアクティベーションコントローラネットワークが、ネットワークの第1層の出力統計に基づいて、ネットワークの3次元畳み込み層の動的なプルーーンフレーム、チャネル、特徴を訓練する。
本手法は,畳み込み層内にスパーシティを導入することにより,乗算累積(MAC)演算とメモリアクセスの大幅な削減を実現する。
NVIDIA Jetson Nano GPUとQualcomm Snapdragon 8 Gen 1プラットフォームでのハードウェア検証では、それぞれのスピードアップが1.37Xと2.22Xであり、最先端技術と比較して最大1.47倍のエネルギー効率が達成されている。
関連論文リスト
- An Efficient 3D Convolutional Neural Network with Channel-wise, Spatial-grouped, and Temporal Convolutions [3.798710743290466]
本稿では,ビデオ行動認識のためのシンプルで効率的な3次元畳み込みニューラルネットワークを提案する。
提案するネットワークの性能と効率を,複数のビデオ行動認識データセット上で評価する。
論文 参考訳(メタデータ) (2025-03-02T08:47:06Z) - Kolmogorov-Arnold Transformer [72.88137795439407]
Kolmogorov-Arnold Transformer(KAT)は,階層をKAN(Kolmogorov-Arnold Network)層に置き換える新しいアーキテクチャである。
C1)基本関数,(C2)非効率,(C3)重みの3つの主要な課題を特定する。
これらの設計により、KATは従来のトランスフォーマーよりも優れている。
論文 参考訳(メタデータ) (2024-09-16T17:54:51Z) - Exploring Quantization and Mapping Synergy in Hardware-Aware Deep Neural Network Accelerators [0.20971479389679332]
CNN推論アクセラレータに実装された畳み込みニューラルネットワーク(CNN)のエネルギー効率とメモリフットプリントは多くの要因に依存する。
実装中にリッチな混合量子化スキームを有効にすることで、以前に隠れていたマッピングの空間を開放できることが示される。
量子化重みとアクティベーションと適切なマッピングを利用するCNNは、精度、エネルギ、メモリ要求間のトレードオフを大幅に改善することができる。
論文 参考訳(メタデータ) (2024-04-08T10:10:30Z) - Ev-Edge: Efficient Execution of Event-based Vision Algorithms on Commodity Edge Platforms [10.104371980353973]
Ev-Edgeは、エッジプラットフォーム上でのイベントベースのビジョンシステムのパフォーマンスを高めるために、3つの重要な最適化を含むフレームワークである。
様々な自律ナビゲーションタスクのための最先端ネットワークでは、Ev-Edgeはレイテンシが1.28x-2.05x改善され、エネルギーが1.23x-2.15xになった。
論文 参考訳(メタデータ) (2024-03-23T04:44:55Z) - Receptive Field Refinement for Convolutional Neural Networks Reliably
Improves Predictive Performance [1.52292571922932]
本稿では,このような理論的および経験的性能向上をもたらす受容場解析への新たなアプローチを提案する。
我々のアプローチは、広く知られたSOTA(State-of-the-art)モデルクラスにおいて、ImageNet1Kのパフォーマンスを改善することができる。
論文 参考訳(メタデータ) (2022-11-26T05:27:44Z) - Dynamics-aware Adversarial Attack of Adaptive Neural Networks [75.50214601278455]
適応型ニューラルネットワークの動的対向攻撃問題について検討する。
本稿では,LGM(Leaded Gradient Method)を提案する。
我々のLGMは、動的無意識攻撃法と比較して、優れた敵攻撃性能を達成している。
論文 参考訳(メタデータ) (2022-10-15T01:32:08Z) - DS-Net++: Dynamic Weight Slicing for Efficient Inference in CNNs and
Transformers [105.74546828182834]
本稿では,様々な難易度を持つ入力に対して,ネットワークパラメータの一部を適応的にスライスする動的ウェイトスライシングという,ハードウェア効率のよい動的推論方式を示す。
我々は、CNNのフィルタ数とCNNと変換器の多重次元を入力依存的に調整することで、動的スライム可能なネットワーク(DS-Net)と動的スライス可能なネットワーク(DS-Net++)を提案する。
論文 参考訳(メタデータ) (2021-09-21T09:57:21Z) - RT3D: Achieving Real-Time Execution of 3D Convolutional Neural Networks
on Mobile Devices [57.877112704841366]
本稿では3次元CNNのためのモデル圧縮およびモバイルアクセラレーションフレームワークRT3Dを提案する。
3D CNNのリアルタイム実行は、市販のモバイル上で初めて実現された。
論文 参考訳(メタデータ) (2020-07-20T02:05:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。