論文の概要: Rethinking Weight Decay For Efficient Neural Network Pruning
- arxiv url: http://arxiv.org/abs/2011.10520v4
- Date: Wed, 9 Mar 2022 15:06:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 05:42:05.417600
- Title: Rethinking Weight Decay For Efficient Neural Network Pruning
- Title(参考訳): 効率的なニューラルネットワークプルーニングのための軽量化の再考
- Authors: Hugo Tessier, Vincent Gripon, Mathieu L\'eonardon, Matthieu Arzel,
Thomas Hannagan, David Bertrand
- Abstract要約: Selective Weight Decay (SWD)を導入し、トレーニングを通して効率よく連続的なプルーニングを行う。
理論上はラグランジュの平滑化に基礎を置いており、複数のタスク、ネットワーク、プルーニング構造に適用できる。
- 参考スコア(独自算出の注目度): 2.2320512724449233
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Introduced in the late 1980s for generalization purposes, pruning has now
become a staple for compressing deep neural networks. Despite many innovations
in recent decades, pruning approaches still face core issues that hinder their
performance or scalability. Drawing inspiration from early work in the field,
and especially the use of weight decay to achieve sparsity, we introduce
Selective Weight Decay (SWD), which carries out efficient, continuous pruning
throughout training. Our approach, theoretically grounded on Lagrangian
smoothing, is versatile and can be applied to multiple tasks, networks, and
pruning structures. We show that SWD compares favorably to state-of-the-art
approaches, in terms of performance-to-parameters ratio, on the CIFAR-10, Cora,
and ImageNet ILSVRC2012 datasets.
- Abstract(参考訳): 1980年代後半に一般化のために導入され、プルーニングはディープニューラルネットワークの圧縮の基礎となった。
近年の多くのイノベーションにもかかわらず、プラニングのアプローチは依然としてパフォーマンスやスケーラビリティを妨げる核となる問題に直面している。
この分野における初期の作業からインスピレーションを得て,特に重量減衰を利用して,トレーニングを通して効率よく連続的な刈り取りを行うSelective Weight Decay(SWD)を紹介した。
ラグランジアン平滑化を理論的に根拠とした我々のアプローチは多用途であり、複数のタスク、ネットワーク、刈り取り構造に適用できる。
SWDはCIFAR-10, Cora, ImageNet ILSVRC2012データセット上で, 性能とパラメータ比の観点から, 最先端のアプローチと良好に比較できることを示す。
関連論文リスト
- Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - WeightMom: Learning Sparse Networks using Iterative Momentum-based
pruning [0.0]
本稿では,前回の繰り返しの運動量に基づいて徐々に重みを刈り取る,重みに基づくプルーニング手法を提案する。
我々は,CIFAR-10やCIFAR-100といった画像分類データセットを用いて,AlexNet,VGG16,ResNet50などのネットワークに対するアプローチを評価する。
論文 参考訳(メタデータ) (2022-08-11T07:13:59Z) - Trainability Preserving Neural Structured Pruning [64.65659982877891]
本稿では,正規化型構造化プルーニング法であるTPP(Traiability Preserving pruning)を提案する。
TPPは線形ネットワーク上での地中動力学的等尺性回復法と競合する。
多くのトップパフォーマンスのフィルタプルーニング手法と比較して、優れたパフォーマンスを提供する。
論文 参考訳(メタデータ) (2022-07-25T21:15:47Z) - Attentive Fine-Grained Structured Sparsity for Image Restoration [63.35887911506264]
N:M 構造化プルーニングは,モデルの精度制約を効率的にするための効果的かつ実用的なプルーニング手法の1つである。
そこで本稿では, 各層におけるN:M構造化空間の刈り取り比を決定する新しい刈り取り法を提案する。
論文 参考訳(メタデータ) (2022-04-26T12:44:55Z) - Learning Pruned Structure and Weights Simultaneously from Scratch: an
Attention based Approach [4.284071491453377]
我々は、新しい非構造化プルーニングパイプライン、注意に基づく同時スパース構造と重み学習(ASWL)を提案する。
ASWLは, 各層毎の層単位でのプルーニング比を計算する効率的なアルゴリズムを提案し, 密集ネットワークとスパースネットワークの重みをランダムな重みから同時に学習するように追従する。
MNIST, Cifar10, ImageNet を用いた実験により, ASWL は精度, プルーニング率, 運転効率の点で, 優れたプルーニング結果が得られることが示された。
論文 参考訳(メタデータ) (2021-11-01T02:27:44Z) - Powerpropagation: A sparsity inducing weight reparameterisation [65.85142037667065]
我々は、本質的にスパースモデルにつながるニューラルネットワークの新しい重みパラメータ化であるPowerpropagationを紹介した。
この方法で訓練されたモデルは同様の性能を示すが、0で明らかに高い密度の分布を持ち、より多くのパラメータを安全に刈り取ることができる。
ここでは、Powerpropagationと従来のウェイトプルーニング技術と、最近の最先端スパース・トゥ・スパースアルゴリズムを組み合わせることで、ImageNetベンチマークで優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-10-01T10:03:57Z) - Effective Model Sparsification by Scheduled Grow-and-Prune Methods [73.03533268740605]
本稿では,高密度モデルの事前学習を伴わない新規なGrow-and-prune(GaP)手法を提案する。
実験により、そのようなモデルは様々なタスクにおいて80%の間隔で高度に最適化された高密度モデルの品質に適合または打ち勝つことができることが示された。
論文 参考訳(メタデータ) (2021-06-18T01:03:13Z) - The Implicit Biases of Stochastic Gradient Descent on Deep Neural
Networks with Batch Normalization [44.30960913470372]
バッチ正規化(BN-DNN)を伴うディープニューラルネットワークは、その正規化操作のために重み付け再スケーリングには不変である。
BN-DNNにおける勾配降下(SGD)の暗黙バイアスについて検討し,重量減衰の有効性に関する理論的説明を行う。
論文 参考訳(メタデータ) (2021-02-06T03:40:20Z) - Weight Pruning via Adaptive Sparsity Loss [31.978830843036658]
近年、最先端のディープニューラルネットワークを圧縮する手段として、プルーニングニューラルネットワークが注目を集めている。
本稿では,ネットワークパラメータを最小限の計算オーバーヘッドで効率的に学習する頑健な学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-04T10:55:16Z) - Robust Pruning at Initialization [61.30574156442608]
計算リソースが限られているデバイス上で、機械学習アプリケーションを使用するための、より小さく、エネルギー効率のよいニューラルネットワークの必要性が高まっている。
ディープNNにとって、このような手順はトレーニングが困難であり、例えば、ひとつの層が完全に切断されるのを防ぐことができないため、満足できないままである。
論文 参考訳(メタデータ) (2020-02-19T17:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。