Fugu-MT 論文翻訳(概要): Model compression as constrained optimization, with application to neural nets. Part V: combining compressions

論文の概要: Model compression as constrained optimization, with application to neural nets. Part V: combining compressions

arxiv url: http://arxiv.org/abs/2107.04380v1
Date: Fri, 9 Jul 2021 12:12:25 GMT
ステータス: 翻訳完了
システム内更新日: 2021-07-12 13:43:19.769221
Title: Model compression as constrained optimization, with application to neural nets. Part V: combining compressions
Title（参考訳）: 制約付き最適化としてのモデル圧縮とニューラルネットへの応用パート5:圧縮の組み合わせ
Authors: Miguel \'A. Carreira-Perpi\~n\'an, Yerlan Idelbayev
Abstract要約: 深層ニューラルネットワークを用いて実験したところ, 1) 誤差圧縮空間において, 異なる圧縮型に相補的な利点があること, 2) 最適な組み合わせは, ニューラルネットワークの種類に依存することが示唆された。低ランクと浮動小数点重みを組み合わせることで、VGGネットをより圧縮することができる。
参考スコア（独自算出の注目度）: 7.043531451435605
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Model compression is generally performed by using quantization, low-rank approximation or pruning, for which various algorithms have been researched in recent years. One fundamental question is: what types of compression work better for a given model? Or even better: can we improve by combining compressions in a suitable way? We formulate this generally as a problem of optimizing the loss but where the weights are constrained to equal an additive combination of separately compressed parts; and we give an algorithm to learn the corresponding parts' parameters. Experimentally with deep neural nets, we observe that 1) we can find significantly better models in the error-compression space, indicating that different compression types have complementary benefits, and 2) the best type of combination depends exquisitely on the type of neural net. For example, we can compress ResNets and AlexNet using only 1 bit per weight without error degradation at the cost of adding a few floating point weights. However, VGG nets can be better compressed by combining low-rank with a few floating point weights.
Abstract（参考訳）: モデル圧縮は一般に量子化、低ランク近似、プルーニングを用いて行われ、近年様々なアルゴリズムが研究されている。基本的な質問の1つは、どのタイプの圧縮が特定のモデルに対してうまく働くかということです。あるいは、もっと良い:適切な方法で圧縮を組み合わせることで改善できるのか? これを損失を最適化する問題として一般に定式化するが、重みを個別に圧縮した部分の加法結合に制限し、対応する部分のパラメータを学習するアルゴリズムを与える。ディープニューラルネットを用いた実験では,1)誤り圧縮空間において,異なる圧縮型が相補的な効果をもたせ,2)最適な組み合わせがニューラルネットワークのタイプに依存することを示す,はるかに優れたモデルを見出すことができる。例えば、数個の浮動小数点重みを追加してエラーを発生させることなく、ResNetとAlexNetを1ビット1重で圧縮できます。しかし、低ランクと浮動小数点重みを組み合わせることで、VGGネットをより圧縮することができる。

関連論文リスト

Linearity-based neural network compression [1.2200609701777907]
この圧縮の基礎となる理論を導入し,そのアプローチを実験的に評価する。すでに重要度に基づくプルーニングモデルに本手法を適用すると、異なるタイプの圧縮の干渉がほとんどない。
論文参考訳（メタデータ） (2025-06-26T11:04:12Z)
Compression for Better: A General and Stable Lossless Compression Framework [7.356622397575378]
主な課題は、モデル損失を最小限に抑えるために圧縮エラーを効果的に活用することである。一般的なtextbfLosstextbfLess textbfCompression理論フレームワーク(textbfLLC)を提案する。量子化や分解など,様々な圧縮手法を適用する。
論文参考訳（メタデータ） (2024-12-09T09:55:54Z)
Order of Compression: A Systematic and Optimal Sequence to Combinationally Compress CNN [5.25545980258284]
本稿では,複数の圧縮手法を最も効率的な順序で適用するための,体系的かつ最適なシーケンスを提案する。提案手法では,ResNet34の計算コストを最大859倍に削減する。我々は, モデル圧縮の行程をシンプルかつ効果的に探索することで, モデル圧縮の実践に光を当てることができると考えている。
論文参考訳（メタデータ） (2024-03-26T07:26:00Z)
Lossy and Lossless (L$^2$) Post-training Model Size Compression [12.926354646945397]
本稿では,無損失圧縮と無損失圧縮を統一的に組み合わせた後学習モデルサイズ圧縮法を提案する。精度を犠牲にすることなく安定な10times$圧縮比を達成でき、短時間で20times$圧縮比を小さくすることができる。
論文参考訳（メタデータ） (2023-08-08T14:10:16Z)
A Theoretical Understanding of Neural Network Compression from Sparse Linear Approximation [37.525277809849776]
モデル圧縮の目標は、同等のパフォーマンスを維持しながら、大きなニューラルネットワークのサイズを減らすことだ。圧縮性を特徴付けるためにスペーサ感度$ell_q$-normを使用し、ネットワーク内の重みの柔らかいスペーサと圧縮度の関係を提供する。また,ネットワーク上で各ニューロンを切断する適応アルゴリズムを開発した。
論文参考訳（メタデータ） (2022-06-11T20:10:35Z)
Partition and Code: learning how to compress graphs [50.29024357495154]
まず、分割アルゴリズムがグラフを基本構造に分解し、これらを確率分布を学習する小さな辞書の要素にマッピングし、エントロピーエンコーダが表現をビットに変換する。提案アルゴリズムは,非パラメトリックおよびパラメトリックグラフ圧縮器の異なるファミリーに対して,多種多様な実世界のネットワーク上で定量的に評価し,大幅な性能向上を実現している。
論文参考訳（メタデータ） (2021-07-05T11:41:16Z)
Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。 52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文参考訳（メタデータ） (2021-05-24T12:07:38Z)
Single-path Bit Sharing for Automatic Loss-aware Model Compression [126.98903867768732]
シングルパスビット共有(SBS)は、計算コストを大幅に削減し、有望な性能を達成する。 SBS圧縮MobileNetV2は、Top-1の精度がわずか0.1%低下した22.6倍ビット演算(BOP)を実現する。
論文参考訳（メタデータ） (2021-01-13T08:28:21Z)
Layer-Wise Data-Free CNN Compression [49.73757297936685]
本稿では,事前学習ネットワークのみを用いてレイヤワイズトレーニングデータを生成する方法を示す。本稿では,量子化とプルーニングを用いた層間圧縮の結果について述べる。
論文参考訳（メタデータ） (2020-11-18T03:00:05Z)
Permute, Quantize, and Fine-tune: Efficient Compression of Neural Networks [70.0243910593064]
ベクトル量子化の成功の鍵は、どのパラメータ群を一緒に圧縮するかを決定することである。本稿では,隣り合う2つの層の重みを同じ関数を表現しながら不変にすることができることを観察する。次に、レート歪み理論への接続を確立し、圧縮し易いネットワークとなる置換を探索する。
論文参考訳（メタデータ） (2020-10-29T15:47:26Z)
GAN Slimming: All-in-One GAN Compression by A Unified Optimization Framework [94.26938614206689]
本稿では,GANスライミング(GAN Slimming)と呼ばれる,GAN圧縮のための複数の圧縮手段を組み合わせた最初の統一最適化フレームワークを提案する。我々はGSを用いて、最先端のトランスファーネットワークであるCartoonGANを最大47倍圧縮し、視覚的品質を最小限に抑える。
論文参考訳（メタデータ） (2020-08-25T14:39:42Z)
A flexible, extensible software framework for model compression based on the LC algorithm [10.787390511207683]
ニューラルネットワークや他の機械学習モデルを最小限の労力で圧縮できるソフトウェアフレームワークを提案する。ライブラリはPythonとPyTorchで書かれており、Githubで入手できる。
論文参考訳（メタデータ） (2020-05-15T21:14:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。