Fugu-MT 論文翻訳(概要): Compression of Recurrent Neural Networks using Matrix Factorization

論文の概要: Compression of Recurrent Neural Networks using Matrix Factorization

arxiv url: http://arxiv.org/abs/2310.12688v1
Date: Thu, 19 Oct 2023 12:35:30 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-20 15:25:28.642002
Title: Compression of Recurrent Neural Networks using Matrix Factorization
Title（参考訳）: 行列分解を用いた繰り返しニューラルネットワークの圧縮
Authors: Lucas Maison, H\'elion du Mas des Bourboux, Thomas Courtat
Abstract要約: 本稿では,各行列に対して異なるランクを選択するランク調整法を提案する。信号処理タスクに関する数値実験により、リカレントニューラルネットワークを1.4%の相対的性能低下で14倍まで圧縮できることが示されている。
参考スコア（独自算出の注目度）: 0.9208007322096533
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Compressing neural networks is a key step when deploying models for real-time or embedded applications. Factorizing the model's matrices using low-rank approximations is a promising method for achieving compression. While it is possible to set the rank before training, this approach is neither flexible nor optimal. In this work, we propose a post-training rank-selection method called Rank-Tuning that selects a different rank for each matrix. Used in combination with training adaptations, our method achieves high compression rates with no or little performance degradation. Our numerical experiments on signal processing tasks show that we can compress recurrent neural networks up to 14x with at most 1.4% relative performance reduction.
Abstract（参考訳）: ニューラルネットワークの圧縮は、リアルタイムまたは組み込みアプリケーションのモデルデプロイにおける重要なステップである。低ランク近似を用いたモデルの行列の分解は圧縮を達成するための有望な方法である。トレーニング前にランクを設定することは可能だが、このアプローチは柔軟でも最適でもない。本研究では,各行列に対して異なる階数を選択するランクチューニングと呼ばれるポストトレーニングランク選択法を提案する。本手法は,トレーニング適応と組み合わせて,性能劣化を伴わずに高い圧縮率を達成する。信号処理タスクに関する数値実験により、リカレントニューラルネットワークを1.4%の相対的性能低下で14倍まで圧縮できることが示されている。

関連論文リスト

Linearity-based neural network compression [1.2200609701777907]
この圧縮の基礎となる理論を導入し,そのアプローチを実験的に評価する。すでに重要度に基づくプルーニングモデルに本手法を適用すると、異なるタイプの圧縮の干渉がほとんどない。
論文参考訳（メタデータ） (2025-06-26T11:04:12Z)
Reducing Storage of Pretrained Neural Networks by Rate-Constrained Quantization and Entropy Coding [56.066799081747845]
成長を続けるニューラルネットワークのサイズは、リソースに制約のあるデバイスに深刻な課題をもたらす。本稿では,レートアウェア量子化とエントロピー符号化を組み合わせた学習後圧縮フレームワークを提案する。この方法では非常に高速な復号化が可能であり、任意の量子化グリッドと互換性がある。
論文参考訳（メタデータ） (2025-05-24T15:52:49Z)
Efficient compression of neural networks and datasets [0.0]
ニューラルネットワークのパラメータ数を著しく削減する手法を比較し,改善し,貢献する。記述長を最小化するために本手法を適用すると、非常に効率的なデータ圧縮アルゴリズムが得られる。正規化モデルがより標本効率のよい収束を示すことができるという予測を実証的に検証する。
論文参考訳（メタデータ） (2025-05-23T04:50:33Z)
Unified Framework for Pre-trained Neural Network Compression via Decomposition and Optimized Rank Selection [3.1879514593973197]
本稿では, 階数制約内での複合圧縮損失を利用して, 分解と階数選択を適用した統一的な枠組みを提案する。提案手法は連続空間におけるランクの自動探索を含み,事前学習モデルに対する最適なランク設定を効率的に同定する。様々なベンチマークデータセットとモデルを用いて、包括的分析により、本手法の有効性を実証する。
論文参考訳（メタデータ） (2024-09-05T14:15:54Z)
Structure-Preserving Network Compression Via Low-Rank Induced Training Through Linear Layers Composition [11.399520888150468]
ローランド誘導訓練(LoRITa)と呼ばれる理論的修正手法を提案する。 LoRITaは線形層を構成することで低ランク化を促進し、特異値切り込みを用いて圧縮する。我々は,完全連結ネットワーク上でのMNIST,視覚変換器上でのCIFAR10,畳み込みニューラルネットワーク上でのCIFAR10/100と画像ネットを用いたアプローチの有効性を示す。
論文参考訳（メタデータ） (2024-05-06T00:58:23Z)
Low-rank lottery tickets: finding efficient low-rank neural networks via matrix differential equations [2.3488056916440856]
効率的なローランクワークを見つけるための新しいアルゴリズムを提案する。これらの作業は、トレーニングフェーズですでに決定され、適応されています。本手法は,所望の近似精度を達成するために,訓練中のランクを自動的に動的に適応させる。
論文参考訳（メタデータ） (2022-05-26T18:18:12Z)
An Empirical Analysis of Recurrent Learning Algorithms In Neural Lossy Image Compression Systems [73.48927855855219]
近年のディープラーニングの進歩により、JPEGとJPEG 2000を標準のKodakベンチマークで上回る画像圧縮アルゴリズムが実現している。本稿では,最近の最先端ハイブリッドニューラル圧縮アルゴリズムの大規模比較を行う。
論文参考訳（メタデータ） (2022-01-27T19:47:51Z)
Low-rank Tensor Decomposition for Compression of Convolutional Neural Networks Using Funnel Regularization [1.8579693774597708]
低ランクテンソル分解を用いた事前学習ネットワークを圧縮するモデル削減手法を提案する。圧縮中の重要でない要因を抑えるために, ファンネル関数と呼ばれる新しい正規化法を提案する。 ImageNet2012のResNet18では、GMACの精度は0.7%に過ぎず、Top-1の精度はわずかに低下する。
論文参考訳（メタデータ） (2021-12-07T13:41:51Z)
Compressing Neural Networks: Towards Determining the Optimal Layer-wise Decomposition [62.41259783906452]
本稿では,ディープニューラルネットワークのための新しいグローバル圧縮フレームワークを提案する。各層を自動的に解析し、最適な層間圧縮比を特定する。我々の結果は、現代のニューラルネットワークのグローバルなパフォーマンス-サイズトレードオフに関する将来の研究のための新たな道を開く。
論文参考訳（メタデータ） (2021-07-23T20:01:30Z)
Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。 52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文参考訳（メタデータ） (2021-05-24T12:07:38Z)
An Efficient Statistical-based Gradient Compression Technique for Distributed Training Systems [77.88178159830905]
Sparsity-Inducing Distribution-based Compression (SIDCo) は閾値に基づくスペーシフィケーションスキームであり、DGCと同等のしきい値推定品質を享受する。 SIDCoは,非圧縮ベースライン,Topk,DGC圧縮機と比較して,最大で41:7%,7:6%,1:9%の速度でトレーニングを高速化する。
論文参考訳（メタデータ） (2021-01-26T13:06:00Z)
Layer-Wise Data-Free CNN Compression [49.73757297936685]
本稿では,事前学習ネットワークのみを用いてレイヤワイズトレーニングデータを生成する方法を示す。本稿では,量子化とプルーニングを用いた層間圧縮の結果について述べる。
論文参考訳（メタデータ） (2020-11-18T03:00:05Z)
Compression-aware Continual Learning using Singular Value Decomposition [2.4283778735260686]
本稿では,ニューラルネットワークを動的に成長させる圧縮型連続タスク学習手法を提案する。近年のモデル圧縮技術にインスパイアされた我々は、圧縮認識トレーニングを採用し、低ランク重量近似を行う。本手法は,コストのかかる微調整を必要とせず,最小性能の圧縮表現を実現する。
論文参考訳（メタデータ） (2020-09-03T23:29:50Z)
PowerGossip: Practical Low-Rank Communication Compression in Decentralized Deep Learning [62.440827696638664]
本稿では,近隣労働者間のモデル差を直接圧縮する簡単なアルゴリズムを提案する。中央集権的なディープラーニングのためにPowerSGDにインスパイアされたこのアルゴリズムは、パワーステップを使用して、1ビットあたりの転送情報を最大化する。
論文参考訳（メタデータ） (2020-08-04T09:14:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。