論文の概要: Adaptive Gradient Quantization for Data-Parallel SGD
- arxiv url: http://arxiv.org/abs/2010.12460v1
- Date: Fri, 23 Oct 2020 14:58:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 21:48:44.796996
- Title: Adaptive Gradient Quantization for Data-Parallel SGD
- Title(参考訳): データ並列SGDのための適応型勾配量子化
- Authors: Fartash Faghri, Iman Tabrizian, Ilia Markov, Dan Alistarh, Daniel Roy,
Ali Ramezani-Kebrya
- Abstract要約: 本稿では,2つの適応量子化方式,ALQとAMQを導入する。両方式とも,パラメトリック分布の十分な統計を効率的に計算することにより,プロセッサが並列に圧縮スキームを更新する。
CIFAR-10では約2%,ImageNetでは1%の精度で検証精度を向上させる。
- 参考スコア(独自算出の注目度): 25.665193043464775
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many communication-efficient variants of SGD use gradient quantization
schemes. These schemes are often heuristic and fixed over the course of
training. We empirically observe that the statistics of gradients of deep
models change during the training. Motivated by this observation, we introduce
two adaptive quantization schemes, ALQ and AMQ. In both schemes, processors
update their compression schemes in parallel by efficiently computing
sufficient statistics of a parametric distribution. We improve the validation
accuracy by almost 2% on CIFAR-10 and 1% on ImageNet in challenging low-cost
communication setups. Our adaptive methods are also significantly more robust
to the choice of hyperparameters.
- Abstract(参考訳): 多くの通信効率の良いSGD変種は勾配量子化スキームを使用する。
これらのスキームはしばしばヒューリスティックであり、訓練の過程で固定される。
深層モデルの勾配の統計がトレーニング中に変化することを実証的に観察する。
そこで本研究では,alqとamqの2つの適応量子化方式を提案する。
どちらの方式でも、プロセッサはパラメトリック分布の十分な統計を効率的に計算することで、圧縮スキームを並列に更新する。
CIFAR-10では約2%,ImageNetでは1%の精度で検証精度を向上し,低コスト通信に挑戦する。
私たちの適応法はハイパーパラメータの選択に対してかなり頑健です。
関連論文リスト
- PassionSR: Post-Training Quantization with Adaptive Scale in One-Step Diffusion based Image Super-Resolution [87.89013794655207]
拡散に基づく画像超解像(SR)モデルでは、複数のデノナイジングステップのコストで優れた性能を示す。
本稿では,一段階拡散(OSD)画像SR,PassionSRにおける適応スケールの学習後量子化手法を提案する。
我々のPassionSRは、画像SRの最近の先進的な低ビット量子化法に対して大きな利点がある。
論文 参考訳(メタデータ) (2024-11-26T04:49:42Z) - Algorithm-Hardware Co-Design of Distribution-Aware Logarithmic-Posit Encodings for Efficient DNN Inference [4.093167352780157]
本稿では,ポジトリにインスパイアされた適応型ハードウェアフレンドリなデータ型であるLogarithmic Posits (LP)を紹介する。
また,LPQ(LP Quantization, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化, LP量子化)
論文 参考訳(メタデータ) (2024-03-08T17:28:49Z) - Quantized Distributed Training of Large Models with Convergence
Guarantees [34.054462975511996]
FSDPの変種であるQSDPを理論的保証とともに量子的および重み勾配化をサポートする。
QSDPはFSDPの通信を完全に削除し,最大2.2倍の高速化を実現している。
論文 参考訳(メタデータ) (2023-02-05T14:20:55Z) - Quantized Adaptive Subgradient Algorithms and Their Applications [39.103587572626026]
本稿では、分散トレーニングのための量子化された複合ミラー降下適応次数 (QCMD adagrad) と量子化された正規化された2次平均適応次数 (QRDA adagrad) を提案する。
量子化勾配に基づく適応学習率行列を構築し、通信コスト、精度、モデル間隔のバランスをとる。
論文 参考訳(メタデータ) (2022-08-11T04:04:03Z) - Contextual Squeeze-and-Excitation for Efficient Few-Shot Image
Classification [57.36281142038042]
本稿では,事前学習したニューラルネットワークを新しいタスクで調整し,性能を大幅に向上させる,Contextual Squeeze-and-Excitation (CaSE) という適応ブロックを提案する。
また、メタトレーニングされたCaSEブロックと微調整ルーチンを利用して効率よく適応する、アッパーCaSEと呼ばれるコーディネートダイスに基づく新しいトレーニングプロトコルを提案する。
論文 参考訳(メタデータ) (2022-06-20T15:25:08Z) - Adaptive Quantization of Model Updates for Communication-Efficient
Federated Learning [75.45968495410047]
クライアントノードと中央集約サーバ間のモデル更新の通信は、連合学習において大きなボトルネックとなる。
グラディエント量子化(Gradient Quantization)は、各モデル更新間の通信に必要なビット数を削減する効果的な方法である。
通信効率と低エラーフロアを実現することを目的としたAdaFLと呼ばれる適応量子化戦略を提案する。
論文 参考訳(メタデータ) (2021-02-08T19:14:21Z) - Fully Quantized Image Super-Resolution Networks [81.75002888152159]
効率と精度を両立させるためのフル量子化画像超解像フレームワーク(FQSR)を提案する。
我々は、SRResNet、SRGAN、EDSRを含む複数の主流超解像アーキテクチャに量子化スキームを適用した。
低ビット量子化を用いたFQSRは、5つのベンチマークデータセットの完全精度と比較すると、パー性能で実現できる。
論文 参考訳(メタデータ) (2020-11-29T03:53:49Z) - Extrapolation for Large-batch Training in Deep Learning [72.61259487233214]
我々は、バリエーションのホストが、我々が提案する統一されたフレームワークでカバー可能であることを示す。
本稿では,この手法の収束性を証明し,ResNet,LSTM,Transformer上での経験的性能を厳格に評価する。
論文 参考訳(メタデータ) (2020-06-10T08:22:41Z) - Optimal Gradient Quantization Condition for Communication-Efficient
Distributed Training [99.42912552638168]
勾配の通信は、コンピュータビジョンアプリケーションで複数のデバイスでディープニューラルネットワークをトレーニングするのに費用がかかる。
本研究は,textbfANY勾配分布に対する二値および多値勾配量子化の最適条件を導出する。
最適条件に基づいて, 偏差BinGradと非偏差ORQの2値勾配量子化と多値勾配量子化の2つの新しい量子化手法を開発した。
論文 参考訳(メタデータ) (2020-02-25T18:28:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。