論文の概要: Rethinking Differentiable Search for Mixed-Precision Neural Networks
- arxiv url: http://arxiv.org/abs/2004.05795v1
- Date: Mon, 13 Apr 2020 07:02:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 22:59:44.049523
- Title: Rethinking Differentiable Search for Mixed-Precision Neural Networks
- Title(参考訳): 混合精度ニューラルネットワークにおける微分可能探索の再考
- Authors: Zhaowei Cai and Nuno Vasconcelos
- Abstract要約: 低ビット幅に量子化された重みとアクティベーションを持つ低精度ネットワークは、エッジデバイスでの推論を加速するために広く利用されている。
現在の解は均一であり、全てのフィルタに同じビット幅を使用する。
これは異なるフィルタの異なる感度を考慮せず、最適以下である。
混合精度ネットワークは、ビット幅を個々のフィルタ要求に調整することでこの問題に対処する。
- 参考スコア(独自算出の注目度): 83.55785779504868
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Low-precision networks, with weights and activations quantized to low
bit-width, are widely used to accelerate inference on edge devices. However,
current solutions are uniform, using identical bit-width for all filters. This
fails to account for the different sensitivities of different filters and is
suboptimal. Mixed-precision networks address this problem, by tuning the
bit-width to individual filter requirements. In this work, the problem of
optimal mixed-precision network search (MPS) is considered. To circumvent its
difficulties of discrete search space and combinatorial optimization, a new
differentiable search architecture is proposed, with several novel
contributions to advance the efficiency by leveraging the unique properties of
the MPS problem. The resulting Efficient differentiable MIxed-Precision network
Search (EdMIPS) method is effective at finding the optimal bit allocation for
multiple popular networks, and can search a large model, e.g. Inception-V3,
directly on ImageNet without proxy task in a reasonable amount of time. The
learned mixed-precision networks significantly outperform their uniform
counterparts.
- Abstract(参考訳): 低ビット幅に量子化された重みとアクティベーションを持つ低精度ネットワークは、エッジデバイスでの推論を加速するために広く利用されている。
しかし、現在のソリューションは一様であり、すべてのフィルタに同じビット幅を使用する。
これは異なるフィルタの異なる感度を考慮せず、準最適である。
混合精度ネットワークは、ビット幅を個々のフィルタ要求に調整することでこの問題に対処する。
本研究では,最適混合精度ネットワーク探索(MPS)の問題点を考察する。
離散的な探索空間と組合せ最適化の難しさを回避するために,MPS問題のユニークな特性を活用することで効率を向上させるために,新たな微分可能な探索アーキテクチャを提案する。
EdMIPS(Efficient differentiable MIxed-Precision Network Search)法は、複数の人気ネットワークに対して最適なビット割り当てを見つけるのに有効であり、例えばInception-V3のような大きなモデルを、プロキシタスクを適切な時間でImageNet上で直接検索することができる。
学習された混合精度ネットワークは、その均一なネットワークを著しく上回っている。
関連論文リスト
- Optimization Guarantees of Unfolded ISTA and ADMM Networks With Smooth
Soft-Thresholding [57.71603937699949]
我々は,学習エポックの数の増加とともに,ほぼゼロに近いトレーニング損失を達成するための最適化保証について検討した。
トレーニングサンプル数に対する閾値は,ネットワーク幅の増加とともに増加することを示す。
論文 参考訳(メタデータ) (2023-09-12T13:03:47Z) - Free Bits: Latency Optimization of Mixed-Precision Quantized Neural
Networks on the Edge [17.277918711842457]
混合精度量子化は、モデルサイズ、レイテンシ、統計的精度の間のトレードオフを最適化する機会を提供する。
本稿では,与えられたネットワークに対する混合精度構成の探索空間をナビゲートするハイブリッド探索手法を提案する。
ハードウェアに依存しない差別化検索アルゴリズムと、特定のハードウェアターゲットに対して遅延最適化された混合精度構成を見つけるハードウェア対応最適化で構成されている。
論文 参考訳(メタデータ) (2023-07-06T09:57:48Z) - A Practical Mixed Precision Algorithm for Post-Training Quantization [15.391257986051249]
混合精度量子化は、均一な量子化よりも優れた性能効率トレードオフを見つけるための有望な解である。
簡単な学習後混合精度アルゴリズムを提案する。
我々は,同質のビット幅等価値よりも精度と効率のトレードオフが良い混合精度ネットワークを見つけることができることを示す。
論文 参考訳(メタデータ) (2023-02-10T17:47:54Z) - Network Pruning via Feature Shift Minimization [8.593369249204132]
本稿では,CNNモデルを圧縮するための新しい特徴シフト最小化(FSM)手法を提案する。
提案手法は,様々なベンチマークネットワークやデータセット上での最先端性能を,広範な実験により検証する。
論文 参考訳(メタデータ) (2022-07-06T12:50:26Z) - Manifold Regularized Dynamic Network Pruning [102.24146031250034]
本稿では,全インスタンスの多様体情報をプルーンドネットワークの空間に埋め込むことにより,冗長フィルタを動的に除去する新しいパラダイムを提案する。
提案手法の有効性をいくつかのベンチマークで検証し,精度と計算コストの両面で優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-10T03:59:03Z) - Effective and Fast: A Novel Sequential Single Path Search for
Mixed-Precision Quantization [45.22093693422085]
混合精度量子化モデルは、異なる層の感度に応じて異なる量子化ビット精度にマッチし、優れた性能を達成できます。
いくつかの制約に従ってディープニューラルネットワークにおける各層の量子化ビット精度を迅速に決定することは難しい問題である。
混合精度量子化のための新規なシーケンシャルシングルパス探索(SSPS)法を提案する。
論文 参考訳(メタデータ) (2021-03-04T09:15:08Z) - Hierarchical Dynamic Filtering Network for RGB-D Salient Object
Detection [91.43066633305662]
RGB-D Salient Object Detection (SOD) の主な目的は、相互融合情報をよりよく統合し活用する方法である。
本稿では,これらの問題を新たな視点から考察する。
我々は、より柔軟で効率的なマルチスケールのクロスモーダルな特徴処理を実装している。
論文 参考訳(メタデータ) (2020-07-13T07:59:55Z) - Dependency Aware Filter Pruning [74.69495455411987]
重要でないフィルタを割ることは、推論コストを軽減するための効率的な方法である。
以前の作業は、その重み基準やそれに対応するバッチノームスケーリング要因に従ってフィルタをプルークする。
所望の空間性を達成するために,空間性誘導正規化を動的に制御する機構を提案する。
論文 参考訳(メタデータ) (2020-05-06T07:41:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。