論文の概要: Anticipate, Ensemble and Prune: Improving Convolutional Neural Networks
via Aggregated Early Exits
- arxiv url: http://arxiv.org/abs/2301.12168v1
- Date: Sat, 28 Jan 2023 11:45:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 18:37:55.885548
- Title: Anticipate, Ensemble and Prune: Improving Convolutional Neural Networks
via Aggregated Early Exits
- Title(参考訳): 予測、アンサンブル、プルーン:集約早期出口による畳み込みニューラルネットワークの改善
- Authors: Simone Sarti, Eugenio Lomurno, Matteo Matteucci
- Abstract要約: 我々は,早期出口の重み付けアンサンブルに基づく新たなトレーニング手法であるPrecipate,Ensemble and Prune(AEP)を提示する。
AEPは従来のトレーニングよりも平均精度を最大15%向上させることができる。
- 参考スコア(独自算出の注目度): 7.967995669387532
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Today, artificial neural networks are the state of the art for solving a
variety of complex tasks, especially in image classification. Such
architectures consist of a sequence of stacked layers with the aim of
extracting useful information and having it processed by a classifier to make
accurate predictions. However, intermediate information within such models is
often left unused. In other cases, such as in edge computing contexts, these
architectures are divided into multiple partitions that are made functional by
including early exits, i.e. intermediate classifiers, with the goal of reducing
the computational and temporal load without extremely compromising the accuracy
of the classifications. In this paper, we present Anticipate, Ensemble and
Prune (AEP), a new training technique based on weighted ensembles of early
exits, which aims at exploiting the information in the structure of networks to
maximise their performance. Through a comprehensive set of experiments, we show
how the use of this approach can yield average accuracy improvements of up to
15% over traditional training. In its hybrid-weighted configuration, AEP's
internal pruning operation also allows reducing the number of parameters by up
to 41%, lowering the number of multiplications and additions by 18% and the
latency time to make inference by 16%. By using AEP, it is also possible to
learn weights that allow early exits to achieve better accuracy values than
those obtained from single-output reference models.
- Abstract(参考訳): 今日、ニューラルネットワークは、特に画像分類において、様々な複雑なタスクを解決するための最先端の技術である。
このようなアーキテクチャは、有用な情報を抽出し、分類器によって処理することで正確な予測を行う目的で、積み重ねられたレイヤのシーケンスで構成されている。
しかし、そのようなモデル内の中間情報はよく使われない。
エッジコンピューティングのコンテキストのような他のケースでは、これらのアーキテクチャは、分類の精度を極端に損なうことなく計算負荷と時間負荷を減少させることを目的として、初期の出口、すなわち中間分類器を含む機能化される複数のパーティションに分割される。
本稿では,初期出口の重み付けアンサンブルに基づく新たなトレーニング手法であるPrecipate, Ensemble and Prune(AEP)を提案する。
総合的な実験を通じて,本手法の利用により,従来のトレーニングと比較して,平均精度が最大15%向上することを示す。
ハイブリッドウェイト構成では、AEPの内部プルーニング操作はパラメータの数を最大41%削減し、乗算と加算の数を18%削減し、遅延時間を16%短縮する。
AEPを使用することで、早期出口が単一出力参照モデルから得られるものよりも精度の高い値が得られる重みを学習することもできる。
関連論文リスト
- YOSO: You-Only-Sample-Once via Compressed Sensing for Graph Neural Network Training [9.02251811867533]
YOSO(You-Only-Sample-Once)は、予測精度を維持しながら効率的なトレーニングを実現するアルゴリズムである。
YOSOは、正規直交基底計算のような従来の圧縮センシング(CS)法で高価な計算を避けるだけでなく、高い確率精度の保持も保証している。
論文 参考訳(メタデータ) (2024-11-08T16:47:51Z) - Unrolled denoising networks provably learn optimal Bayesian inference [54.79172096306631]
我々は、近似メッセージパッシング(AMP)のアンロールに基づくニューラルネットワークの最初の厳密な学習保証を証明した。
圧縮センシングでは、製品から引き出されたデータに基づいてトレーニングを行うと、ネットワークの層がベイズAMPで使用されるのと同じデノイザーに収束することを示す。
論文 参考訳(メタデータ) (2024-09-19T17:56:16Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - AIO-P: Expanding Neural Performance Predictors Beyond Image
Classification [22.743278613519152]
アーキテクチャの例でニューラルネットワーク予測器を事前訓練するための新しいオールインワン予測器(AIO-P)を提案する。
AIO-Pは平均絶対誤差(MAE)とスピアマンランク相関(SRCC)をそれぞれ1%以下と0.5以上で達成できる。
論文 参考訳(メタデータ) (2022-11-30T18:30:41Z) - Pushing the Efficiency Limit Using Structured Sparse Convolutions [82.31130122200578]
本稿では,画像の固有構造を利用して畳み込みフィルタのパラメータを削減する構造的スパース畳み込み(SSC)を提案する。
我々は、SSCが効率的なアーキテクチャにおける一般的なレイヤ(奥行き、グループ回り、ポイント回りの畳み込み)の一般化であることを示す。
SSCに基づくアーキテクチャは、CIFAR-10、CIFAR-100、Tiny-ImageNet、ImageNet分類ベンチマークのベースラインと比較して、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-23T18:37:22Z) - Layer Ensembles [95.42181254494287]
本稿では,ネットワークの各層に対する独立なカテゴリ分布の集合を考慮した不確実性推定手法を提案する。
その結果,メモリと実行時間が少なくなるモデルが得られた。
論文 参考訳(メタデータ) (2022-10-10T17:52:47Z) - Towards Disentangling Information Paths with Coded ResNeXt [11.884259630414515]
ネットワーク全体の機能の透明性を高めるために,我々は新しいアプローチを採っている。
分類のためのニューラルネットワークアーキテクチャを提案し、各クラスに関連する情報が特定の経路を流れる。
論文 参考訳(メタデータ) (2022-02-10T21:45:49Z) - Analytically Tractable Inference in Deep Neural Networks [0.0]
Tractable Approximate Inference (TAGI)アルゴリズムは、浅いフルコネクテッドニューラルネットワークのバックプロパゲーションに対する実行可能でスケーラブルな代替手段であることが示された。
従来のディープニューラルネットワークアーキテクチャをトレーニングするために、TAGIがバックプロパゲーションのパフォーマンスとどのように一致するか、または上回るかを実証しています。
論文 参考訳(メタデータ) (2021-03-09T14:51:34Z) - Rapid Structural Pruning of Neural Networks with Set-based Task-Adaptive
Meta-Pruning [83.59005356327103]
既存のプルーニング技術に共通する制限は、プルーニングの前に少なくとも1回はネットワークの事前トレーニングが必要であることである。
本稿では,ターゲットデータセットの関数としてプルーニングマスクを生成することにより,大規模な参照データセット上で事前訓練されたネットワークをタスク適応的にプルークするSTAMPを提案する。
ベンチマークデータセット上での最近の先進的なプルーニング手法に対するSTAMPの有効性を検証する。
論文 参考訳(メタデータ) (2020-06-22T10:57:43Z) - Fitting the Search Space of Weight-sharing NAS with Graph Convolutional
Networks [100.14670789581811]
サンプルサブネットワークの性能に適合するグラフ畳み込みネットワークを訓練する。
この戦略により、選択された候補集合において、より高いランク相関係数が得られる。
論文 参考訳(メタデータ) (2020-04-17T19:12:39Z) - Anytime Inference with Distilled Hierarchical Neural Ensembles [32.003196185519]
深層ニューラルネットワークの推論は計算コストがかかり、計算量や入力データの量が時間とともに変化するマスケリオでは、任意の時間推論が可能なネットワークが重要である。
階層型木構造に複数のネットワークのアンサンブルを埋め込む新しいフレームワークである階層型ニューラルネットワークアンサンブル(HNE)を提案する。
実験の結果,従来の推定モデルと比較して,HNEはCIFAR-10/100データセットとImageNetデータセットに対して,最先端の精度計算トレードオフを提供することがわかった。
論文 参考訳(メタデータ) (2020-03-03T12:13:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。