論文の概要: EENet: Learning to Early Exit for Adaptive Inference
- arxiv url: http://arxiv.org/abs/2301.07099v1
- Date: Sun, 15 Jan 2023 04:37:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-19 17:50:52.074051
- Title: EENet: Learning to Early Exit for Adaptive Inference
- Title(参考訳): EENet: アダプティブ推論の早期排除を学ぶ
- Authors: Fatih Ilhan, Ling Liu, Ka-Ho Chow, Wenqi Wei, Yanzhao Wu, Myungjin
Lee, Ramana Kompella, Hugo Latapie, Gaowen Liu
- Abstract要約: 早期出口による予算適応推論は、テスト時に限られたリソースを持つエッジAIアプリケーションのためのディープニューラルネットワーク(DNN)の計算効率を改善する新しい技術である。
我々は,マルチオブジェクト学習を利用して早期退避ポリシーを最適化する,EENetという新しいマルチエクイットDNN推論フレームワークを導入する。
その結果、既存の代表的早期退避技術と比較してEENetの性能改善が示された。
- 参考スコア(独自算出の注目度): 14.518037421423317
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Budgeted adaptive inference with early exits is an emerging technique to
improve the computational efficiency of deep neural networks (DNNs) for edge AI
applications with limited resources at test time. This method leverages the
fact that different test data samples may not require the same amount of
computation for a correct prediction. By allowing early exiting from full
layers of DNN inference for some test examples, we can reduce latency and
improve throughput of edge inference while preserving performance. Although
there have been numerous studies on designing specialized DNN architectures for
training early-exit enabled DNN models, most of the existing work employ
hand-tuned or manual rule-based early exit policies. In this study, we
introduce a novel multi-exit DNN inference framework, coined as EENet, which
leverages multi-objective learning to optimize the early exit policy for a
trained multi-exit DNN under a given inference budget. This paper makes two
novel contributions. First, we introduce the concept of early exit utility
scores by combining diverse confidence measures with class-wise prediction
scores to better estimate the correctness of test-time predictions at a given
exit. Second, we train a lightweight, budget-driven, multi-objective neural
network over validation predictions to learn the exit assignment scheduling for
query examples at test time. The EENet early exit scheduler optimizes both the
distribution of test samples to different exits and the selection of the exit
utility thresholds such that the given inference budget is satisfied while the
performance metric is maximized. Extensive experiments are conducted on five
benchmarks, including three image datasets (CIFAR-10, CIFAR-100, ImageNet) and
two NLP datasets (SST-2, AgNews). The results demonstrate the performance
improvements of EENet compared to existing representative early exit
techniques.
- Abstract(参考訳): 早期出口による予算適応推論は、テスト時に限られたリソースを持つエッジAIアプリケーションのためのディープニューラルネットワーク(DNN)の計算効率を改善する新しい技術である。
この方法は、異なるテストデータサンプルが正しい予測のために同じ量の計算を必要としないという事実を活用する。
テスト例では、DNN推論の全レイヤからの早期離脱を可能にすることで、レイテンシを削減し、パフォーマンスを維持しながらエッジ推論のスループットを向上させることができる。
アーリーエグジット可能なDNNモデルをトレーニングするためのDNNアーキテクチャを設計する研究は数多く行われているが、既存の作業の多くは手動または手動のルールベースのアーリーエグジットポリシーを採用している。
本研究では,多目的学習を活用し,所定の推論予算の下で訓練された多元性dnnの早期退出ポリシーを最適化する,新しい多元性dnn推論フレームワークeenetを提案する。
この論文は2つの新しい貢献をする。
まず,各出口におけるテストタイム予測の正しさをより正確に推定するために,多様な信頼度尺度とクラスワイズ予測スコアを組み合わせることで,早期出口ユーティリティスコアの概念を導入する。
次に,検証予測よりも軽量で予算駆動の多目的ニューラルネットワークをトレーニングし,クエリ例の終了割り当てスケジューリングをテスト時に学習する。
EENetアーリーエグゼクティブスケジューラは、異なるエグゼクティブへのテストサンプルの分布と、パフォーマンスメトリックを最大化しながら所定の推論予算を満たすエグゼクティブユーティリティしきい値の選択の両方を最適化する。
3つの画像データセット(CIFAR-10、CIFAR-100、ImageNet)と2つのNLPデータセット(SST-2、AgNews)を含む5つのベンチマークで大規模な実験が行われた。
その結果、既存の代表的早期退避技術と比較してEENetの性能改善が示された。
関連論文リスト
- DAISY: Data Adaptive Self-Supervised Early Exit for Speech Representation Models [55.608981341747246]
本稿では,データ適応型自己監督早期退避(DAISY)を導入する。
DAISYの適応性に関する分析では、ノイズの多いデータ上で(より多くのレイヤを使用して)遅い時間に、クリーンデータ上で(より少ないレイヤを使用して)モデルが早期に(より少ないレイヤを使用して)終了することを示しています。
論文 参考訳(メタデータ) (2024-06-08T12:58:13Z) - Anole: Adapting Diverse Compressed Models For Cross-Scene Prediction On Mobile Devices [17.542012577533015]
Anoleは、モバイルデバイス上のローカルDNNモデル推論に対処するための軽量なスキームである。
我々は、さまざまなタイプのモバイルデバイスにAnoleを実装し、無人航空機(UAV)に基づく広範囲なトレース駆動および実世界の実験を行う。
論文 参考訳(メタデータ) (2024-05-09T12:06:18Z) - CDMPP: A Device-Model Agnostic Framework for Latency Prediction of
Tensor Programs [11.025071880642974]
Deep Neural Networks (DNN)は、幅広い機械学習アプリケーションで優れたパフォーマンスを示している。
特定のデバイス上でDNNモデルやテンソルプログラムを実行するレイテンシを知ることは、さまざまなタスクで有用である。
クロスモデルおよびクロスデバイス予測のための効率的なテンソルプログラム遅延予測フレームワークCDMPPを提案する。
論文 参考訳(メタデータ) (2023-11-16T09:05:52Z) - Early-Exit Neural Networks with Nested Prediction Sets [26.618810100134862]
アーリーエグジットニューラルネットワーク(EENN)は、フォワードパス中に複数のステージで予測を提供することで、適応的で効率的な推論を可能にする。
共形予測や信頼できる集合といった標準的なベイズ的手法はEENNには適さない。
時効性信頼シーケンス(AVCS)について検討する。
これらのシーケンスは本質的にネストされており、EENNのシーケンシャルな予測に適している。
論文 参考訳(メタデータ) (2023-11-10T08:38:18Z) - Deep Neural Networks Tend To Extrapolate Predictably [51.303814412294514]
ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。
我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。
我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文 参考訳(メタデータ) (2023-10-02T03:25:32Z) - PerfSAGE: Generalized Inference Performance Predictor for Arbitrary Deep
Learning Models on Edge Devices [8.272409756443539]
本稿では、任意のDNNliteグラフ上の推論遅延、エネルギー、メモリフットプリントを予測する新しいグラフニューラルネットワークであるPerfSAGEについて述べる。
このデータセットを用いて、PerfSAGEをトレーニングし、すべてのターゲットとモデル検索空間にわたって平均絶対パーセンテージ誤差の5%で最先端の予測精度を示す実験結果を提供する。
論文 参考訳(メタデータ) (2023-01-26T08:59:15Z) - Boosted Dynamic Neural Networks [53.559833501288146]
典型的なEDNNは、ネットワークバックボーンの異なる層に複数の予測ヘッドを持つ。
モデルを最適化するために、これらの予測ヘッドとネットワークバックボーンは、トレーニングデータのバッチ毎にトレーニングされる。
トレーニングと2つのフェーズでのインプットの異なるテストは、トレーニングとデータ分散のテストのミスマッチを引き起こす。
EDNNを勾配強化にインスパイアされた付加モデルとして定式化し、モデルを効果的に最適化するための複数のトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-11-30T04:23:12Z) - Unsupervised Early Exit in DNNs with Multiple Exits [0.0]
我々は、Strong Dominance(SD)プロパティをほぼ満足することを示すために、事前訓練されたマルチエクイットDNNであるElastic BERTに焦点を当てた。
IMDbとYelpのデータセット上で,我々のアルゴリズムを実証的に検証する。
論文 参考訳(メタデータ) (2022-09-20T05:35:54Z) - Learning Reasoning Strategies in End-to-End Differentiable Proving [50.9791149533921]
条件付き定理プローバーは勾配に基づく最適化により最適規則選択戦略を学習する。
条件付き定理プローサは拡張性があり、CLUTRRデータセット上で最先端の結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-13T16:22:14Z) - Accuracy Prediction with Non-neural Model for Neural Architecture Search [185.0651567642238]
精度予測に非神経モデルを用いる別の手法について検討する。
我々は、ニューラルネットワーク探索(NAS)の予測因子として、勾配向上決定木(GBDT)を活用する。
NASBench-101とImageNetの実験は、NASの予測器としてGBDTを使用することの有効性を示した。
論文 参考訳(メタデータ) (2020-07-09T13:28:49Z) - ProphetNet: Predicting Future N-gram for Sequence-to-Sequence
Pre-training [85.35910219651572]
本稿ではProphetNetと呼ばれる新しいシーケンス・ツー・シーケンス事前学習モデルを提案する。
将来的なn-gram予測という,新たな自己教師型目標を導入している。
我々は,CNN/DailyMail,Gigaword,SQuAD 1.1ベンチマークを用いて,抽象的な要約と質問生成タスクの実験を行った。
論文 参考訳(メタデータ) (2020-01-13T05:12:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。