論文の概要: Towards Anytime Classification in Early-Exit Architectures by Enforcing
Conditional Monotonicity
- arxiv url: http://arxiv.org/abs/2306.02652v2
- Date: Sun, 29 Oct 2023 18:35:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 21:37:53.149493
- Title: Towards Anytime Classification in Early-Exit Architectures by Enforcing
Conditional Monotonicity
- Title(参考訳): 条件付き単調性強制による初期itアーキテクチャの時限分類に向けて
- Authors: Metod Jazbec, James Urquhart Allingham, Dan Zhang, Eric Nalisnick
- Abstract要約: 任意のアルゴリズムは、計算予算が動的である環境に適しています。
現在のアーリーエグジットネットワークは、任意の設定に直接適用できないことを示す。
本稿では,製品・オブ・エグゼクティブ(Product-of-Experts)に基づくエレガントなポストホック修正を提案する。
- 参考スコア(独自算出の注目度): 5.425028186820756
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern predictive models are often deployed to environments in which
computational budgets are dynamic. Anytime algorithms are well-suited to such
environments as, at any point during computation, they can output a prediction
whose quality is a function of computation time. Early-exit neural networks
have garnered attention in the context of anytime computation due to their
capability to provide intermediate predictions at various stages throughout the
network. However, we demonstrate that current early-exit networks are not
directly applicable to anytime settings, as the quality of predictions for
individual data points is not guaranteed to improve with longer computation. To
address this shortcoming, we propose an elegant post-hoc modification, based on
the Product-of-Experts, that encourages an early-exit network to become
gradually confident. This gives our deep models the property of conditional
monotonicity in the prediction quality -- an essential stepping stone towards
truly anytime predictive modeling using early-exit architectures. Our empirical
results on standard image-classification tasks demonstrate that such behaviors
can be achieved while preserving competitive accuracy on average.
- Abstract(参考訳): 現代の予測モデルは、しばしば計算予算が動的である環境に展開される。
アルゴリズムは、計算中の任意の時点において、計算時間の関数である品質の予測を出力できるような環境に適している。
ニューラルネットワークは、ネットワークのさまざまな段階で中間的な予測を提供する能力のために、任意の時間計算の文脈で注目を集めている。
しかし,各データポイントの予測の質は,計算時間を長くすれば改善することが保証されていないため,現在のアーリーエクイットネットワークはいつでも適用できないことを示す。
この欠点に対処するため,我々は,アーリーエクイティネットワークが徐々に自信を持つようになるように促す,専門家の製品に基づくエレガントなポストホックな修正を提案する。
これにより、私たちの深層モデルには、予測品質における条件付き単調性の性質が与えられます。
画像分類タスクにおける実験結果から, 平均精度を保ちながら, このような動作を実現できることを示す。
関連論文リスト
- Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.24539704456791]
都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。
最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。
我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文 参考訳(メタデータ) (2024-07-18T15:44:23Z) - Loss Shaping Constraints for Long-Term Time Series Forecasting [79.3533114027664]
本稿では,長期時系列予測のための制約付き学習手法を提案する。
提案手法は, 予測ウィンドウ上でエラーを発生させながら, 時系列ベンチマークにおける競合平均性能を示すことを示すための, 実用的なプリマル・デュアルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-14T18:20:44Z) - An Adaptive Framework for Generalizing Network Traffic Prediction
towards Uncertain Environments [51.99765487172328]
我々は,モバイルネットワークトラフィック予測モデルを動的に割り当てるための時系列解析を用いた新しいフレームワークを開発した。
我々のフレームワークは学習した振る舞いを採用しており、現在の研究と比較して50%以上の改善が得られ、どのモデルよりも優れています。
論文 参考訳(メタデータ) (2023-11-30T18:58:38Z) - Non-Clairvoyant Scheduling with Predictions Revisited [77.86290991564829]
非論理的スケジューリングでは、優先度不明な処理条件でジョブをスケジューリングするためのオンライン戦略を見つけることが課題である。
我々はこのよく研究された問題を、アルゴリズム設計に(信頼できない)予測を統合する、最近人気の高い学習強化された設定で再検討する。
これらの予測には所望の特性があり, 高い性能保証を有するアルゴリズムと同様に, 自然な誤差測定が可能であることを示す。
論文 参考訳(メタデータ) (2022-02-21T13:18:11Z) - Meta-Forecasting by combining Global DeepRepresentations with Local
Adaptation [12.747008878068314]
メタグローバルローカル自動回帰(Meta-GLAR)と呼ばれる新しい予測手法を導入する。
それは、リカレントニューラルネットワーク(RNN)によって生成された表現からワンステップアヘッド予測へのマッピングをクローズドフォームで学習することで、各時系列に適応する。
本手法は,先行研究で報告されたサンプル外予測精度において,最先端の手法と競合する。
論文 参考訳(メタデータ) (2021-11-05T11:45:02Z) - Confidence Adaptive Anytime Pixel-Level Recognition [86.75784498879354]
任意の時間推論は、いつでも停止される可能性のある予測の進行を行うモデルを必要とする。
我々は,任意のピクセルレベルの認識に対して,最初の統一とエンドツーエンドのモデルアプローチを提案する。
論文 参考訳(メタデータ) (2021-04-01T20:01:57Z) - Predicting Temporal Sets with Deep Neural Networks [50.53727580527024]
本稿では,時間集合予測のためのディープニューラルネットワークに基づく統合解を提案する。
ユニークな視点は、セットレベルの共起グラフを構築することで要素関係を学ぶことである。
我々は,要素や集合の時間依存性を適応的に学習するアテンションベースのモジュールを設計する。
論文 参考訳(メタデータ) (2020-06-20T03:29:02Z) - A machine learning approach for forecasting hierarchical time series [4.157415305926584]
階層時系列を予測するための機械学習手法を提案する。
予測整合は予測を調整し、階層をまたいで一貫性を持たせるプロセスである。
我々は、階層構造をキャプチャする情報を抽出するディープニューラルネットワークの能力を利用する。
論文 参考訳(メタデータ) (2020-05-31T22:26:16Z) - Predictive Business Process Monitoring via Generative Adversarial Nets:
The Case of Next Event Prediction [0.026249027950824504]
本稿では,次の事象予測の問題に対処するための,新たな逆トレーニングフレームワークを提案する。
これは、2人のプレイヤーのゲームで1つのニューラルネットワークをもう1つのニューラルネットワークと対戦させることで機能し、それは地上の真実と区別できない予測につながる。
単純なネットワークアーキテクチャとナイーブな特徴符号化を使用しても、正確さと予測のイヤーラインの両方において、体系的にすべてのベースラインを上回ります。
論文 参考訳(メタデータ) (2020-03-25T08:31:28Z) - A clustering approach to time series forecasting using neural networks:
A comparative study on distance-based vs. feature-based clustering methods [1.256413718364189]
動的測定を用いて時系列データを予測するために,様々なニューラルネットワークアーキテクチャを提案する。
また,異常検出やクラスタリングなどの手法が予測精度に与える影響についても検討した。
その結果,クラスタリングは全体の予測時間を改善するとともに,ニューラルネットワークの予測性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2020-01-27T00:31:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。