論文の概要: Cello: Efficient Computer Systems Optimization with Predictive Early
Termination and Censored Regression
- arxiv url: http://arxiv.org/abs/2204.04831v1
- Date: Mon, 11 Apr 2022 02:29:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-13 05:49:00.751906
- Title: Cello: Efficient Computer Systems Optimization with Predictive Early
Termination and Censored Regression
- Title(参考訳): Cello: 予測早期終了と補償回帰による効率的なコンピュータシステム最適化
- Authors: Yi Ding, Alex Renda, Ahsan Pervaiz, Michael Carbin, Henry Hoffmann
- Abstract要約: 本稿では,サンプル収集コストを削減するコンピュータシステム最適化フレームワークであるCelloを提案する。
重要な洞察は、サンプルがシステムの振る舞いが悪いかどうかを事前に予測することである。
Celloは電力制約下でのレイテンシの最小化のために1.19Xのレイテンシを改善し、遅延制約下でのエネルギーの最小化のために1.18Xのエネルギーを改善する。
- 参考スコア(独自算出の注目度): 20.685627913025456
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sample-efficient machine learning (SEML) has been widely applied to find
optimal latency and power tradeoffs for configurable computer systems. Instead
of randomly sampling from the configuration space, SEML reduces the search cost
by dramatically reducing the number of configurations that must be sampled to
optimize system goals (e.g., low latency or energy). Nevertheless, SEML only
reduces one component of cost -- the total number of samples collected -- but
does not decrease the cost of collecting each sample. Critically, not all
samples are equal; some take much longer to collect because they correspond to
slow system configurations. This paper present Cello, a computer systems
optimization framework that reduces sample collection costs -- especially those
that come from the slowest configurations. The key insight is to predict ahead
of time whether samples will have poor system behavior (e.g., long latency or
high energy) and terminate these samples early before their measured system
behavior surpasses the termination threshold, which we call it predictive early
termination. To predict the future system behavior accurately before it
manifests as high runtime or energy, Cello uses censored regression to produces
accurate predictions for running samples. We evaluate Cello by optimizing
latency and energy for Apache Spark workloads. We give Cello a fixed amount of
time to search a combined space of hardware and software configuration
parameters. Our evaluation shows that compared to the state-of-the-art SEML
approach in computer systems optimization, Cello improves latency by 1.19X for
minimizing latency under a power constraint, and improves energy by 1.18X for
minimizing energy under a latency constraint.
- Abstract(参考訳): サンプル効率機械学習(SEML)は、構成可能なコンピュータシステムに対して最適なレイテンシと電力トレードオフを求めるために広く応用されている。
構成空間からランダムにサンプリングする代わりに、SEMLはシステム目標(例えば低レイテンシやエネルギ)を最適化するためにサンプリングされる構成の数を劇的に削減することで、検索コストを削減する。
それでもsemlは、収集したサンプルの総数という、コストの1つのコンポーネントだけを削減できるが、各サンプルの収集コストを下げることはない。
重要な点として、すべてのサンプルが等しくはない。システム構成が遅いため、収集にはるかに時間がかかるものもある。
本稿では,最も遅い構成から得られるサンプル収集コストを削減したコンピュータシステム最適化フレームワークであるCelloについて述べる。
重要な洞察は、サンプルがシステムの動作不良(例えば、長いレイテンシや高エネルギー)を予測し、測定されたシステムの挙動が終了しきい値を超える前にこれらのサンプルを早期に終了することである。
将来のシステムの振る舞いを正確に予測するために、celloは、高いランタイムまたはエネルギーとして表される前に、検閲された回帰を使用して、サンプルの実行に関する正確な予測を生成する。
我々はApache Sparkワークロードのレイテンシとエネルギを最適化してCelloを評価する。
ハードウェアとソフトウェアのコンフィグレーションパラメータの組合せ空間を検索するのに、celloに一定の時間を与えます。
計算機システム最適化における最先端のsemlアプローチと比較して,celloは電力制約下でのレイテンシを最小化するためのレイテンシを1.19倍改善し,レイテンシ制約下でのエネルギーを最小化するエネルギーを1.18倍改善した。
関連論文リスト
- Adaptive Inference-Time Compute: LLMs Can Predict if They Can Do Better, Even Mid-Generation [51.127054971591924]
本稿では,生成サンプル数を適応的に削減する新たな自己評価手法を提案する。
平均1.2サンプルだけで16サンプルの使用による改善の74%が達成できることを実証した。
論文 参考訳(メタデータ) (2024-10-03T17:47:29Z) - Don't Stop Me Now: Embedding Based Scheduling for LLMs [22.099820814682513]
SRPT(Shortest Remaining Process Time)のようなサイズベースのスケジューリングアルゴリズムは、平均的な要求完了時間を削減することを目的としている。
LLMシステムにおけるメモリオーバーヘッドを考慮した予測型SRPT変種を提案する。
論文 参考訳(メタデータ) (2024-10-01T19:51:07Z) - Parallel Bayesian Optimization Using Satisficing Thompson Sampling for
Time-Sensitive Black-Box Optimization [0.0]
本稿では,Thompsonサンプリングに基づく並列BO手法を提案する。
ターゲットを最適なソリューションから、学習しやすい満足できるソリューションにシフトします。
リチウムイオン電池の高速充電設計問題に対して提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2023-10-19T07:03:51Z) - MAPLE-Edge: A Runtime Latency Predictor for Edge Devices [80.01591186546793]
汎用ハードウェアの最先端遅延予測器であるMAPLEのエッジデバイス指向拡張であるMAPLE-Edgeを提案する。
MAPLEと比較して、MAPLE-Edgeはより小さなCPUパフォーマンスカウンタを使用して、ランタイムとターゲットデバイスプラットフォームを記述することができる。
また、共通ランタイムを共有するデバイスプール上でトレーニングを行うMAPLEとは異なり、MAPLE-Edgeは実行時に効果的に一般化できることを示す。
論文 参考訳(メタデータ) (2022-04-27T14:00:48Z) - T*$\varepsilon$ -- Bounded-Suboptimal Efficient Motion Planning for
Minimum-Time Planar Curvature-Constrained Systems [7.277760003553328]
本研究では,障害物の存在下での曲率制約系の衝突のない経路を見つけることの問題点を考察する。
有界-準最適解を求めることにより、使用した時間-最適遷移の数を劇的に削減できることを示す。
論文 参考訳(メタデータ) (2022-04-04T17:38:36Z) - Breaking the Sample Complexity Barrier to Regret-Optimal Model-Free
Reinforcement Learning [52.76230802067506]
漸進的強化学習における後悔を最小限に抑えるために,新しいモデルフリーアルゴリズムを提案する。
提案アルゴリズムは、2つのQ-ラーニングシーケンスの助けを借りて、初期設定された参照更新ルールを用いる。
初期の分散還元法の設計原理は、他のRL設定とは独立した関心を持つかもしれない。
論文 参考訳(メタデータ) (2021-10-09T21:13:48Z) - Reducing the Variance of Gaussian Process Hyperparameter Optimization
with Preconditioning [54.01682318834995]
プレコンディショニングは、行列ベクトル乗算を含む反復的な方法にとって非常に効果的なステップである。
プレコンディショニングには、これまで検討されていなかった付加的なメリットがあることを実証する。
基本的に無視可能なコストで、同時に分散を低減することができる。
論文 参考訳(メタデータ) (2021-07-01T06:43:11Z) - Gradient-free optimization of chaotic acoustics with reservoir computing [6.345523830122166]
時間平均音響コスト関数を最小化する設計パラメータを求める多目的最適化法を開発した。
この方法は、勾配のないモデルインフォームドと、エコー状態ネットワークに基づく貯水池計算によるデータ駆動である。
論文 参考訳(メタデータ) (2021-06-17T19:49:45Z) - Efficient Micro-Structured Weight Unification and Pruning for Neural
Network Compression [56.83861738731913]
ディープニューラルネットワーク(DNN)モデルは、特にリソース制限されたデバイスにおいて、実用的なアプリケーションに不可欠である。
既往の非構造的あるいは構造化された重量刈り法は、推論を真に加速することはほとんど不可能である。
ハードウェア互換のマイクロ構造レベルでの一般化された重み統一フレームワークを提案し,高い圧縮と加速度を実現する。
論文 参考訳(メタデータ) (2021-06-15T17:22:59Z) - Federated Learning via Intelligent Reflecting Surface [30.935389187215474]
オーバー・ザ・エア・コンピューティング・アルゴリズム(FL)は,複数のアクセスチャネルの波形重畳特性を利用して高速なモデルアグリゲーションを実現することができる。
本稿では,AirCompベースのFLのための高速かつ信頼性の高いモデルアグリゲーションを実現するための2段階最適化フレームワークを提案する。
シミュレーションの結果,提案するフレームワークとIRSの展開により,ベースラインアルゴリズムよりもトレーニング損失が低く,FL予測精度も高いことがわかった。
論文 参考訳(メタデータ) (2020-11-10T11:29:57Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。