論文の概要: Credence: Augmenting Datacenter Switch Buffer Sharing with ML
Predictions
- arxiv url: http://arxiv.org/abs/2401.02801v1
- Date: Fri, 5 Jan 2024 13:29:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-08 15:06:10.357346
- Title: Credence: Augmenting Datacenter Switch Buffer Sharing with ML
Predictions
- Title(参考訳): Credence: ML予測によるデータセンタスイッチバッファ共有の強化
- Authors: Vamsi Addanki, Maciej Pacut and Stefan Schmid
- Abstract要約: 我々は,機械学習予測を付加したドロップテールバッファ共有アルゴリズムであるCredenceを提案する。
評価の結果,Credenceのスループットは従来のアプローチに比べて1.5ドル向上した。
- 参考スコア(独自算出の注目度): 15.580679183219242
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Packet buffers in datacenter switches are shared across all the switch ports
in order to improve the overall throughput. The trend of shrinking buffer sizes
in datacenter switches makes buffer sharing extremely challenging and a
critical performance issue. Literature suggests that push-out buffer sharing
algorithms have significantly better performance guarantees compared to
drop-tail algorithms. Unfortunately, switches are unable to benefit from these
algorithms due to lack of support for push-out operations in hardware. Our key
observation is that drop-tail buffers can emulate push-out buffers if the
future packet arrivals are known ahead of time. This suggests that augmenting
drop-tail algorithms with predictions about the future arrivals has the
potential to significantly improve performance.
This paper is the first research attempt in this direction. We propose
Credence, a drop-tail buffer sharing algorithm augmented with machine-learned
predictions. Credence can unlock the performance only attainable by push-out
algorithms so far. Its performance hinges on the accuracy of predictions.
Specifically, Credence achieves near-optimal performance of the best known
push-out algorithm LQD (Longest Queue Drop) with perfect predictions, but
gracefully degrades to the performance of the simplest drop-tail algorithm
Complete Sharing when the prediction error gets arbitrarily worse. Our
evaluations show that Credence improves throughput by $1.5$x compared to
traditional approaches. In terms of flow completion times, we show that
Credence improves upon the state-of-the-art approaches by up to $95\%$ using
off-the-shelf machine learning techniques that are also practical in today's
hardware. We believe this work opens several interesting future work
opportunities both in systems and theory that we discuss at the end of this
paper.
- Abstract(参考訳): データセンタスイッチのパケットバッファは、全体のスループットを改善するために、すべてのスイッチポートで共有される。
データセンタースイッチのバッファサイズを縮小する傾向は、バッファ共有を非常に困難にし、重要なパフォーマンス問題となっている。
文献によると、プッシュアウトバッファ共有アルゴリズムはドロップテールアルゴリズムよりも性能保証がはるかに優れている。
残念ながら、ハードウェアでのプッシュアウト操作のサポートがないため、スイッチはこれらのアルゴリズムの恩恵を受けることができない。
私たちのキーとなる観察は、将来のパケット到着が事前に分かっている場合、ドロップテールバッファはプッシュアウトバッファをエミュレートできるということです。
これは、将来的な到着予測を伴うドロップテールアルゴリズムの強化が、パフォーマンスを大幅に改善する可能性を示唆している。
本稿は,本研究の最初の試みである。
機械学習予測を付加したドロップテールバッファ共有アルゴリズムであるCredenceを提案する。
Credenceは、これまでプッシュアウトアルゴリズムでしか達成できなかったパフォーマンスをアンロックできる。
その性能は予測の正確さにかかっている。
具体的には,最もよく知られたプッシュアウトアルゴリズムであるLQD(Longest Queue Drop)の最適性能を完璧に予測するが,予測誤差が任意に悪くなると,最も単純なドロップテールアルゴリズムであるComplete Sharingの性能に優しく低下する。
評価の結果,従来の手法に比べてスループットが1.5ドル向上した。
フローコンプリート時間の観点からは、Credenceは、現在のハードウェアでも実用的な既製の機械学習技術を使用して、最先端のアプローチを最大9,5\%改善することを示す。
本稿の最後に論じるシステムと理論の両方において、この研究がいくつかの興味深い将来的な仕事の機会を開くと信じている。
関連論文リスト
- Computational Tradeoffs in Image Synthesis: Diffusion, Masked-Token, and Next-Token Prediction [79.78050867137594]
拡散、マスク付きトーケン予測、および次のトーケン予測はすべてトランスフォーマーネットワークアーキテクチャを使用する。
FLOPで測定された計算予算のレンズを用いて,各手法のスケーラビリティを解析する。
次点予測によって導かれるトークン予測手法は, 後続のプロンプト上での拡散率を著しく上回ることがわかった。
論文 参考訳(メタデータ) (2024-05-21T21:49:39Z) - Clover: Regressive Lightweight Speculative Decoding with Sequential Knowledge [24.203554078434365]
並列復号処理にシーケンシャルな知識を統合する新しい投機的復号アルゴリズムであるCloverを提案する。
クローバーは、バイチュアン=スモールでは91%、バイチュアン=ラージュでは146%でベースラインを上回っている。
論文 参考訳(メタデータ) (2024-05-01T00:46:22Z) - Learning-Augmented Algorithms with Explicit Predictors [67.02156211760415]
アルゴリズム設計の最近の進歩は、過去のデータと現在のデータから得られた機械学習モデルによる予測の活用方法を示している。
この文脈における以前の研究は、予測器が過去のデータに基づいて事前訓練され、ブラックボックスとして使用されるパラダイムに焦点を当てていた。
本研究では,予測器を解き,アルゴリズムの課題の中で生じる学習問題を統合する。
論文 参考訳(メタデータ) (2024-03-12T08:40:21Z) - CiFlow: Dataflow Analysis and Optimization of Key Switching for Homomorphic Encryption [2.704681057324485]
ホモモルフィック暗号化(HE)は、暗号化されたデータの計算を可能にするプライバシー保護計算技術である。
HEは極めて遅いため、実際のアプリケーションでは使用できない。
本稿では,そのデータフローを厳密に解析することでHE性能を向上させる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-02T21:08:56Z) - Learning-Augmented Maximum Flow [3.0712335337791288]
本稿では,予測を用いて最大流れ計算を高速化するフレームワークを提案する。
我々は,$m$のエッジフローネットワークと予測フローが与えられた場合,最大フローを$O(meta)$時間で計算するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-26T14:02:41Z) - TransforMAP: Transformer for Memory Access Prediction [10.128730975303407]
データプリフェッチ(Data Prefetching)は、プログラムが必要とするデータを取得することで、メモリ遅延を隠蔽するテクニックである。
アドレス空間全体から学習できる強力なTransformerモデルに基づいてTransforMAPを開発した。
我々は,最先端の捕食者やISB捕食者よりも高い35.67%のMPKI改善が達成されていることを示す。
論文 参考訳(メタデータ) (2022-05-29T22:14:38Z) - NURD: Negative-Unlabeled Learning for Online Datacenter Straggler
Prediction [17.346001585453415]
タスクが完了するとタスクが完了するので、ストラグラーはパフォーマンスの大きな障害になります。
本稿では,再重み付けと分散補償を併用した新しい負非ラベル学習手法であるNURDを提案する。
NURDをGoogleとAlibabaの2つの製品トレースで評価する。
論文 参考訳(メタデータ) (2022-03-16T01:15:50Z) - Robustification of Online Graph Exploration Methods [59.50307752165016]
我々は、古典的で有名なオンライングラフ探索問題の学習強化版について研究する。
本稿では,予測をよく知られたNearest Neighbor(NN)アルゴリズムに自然に統合するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-10T10:02:31Z) - Injecting Knowledge in Data-driven Vehicle Trajectory Predictors [82.91398970736391]
車両軌道予測タスクは、一般的に知識駆動とデータ駆動の2つの視点から取り組まれている。
本稿では,これら2つの視点を効果的に結合する「現実的残留ブロック」 (RRB) の学習を提案する。
提案手法は,残留範囲を限定し,その不確実性を考慮した現実的な予測を行う。
論文 参考訳(メタデータ) (2021-03-08T16:03:09Z) - Double Coverage with Machine-Learned Advice [100.23487145400833]
オンラインの基本的な$k$-serverの問題を学習強化環境で研究する。
我々のアルゴリズムは任意の k に対してほぼ最適の一貫性-破壊性トレードオフを達成することを示す。
論文 参考訳(メタデータ) (2021-03-02T11:04:33Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。