論文の概要: CloudFormer: An Attention-based Performance Prediction for Public Clouds with Unknown Workload
- arxiv url: http://arxiv.org/abs/2509.03394v1
- Date: Wed, 03 Sep 2025 15:15:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.570644
- Title: CloudFormer: An Attention-based Performance Prediction for Public Clouds with Unknown Workload
- Title(参考訳): CloudFormer: 未知のワークロードを持つパブリッククラウドのパフォーマンス予測
- Authors: Amirhossein Shahbazinia, Darong Huang, Luis Costero, David Atienza,
- Abstract要約: クラウドプラットフォームは、多様なリソース集約的なワークロードをホストするためにますます頼りになっています。
VMスケジューリングやリソースプロビジョニングといった既存の管理技術は、正確なパフォーマンス予測を必要とします。
ブラックボックス環境におけるVM性能劣化を予測するために設計された,デュアルブランチトランスフォーマーベースのモデルであるCloudFormerを提案する。
- 参考スコア(独自算出の注目度): 9.00677252346245
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cloud platforms are increasingly relied upon to host diverse, resource-intensive workloads due to their scalability, flexibility, and cost-efficiency. In multi-tenant cloud environments, virtual machines are consolidated on shared physical servers to improve resource utilization. While virtualization guarantees resource partitioning for CPU, memory, and storage, it cannot ensure performance isolation. Competition for shared resources such as last-level cache, memory bandwidth, and network interfaces often leads to severe performance degradation. Existing management techniques, including VM scheduling and resource provisioning, require accurate performance prediction to mitigate interference. However, this remains challenging in public clouds due to the black-box nature of VMs and the highly dynamic nature of workloads. To address these limitations, we propose CloudFormer, a dual-branch Transformer-based model designed to predict VM performance degradation in black-box environments. CloudFormer jointly models temporal dynamics and system-level interactions, leveraging 206 system metrics at one-second resolution across both static and dynamic scenarios. This design enables the model to capture transient interference effects and adapt to varying workload conditions without scenario-specific tuning. Complementing the methodology, we provide a fine-grained dataset that significantly expands the temporal resolution and metric diversity compared to existing benchmarks. Experimental results demonstrate that CloudFormer consistently outperforms state-of-the-art baselines across multiple evaluation metrics, achieving robust generalization across diverse and previously unseen workloads. Notably, CloudFormer attains a mean absolute error (MAE) of just 7.8%, representing a substantial improvement in predictive accuracy and outperforming existing methods at least by 28%.
- Abstract(参考訳): クラウドプラットフォームは、スケーラビリティ、柔軟性、コスト効率のために、多様なリソース集約的なワークロードをホストすることにますます頼りになっています。
マルチテナントクラウド環境では、仮想マシンは共有物理サーバ上で統合され、リソース利用を改善する。
仮想化はCPU、メモリ、ストレージのリソースパーティショニングを保証するが、パフォーマンスの分離を保証することはできない。
最終レベルキャッシュ、メモリ帯域幅、ネットワークインターフェースといった共有リソースの競合は、しばしばパフォーマンスを著しく低下させる。
VMスケジューリングやリソースプロビジョニングといった既存の管理技術では、干渉を緩和するために正確なパフォーマンス予測が必要である。
しかし、VMのブラックボックスの性質とワークロードの非常にダイナミックな性質のため、パブリッククラウドでは依然としてこれは難しい。
これらの制約に対処するために,ブラックボックス環境におけるVM性能劣化を予測するために設計された,デュアルブランチトランスフォーマーベースのモデルであるCloudFormerを提案する。
CloudFormerは、時間的ダイナミクスとシステムレベルのインタラクションを共同でモデル化し、静的シナリオと動的シナリオの両方で1秒の解像度で206のシステムメトリクスを活用する。
この設計により、モデルが過渡的干渉効果を捕捉し、シナリオ固有のチューニングなしで様々なワークロード条件に適応することができる。
提案手法を補完し,既存のベンチマークと比較して時間分解能と計量の多様性を著しく拡大する詳細なデータセットを提供する。
実験結果によると、CloudFormerは、複数の評価指標で、最先端のベースラインを一貫して上回り、多様な、以前は目に見えないワークロードで堅牢な一般化を実現している。
特に、CloudFormerは平均絶対誤差(MAE)が7.8%で、予測精度が大幅に向上し、既存のメソッドを少なくとも28%上回っている。
関連論文リスト
- Dual-Model Distillation for Efficient Action Classification with Hybrid Edge-Cloud Solution [1.8029479474051309]
我々は、より大規模で正確なクラウドベースモデルに必要に応じて遅延しながら、より小さなモデルのローカル処理効率を活用するハイブリッドエッジクラウドソリューションを設計する。
具体的には、エッジモデルの出力が不確かである場合に予測可能な軽量スイッチャーモデルをトレーニングするための、新しい教師なしデータ生成手法であるDual-Model Distillation(DMD)を提案する。
動作分類タスクの実験結果から,我々のフレームワークは計算オーバーヘッドを少なくするだけでなく,大規模モデルのみを使用する場合と比較して精度も向上することが示された。
論文 参考訳(メタデータ) (2024-10-16T02:06:27Z) - SeBS-Flow: Benchmarking Serverless Cloud Function Workflows [51.4200085836966]
本稿では、最初のサーバーレスワークフローベンチマークスイートSeBS-Flowを提案する。
SeBS-Flowには6つの実世界のアプリケーションベンチマークと、異なる計算パターンを表す4つのマイクロベンチマークが含まれている。
当社では,パフォーマンス,コスト,スケーラビリティ,ランタイムの偏差など,3つの主要なクラウドプラットフォームに関する包括的な評価を実施しています。
論文 参考訳(メタデータ) (2024-10-04T14:52:18Z) - Towards Robust and Efficient Cloud-Edge Elastic Model Adaptation via Selective Entropy Distillation [56.79064699832383]
Cloud-Edge Elastic Model Adaptation (CEMA)パラダイムを確立し、エッジモデルが前方伝播のみを実行するようにします。
CEMAでは,通信負担を軽減するため,不要なサンプルをクラウドにアップロードすることを避けるための2つの基準を考案した。
論文 参考訳(メタデータ) (2024-02-27T08:47:19Z) - Cloud-Device Collaborative Learning for Multimodal Large Language Models [24.65882336700547]
本稿では,クラウド・デバイス協調型継続的適応フレームワークを導入し,デバイス分割型MLLMの性能向上を図る。
当社のフレームワークは,効率的なデータ伝送のためのデバイス間アップリンク,クラウドベースの知識適応,モデルデプロイメントのための最適化されたクラウド間ダウンリンクという,3つの重要なコンポーネントで構成されています。
論文 参考訳(メタデータ) (2023-12-26T18:46:14Z) - Alioth: A Machine Learning Based Interference-Aware Performance Monitor
for Multi-Tenancy Applications in Public Cloud [15.942285615596566]
パブリッククラウドにおけるマルチテナントは、共有リソースのコロケーション干渉を引き起こす可能性がある。
クラウドアプリケーションの性能劣化をモニタリングする新しい機械学習フレームワークAliothを提案する。
Aliothの平均絶対誤差は5.29%のオフライン、10.8%である。
論文 参考訳(メタデータ) (2023-07-18T03:34:33Z) - Cloud-Device Collaborative Adaptation to Continual Changing Environments
in the Real-world [20.547119604004774]
本稿では,クラウドとデバイス間の協調を促進するクラウドデバイス協調型継続的適応の新たな学習パラダイムを提案する。
また、クラウド上の大規模モデルの一般化能力をデバイスモデルに転送するための教師学生モデルとして、不確実性に基づくVisual Prompt Adapted (U-VPA)を提案する。
提案するU-VPA教師学生フレームワークは,従来の最先端テスト時間適応とデバイスクラウド協調手法より優れていた。
論文 参考訳(メタデータ) (2022-12-02T05:02:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。