論文の概要: Ksurf-Drone: Attention Kalman Filter for Contextual Bandit Optimization in Cloud Resource Allocation
- arxiv url: http://arxiv.org/abs/2511.09766v1
- Date: Fri, 14 Nov 2025 01:08:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.470367
- Title: Ksurf-Drone: Attention Kalman Filter for Contextual Bandit Optimization in Cloud Resource Allocation
- Title(参考訳): Ksurf-Drone: クラウドリソース割り当てにおけるコンテキスト帯域最適化のための注意Kalmanフィルタ
- Authors: Michael Dang'ana, Yuqiu Zhang, Hans-Arno Jacobsen,
- Abstract要約: Ksurfは、高度に可変なクラウドデータに理想的な、最先端の分散最小化推定手法である。
この研究は、高度に可変なワークロードを含む見積もりベースのリソースオーケストレーションタスクにおいて、Ksurfのパフォーマンスを評価する。
Ksurfは、p95で41%、p99で47%のレイテンシ分散を実現し、CPU使用量の4%の削減とマスターノードメモリ使用量の7MBの削減を実現している。
- 参考スコア(独自算出の注目度): 6.651912879528297
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Resource orchestration and configuration parameter search are key concerns for container-based infrastructure in cloud data centers. Large configuration search space and cloud uncertainties are often mitigated using contextual bandit techniques for resource orchestration including the state-of-the-art Drone orchestrator. Complexity in the cloud provider environment due to varying numbers of virtual machines introduces variability in workloads and resource metrics, making orchestration decisions less accurate due to increased nonlinearity and noise. Ksurf, a state-of-the-art variance-minimizing estimator method ideal for highly variable cloud data, enables optimal resource estimation under conditions of high cloud variability. This work evaluates the performance of Ksurf on estimation-based resource orchestration tasks involving highly variable workloads when employed as a contextual multi-armed bandit objective function model for cloud scenarios using Drone. Ksurf enables significantly lower latency variance of $41\%$ at p95 and $47\%$ at p99, demonstrates a $4\%$ reduction in CPU usage and 7 MB reduction in master node memory usage on Kubernetes, resulting in a $7\%$ cost savings in average worker pod count on VarBench Kubernetes benchmark.
- Abstract(参考訳): リソースオーケストレーションと設定パラメータ検索は、クラウドデータセンタにおけるコンテナベースのインフラストラクチャにとって重要な関心事である。
大規模な構成検索スペースとクラウドの不確実性は、最先端のDroneオーケストレータを含むリソースオーケストレーションのコンテキスト的バンディット技術によって緩和されることが多い。
仮想マシンの数の違いによるクラウドプロバイダ環境の複雑さは、ワークロードやリソースメトリクスの多様性を導入し、非線形性やノイズの増加によるオーケストレーションの判断の精度が低下する。
Ksurfは、高度に変動するクラウドデータに理想的な、最先端の分散最小化推定手法である。
この研究は、Droneを使用したクラウドシナリオのコンテキスト的マルチアーム帯域目的関数モデルとして使用される場合、高度に可変なワークロードを含む推定ベースのリソースオーケストレーションタスクにおけるKsurfのパフォーマンスを評価する。
Ksurfは、p95で41.%、p99で47.%というレイテンシのばらつきを大幅に低減し、CPU使用量の削減とKubernetes上でのマスタノードメモリ使用量の7MBの削減を実証し、VarBench Kubernetesベンチマークで平均的なワーカポッド数に対して7.5%のコスト削減を実現している。
関連論文リスト
- ObCLIP: Oblivious CLoud-Device Hybrid Image Generation with Privacy Preservation [9.081441952478306]
ObCLIPは、不愉快なクラウドデバイスハイブリッド生成のためのプラグアンドプレイセーフガードである。
厳格なプライバシと、サーバコストがわずかに向上したクラウドモデルに匹敵するユーティリティを提供する。
論文 参考訳(メタデータ) (2025-10-05T11:09:10Z) - Artificial Intelligence for Cost-Aware Resource Prediction in Big Data Pipelines [0.0]
過剰なプロビジョンは不要なコストをもたらし、過剰なプロビジョンはパフォーマンス劣化とSLA違反のリスクを負う。
本研究では,ランダムフォレスト回帰を用いたビッグデータパイプラインの資源利用予測手法を提案する。
論文 参考訳(メタデータ) (2025-09-30T20:01:12Z) - CloudFormer: An Attention-based Performance Prediction for Public Clouds with Unknown Workload [9.00677252346245]
クラウドプラットフォームは、多様なリソース集約的なワークロードをホストするためにますます頼りになっています。
VMスケジューリングやリソースプロビジョニングといった既存の管理技術は、正確なパフォーマンス予測を必要とします。
ブラックボックス環境におけるVM性能劣化を予測するために設計された,デュアルブランチトランスフォーマーベースのモデルであるCloudFormerを提案する。
論文 参考訳(メタデータ) (2025-09-03T15:15:44Z) - Cost-Aware Contrastive Routing for LLMs [57.30288453580456]
我々は、プロンプトとモデルの両方を共有埋め込み空間にマッピングする軽量フレームワークであるコストスペクトルコントラストルーティング(CSCR)を紹介します。
CSCRはベースラインを一貫して上回り、精度とコストのトレードオフを最大25%改善した。
論文 参考訳(メタデータ) (2025-08-17T20:16:44Z) - EC-Diff: Fast and High-Quality Edge-Cloud Collaborative Inference for Diffusion Models [57.059991285047296]
高速な推論と高品質な生成を実現するために,ハイブリッドエッジクラウドコラボレーションフレームワークが最近提案されている。
過度の雲が推論時間を延ばす一方、不十分なステップは意味的な曖昧さを引き起こし、エッジモデルの出力の不整合を引き起こす。
勾配に基づく雑音推定により雲の推測を高速化するEC-Diffを提案する。
提案手法は, エッジ推定に比べて生成品質を著しく向上する一方で, クラウド推定に比べて平均2倍の速度アップを達成できる。
論文 参考訳(メタデータ) (2025-07-16T07:23:14Z) - PointLoRA: Low-Rank Adaptation with Token Selection for Point Cloud Learning [54.99373314906667]
ポイントクラウドのための自己教師付き表現学習は、様々なタスクで事前訓練されたモデルパフォーマンスを改善する効果を実証した。
事前訓練されたモデルは複雑さが増すにつれて、下流のアプリケーションに完全に微調整を施すには、かなりの計算資源とストレージ資源が必要である。
そこで我々は,低ランク適応(LoRA)とマルチスケールトークン選択を併用した簡易かつ効果的なPointLoRAを提案する。
論文 参考訳(メタデータ) (2025-04-22T16:41:21Z) - Device-Cloud Collaborative Recommendation via Meta Controller [65.97416287295152]
オンデバイスレコメンデータとクラウドベースのレコメンデータの協調を動的に管理するメタコントローラを提案する。
対策サンプルと拡張トレーニングに基づいて,産業レコメンデーションシナリオにおける広範な実験は,メタコントローラの可能性を示唆している。
論文 参考訳(メタデータ) (2022-07-07T03:23:04Z) - DeF-DReL: Systematic Deployment of Serverless Functions in Fog and Cloud
environments using Deep Reinforcement Learning [8.204696165200577]
Fog環境は、サーバーレスアプリケーションをデプロイするために、限られたリソースを多数のユーザに提供した。
最近の研究は、主に霧のノードからそのようなアプリケーションに最大限のリソースを割り当てることに焦点を当てており、クラウド環境を最大限に活用していない。
我々は,DeF-DReLを提案する。DeF-DReLは,Deep Reinforcement Learningを用いて,フォッグおよびクラウド環境におけるサーバレス関数のシステム展開を行う。
論文 参考訳(メタデータ) (2021-10-29T12:10:54Z) - A Predictive Autoscaler for Elastic Batch Jobs [8.354712625979776]
Deep Learning、HPC、Sparkといった大規模なバッチジョブは、従来のオンラインサービスよりもはるかに多くの計算リソースとコストを必要とします。
顧客とオーバプロビジョンインスタンスに対して,柔軟なインターフェースを提供するための予測オートスケーラを提案する。
論文 参考訳(メタデータ) (2020-10-10T17:35:55Z) - Budget Learning via Bracketing [50.085728094234476]
予算学習の問題は、学習者の目標として、雲の使用を最小限に抑えつつ、精度の明確な損失を被ることである。
本稿ではブラケットの概念を用いてBL問題に対する新しい定式化を提案する。
我々は、実世界のデータセットに関する我々の理論を実証的に検証し、事前ゲーティングに基づく手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-04-14T04:38:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。