論文の概要: Metronome: Differentiated Delay Scheduling for Serverless Functions
- arxiv url: http://arxiv.org/abs/2512.05703v1
- Date: Fri, 05 Dec 2025 13:30:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-13 22:40:57.036034
- Title: Metronome: Differentiated Delay Scheduling for Serverless Functions
- Title(参考訳): Metronome: サーバレス機能のための遅延スケジューリングの差別化
- Authors: Zhuangbin Chen, Juzheng Zheng, Zibin Zheng,
- Abstract要約: 遅延スケジューリングフレームワークであるMetronomeを提案し,各関数に対して最適な局所性認識ノードを特定するための予測機構を提案する。
OpenLambdaの実装はMetronomeがベースラインを大幅に上回り、関数の平均実行時間を64.88%-95.83%削減したことを示している。
- 参考スコア(独自算出の注目度): 42.99495101001926
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Function-as-a-Service (FaaS) computing is an emerging cloud computing paradigm for its ease-of-management and elasticity. However, optimizing scheduling for serverless functions remains challenging due to their dynamic and event-driven nature. While data locality has been proven effective in traditional cluster computing systems through delay scheduling, its application in serverless platforms remains largely unexplored. In this paper, we systematically evaluate existing delay scheduling methods in serverless environments and identify three key observations: 1) delay scheduling benefits vary significantly based on function input characteristics; 2) serverless computing exhibits more complex locality patterns than cluster computing systems, encompassing both data locality and infrastructure locality; and 3) heterogeneous function execution times make rule-based delay thresholds ineffective. Based on these insights, we propose Metronome, a differentiated delay scheduling framework that employs predictive mechanisms to identify optimal locality-aware nodes for individual functions. Metronome leverages an online Random Forest Regression model to forecast function execution times across various nodes, enabling informed delay decisions while preventing SLA violations. Our implementation on OpenLambda shows that Metronome significantly outperforms baselines, achieving 64.88%-95.83% reduction in mean execution time for functions, while maintaining performance advantages under increased concurrency levels and ensuring SLA compliance.
- Abstract(参考訳): ファンクション・アズ・ア・サービス(FaaS)コンピューティングは、管理の容易さと弾力性のための新しいクラウドコンピューティングパラダイムである。
しかしながら、サーバレス関数のスケジューリングの最適化は、動的でイベント駆動的な性質のため、依然として困難である。
データローカリティは、遅延スケジューリングを通じて、従来のクラスタコンピューティングシステムで有効であることが証明されているが、サーバレスプラットフォームでのそのアプリケーションは、まだほとんど探索されていない。
本稿では、サーバーレス環境における既存の遅延スケジューリング手法を体系的に評価し、3つの重要な観測点を同定する。
1)遅延スケジューリングの利点は関数入力特性によって大きく異なる。
2) サーバレスコンピューティングは、クラスタコンピューティングシステムよりも複雑なローカリティパターンを示し、データローカリティとインフラストラクチャローカリティの両方を包含する。
3) 不均一関数実行時間は規則に基づく遅延閾値を非効率にする。
これらの知見に基づいて,各関数に対して最適な局所性認識ノードを特定するための予測機構を用いた遅延スケジューリングフレームワークであるMetronomeを提案する。
Metronomeは、オンラインランダムフォレスト回帰モデルを使用して、さまざまなノードにわたる関数の実行時間を予測し、SLA違反を防止しつつ、情報的な遅延決定を可能にする。
OpenLambdaの実装により,Metronomeは平均実行時間を64.88%-95.83%削減し,並列化レベルの向上とSLAコンプライアンスの確保を実現した。
関連論文リスト
- CSGO: Generalized Optimization for Cold Start in Wireless Collaborative Edge LLM Systems [62.24576366776727]
本稿では,全体の推論遅延を最小限に抑えるために,遅延を考慮したスケジューリングフレームワークを提案する。
提案手法は,ベースライン戦略と比較して,コールドスタート遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2025-08-15T07:49:22Z) - Multimodal Remote Inference [14.609320101695575]
本稿では,MLモデルの推論誤差を最小限に抑えるための2モードスケジューリング問題について検討する。
両モダリティが同じ閾値を共有し、インデックス関数と閾値を効率的に計算できることが示される。
論文 参考訳(メタデータ) (2025-08-11T02:30:44Z) - Learning Unified System Representations for Microservice Tail Latency Prediction [8.532290784939967]
マイクロサービスアーキテクチャは、スケーラブルなクラウドネイティブアプリケーションを構築するためのデファクトスタンダードになっています。
従来のアプローチでは、要求毎のレイテンシメトリクスに依存しており、過渡的なノイズに非常に敏感です。
我々は,トラフィック側とリソース側の機能を明確に分離し,モデル化するディープラーニングネットワークであるUSRFNetを提案する。
論文 参考訳(メタデータ) (2025-08-03T07:46:23Z) - Adaptive Deadline and Batch Layered Synchronized Federated Learning [66.93447103966439]
フェデレートラーニング(FL)は、データプライバシを保持しながら、分散エッジデバイス間で協調的なモデルトレーニングを可能にする。
我々は,レイヤワイドアグリゲーションのために,ラウンド単位の期限とユーザ固有のバッチサイズを共同で最適化する新しいフレームワークADEL-FLを提案する。
論文 参考訳(メタデータ) (2025-05-29T19:59:18Z) - SafeTail: Efficient Tail Latency Optimization in Edge Service Scheduling via Computational Redundancy Management [2.707215971599082]
拡張現実のような新興アプリケーションは、ユーザデバイスに高い信頼性を持つ低レイテンシコンピューティングサービスを必要とする。
私たちはSafeTailを紹介した。これは中央値と末尾の応答時間の両方の目標を満たすフレームワークで、テールレイテンシは90%以上のレイテンシで定義されています。
論文 参考訳(メタデータ) (2024-08-30T10:17:37Z) - DASA: Delay-Adaptive Multi-Agent Stochastic Approximation [64.32538247395627]
我々は,N$エージェントが並列に動作し,中央サーバと通信することで,一般的な近似問題を高速化することを目的とした設定を考える。
遅延とストラグラーの効果を軽減するために,マルチエージェント近似のための遅延適応アルゴリズムである textttDASA を提案する。
論文 参考訳(メタデータ) (2024-03-25T22:49:56Z) - Scheduling in Parallel Finite Buffer Systems: Optimal Decisions under
Delayed Feedback [29.177402567437206]
本稿では,遅延認識の限られた情報の下で並列キューシステムにおけるスケジューリング決定をキャプチャする部分観測可能(PO)モデルを提案する。
得られたポリシーが他の限られた情報スケジューリング戦略より優れていることを数値的に示す。
本稿では,Kaggleが提供するネットワークデータを用いてリアルタイム並列処理を最適化する方法を示す。
論文 参考訳(メタデータ) (2021-09-17T13:45:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。