論文の概要: Genetic Programming for Self-Adaptive Auto-Scaling of Microservices
- arxiv url: http://arxiv.org/abs/2605.01533v1
- Date: Sat, 02 May 2026 16:56:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.821575
- Title: Genetic Programming for Self-Adaptive Auto-Scaling of Microservices
- Title(参考訳): 自己適応型マイクロサービス自動スケーリングのための遺伝的プログラミング
- Authors: Jia Li, Mehrdad Sabetzadeh, Shiva Nejati,
- Abstract要約: AutoSLOは学習ベースの自己適応型スケーリングフレームワークで、マイクロサービスレプリカを動的に調整してサービスレベルの目的(SLO)を満たす。
この枠組みは,SLO違反の頻度を低く保ちながら,資源使用量を大幅に削減することを示す。
- 参考スコア(独自算出の注目度): 7.6490862733819
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Microservice architecture is widely adopted in modern systems, where auto-scaling is critical for satisfying service-level objectives (SLOs). However, determining optimal scaling for microservices is difficult, and reactive resource allocation often leads to costly over- or under-provisioning. We propose AutoSLO, a learning-based, self-adaptive scaling framework that dynamically adjusts microservice replicas to meet SLOs while minimizing resource usage. AutoSLO uses a continuous monitoring-adaptation feedback loop and leverages genetic programming to learn and evolve scaling logic, enabling the deployed microservice system to proactively prevent SLO violations rather than repeatedly searching for one-off scaling actions. We evaluate AutoSLO on two case-study systems -- an online shopping platform and a chatbot based on large language models -- and show that this framework substantially reduces resource usage while maintaining a low frequency of SLO violations, all of which are resolved within a short time window.
- Abstract(参考訳): マイクロサービスアーキテクチャは、サービスレベルの目的(SLO)を満たす上で、自動スケーリングが重要である現代のシステムで広く採用されている。
しかし、マイクロサービスの最適なスケーリングを決定することは難しい。
学習ベースで自己適応的なスケーリングフレームワークであるAutoSLOを提案し、SLOに合わせてマイクロサービスレプリカを動的に調整し、リソース使用量を最小限に抑える。
AutoSLOは継続的監視適応フィードバックループを使用し、遺伝的プログラミングを活用してスケーリングロジックを学習し、進化させ、デプロイされたマイクロサービスシステムは、ワンオフスケーリングアクションを何度も検索するのではなく、SLO違反を積極的に防止することができる。
我々は,オンラインショッピングプラットフォームと大規模言語モデルに基づくチャットボットの2つのケーススタディシステム上でAutoSLOを評価し,このフレームワークがSLO違反の頻度を低く保ちながら,リソース使用量を大幅に削減することを示した。
関連論文リスト
- AutoMIA: Improved Baselines for Membership Inference Attack via Agentic Self-Exploration [49.050688065974605]
メンバーシップ推論攻撃(MIAs)は、機械学習モデルにおけるトレーニングデータの漏洩を評価するための基本的な監査ツールである。
本稿では,自己探索と戦略進化の自動化プロセスとして,メンバーシップ推論を再構築するエージェントフレームワークであるAutoMIAを提案する。
論文 参考訳(メタデータ) (2026-04-01T15:17:45Z) - An SLO Driven and Cost-Aware Autoscaling Framework for Kubernetes [0.0]
本稿では、AIOps原則を用いて自動スケーリングをどのように拡張し、サービスレベルオブジェクト違反とコスト制約を共同で満たすかを検討する。
本稿では,SLO認識とコスト意識制御と軽量需要予測を統合した安全かつ説明可能な多信号自動スケーリングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-29T12:20:46Z) - COVLM-RL: Critical Object-Oriented Reasoning for Autonomous Driving Using VLM-Guided Reinforcement Learning [55.83415345423854]
批判的オブジェクト指向(CO)推論と強化学習(RL)を統合した新しいエンドツーエンド駆動フレームワークCOVLM-RLを提案する。
CARLAシミュレータで行った実験により、COVLM-RLはトレーニング運転環境における成功率を30%向上することが示された。
論文 参考訳(メタデータ) (2025-12-10T06:18:16Z) - Network Resource Optimization for ML-Based UAV Condition Monitoring with Vibration Analysis [54.550658461477106]
条件監視(CM)は機械学習(ML)モデルを使用して異常および異常な条件を識別する。
本研究では,MLベースのUAV CMフレームワークにおけるネットワークリソースの最適化について検討する。
次元削減技術を活用することで、ネットワークリソース消費の99.9%が削減される。
論文 参考訳(メタデータ) (2025-02-21T14:36:12Z) - Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。
人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:49:25Z) - Adversarial Reasoning at Jailbreaking Time [49.70772424278124]
大規模言語モデル(LLM)は、より有能で広く普及している。
テスト時間計算の標準化, 測定, スケーリングの最近の進歩は, ハードタスクにおける高い性能を達成するためにモデルを最適化するための新しい手法を提案する。
本稿では、これらの進歩をジェイルブレイクモデルに応用し、協調LDMから有害な応答を誘発する。
論文 参考訳(メタデータ) (2025-02-03T18:59:01Z) - Distilling Multi-modal Large Language Models for Autonomous Driving [64.63127269187814]
近年のエンド・ツー・エンドの自動運転システムは,大規模言語モデル(LLM)をプランナーとして活用し,レアイベントに対する一般化性を向上させる。
我々は,LLMの世界の知識を活用しつつ,LLMフリー(あるいはビジョンベース)プランナの効率を維持するエンド・ツー・エンドの自動運転システムであるDiMAを提案する。
DiMAを用いたトレーニングでは、L2軌道誤差が37%減少し、ビジョンベースプランナーの衝突速度が80%低下し、ロングテールシナリオでは44%軌道誤差が減少する。
論文 参考訳(メタデータ) (2025-01-16T18:59:53Z) - Multi-Level ML Based Burst-Aware Autoscaling for SLO Assurance and Cost
Efficiency [3.5624365288866007]
本稿では、複雑なワークロード下でコンテナ化されたクラウドサービスやアプリケーションのためのBurst-Aware AutoscalingフレームワークであるBAScalerを紹介します。
BAScalerには、予測可能な周期的なワークロードスパイクと実際のバーストを区別する、予測に基づく新しいバースト検出機構が組み込まれている。
論文 参考訳(メタデータ) (2024-02-20T12:28:25Z) - PBScaler: A Bottleneck-aware Autoscaling Framework for
Microservice-based Applications [6.453782169615384]
マイクロサービスベースのアプリケーションのためのボトルネック対応自動スケーリングフレームワークPBScalerを提案する。
PBScalerは資源を効率的に保存しながら既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2023-03-26T04:20:17Z) - Autothrottle: A Practical Bi-Level Approach to Resource Management for SLO-Targeted Microservices [30.075132870154153]
Autothrottleは、サービスレベルの目的のための双方向のリソース管理フレームワークである。
サービスリソースコントロールからアプリケーションフィードバックをトラバースし、パフォーマンス目標という概念を通じてそれらをブリッジします。
その結果、最高成績のベースラインを26.21%、全ベースラインを93.84%上回った。
論文 参考訳(メタデータ) (2022-12-23T07:42:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。