論文の概要: Mitigating Temporal Blindness in Kubernetes Autoscaling: An Attention-Double-LSTM Framework
- arxiv url: http://arxiv.org/abs/2603.28790v1
- Date: Sat, 21 Mar 2026 10:03:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:13.139296
- Title: Mitigating Temporal Blindness in Kubernetes Autoscaling: An Attention-Double-LSTM Framework
- Title(参考訳): Kubernetesオートスケーリングにおける時間的盲点の緩和 - 注意-ダブル-LSTMフレームワーク
- Authors: Faraz Shaikh, Gianluca Reali, Mauro Femminella,
- Abstract要約: 本稿では,作業負荷の予測と制御をアテンション強化型2重スタックLSTMアーキテクチャを介して統合する,安定性を考慮した自動スケーリングフレームワークを提案する。
このアプローチは90パーセントのレイテンシを約29%削減すると同時に,レプリカを39%削減することを示す。
これらの結果は, 生産エッジ環境における信頼性, 低ジッタ自動スケーリングの前提条件として, 深い注意記憶による時間的盲点の緩和が重要であることを確認した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the emerging landscape of edge computing, the stochastic and bursty nature of serverless workloads presents a critical challenge for autonomous resource orchestration. Traditional reactive controllers, such as the Kubernetes Horizontal Pod Autoscaler (HPA), suffer from inherent reaction latency, leading to Service Level Objective (SLO) violations during traffic spikes and resource flapping during ramp-downs. While Deep Reinforcement Learning (DRL) offers a pathway toward proactive management, standard agents suffer from temporal blindness, an inability to effectively capture long-term dependencies in non-Markovian edge environments. To bridge this gap, we propose a novel stability-aware autoscaling framework unifying workload forecasting and control via an Attention-Enhanced Double-Stacked LSTM architecture integrated within a Proximal Policy Optimization (PPO) agent. Unlike shallow recurrent models, our approach employs a deep temporal attention mechanism to selectively weight historical states, effectively filtering high-frequency noise while retaining critical precursors of demand shifts. We validate the framework on a heterogeneous cluster using real-world Azure Functions traces. Comparative analysis against industry-standard HPA, stateless Double DQN, and a single-layer LSTM ablation demonstrates that our approach reduces 90th percentile latency by approximately 29% while simultaneously decreasing replica churn by 39%, relative to the single-layer LSTM baseline. These results confirm that mitigating temporal blindness through deep attentive memory is a prerequisite for reliable, low-jitter autoscaling in production edge environments.
- Abstract(参考訳): エッジコンピューティングの新興分野において、サーバーレスワークロードの確率的でバースト的な性質は、自律的なリソースオーケストレーションにとって重要な課題である。
Kubernetes Horizontal Pod Autoscaler(HPA)のような従来のリアクティブコントローラは、固有の反応遅延に悩まされており、トラフィックスパイク時のService Level Objective(SLO)違反や、ランプダウン時にリソースが停止する。
Deep Reinforcement Learning (DRL) はプロアクティブな管理への道筋を提供するが、標準エージェントは時間的盲点に悩まされ、非マルコフのエッジ環境における長期的な依存関係を効果的に捉えることができない。
このギャップを埋めるため,本研究では,PPOエージェントに組み込まれたAttention-Enhanced Double-Stacked LSTMアーキテクチャを通じて,ワークロードの予測と制御を統一する,安定性に配慮した新しい自動スケーリングフレームワークを提案する。
浅部再帰モデルと異なり,本手法では時間的注意機構を用いて歴史的状態を選択的に重み付けし,需要シフトの重要な前駆体を維持しつつ,高周波ノイズを効果的にフィルタリングする。
現実世界のAzure Functionsトレースを使用して、このフレームワークを異種クラスタ上で検証する。
業界標準HPA, ステートレスDQN, 単一層LSTMアブレーションとの比較分析により, 単一層LSTMベースラインと比較して, レプリカチャーンを39%減らすとともに, 90%のレイテンシを約29%減らすことを示した。
これらの結果は, 生産エッジ環境における信頼性, 低ジッタ自動スケーリングの前提条件として, 深い注意記憶による時間的盲点の緩和が重要であることを確認した。
関連論文リスト
- CIAR: Interval-based Collaborative Decoding for Image Generation Acceleration [47.52310736101766]
自動回帰(AR)モデルは最近画像生成において顕著な進歩を遂げ、拡散ベースのアプローチに匹敵するパフォーマンスを実現している。
我々は、デバイス上での自己検証を利用して視覚合成の2つの重要な特性を扱うクラウド・デバイス・コラボレーション・フレームワークである textbfCIAR を通じてこの問題に対処する。
提案手法は, 連続確率間隔を用いて処理を高速化し, 大規模視覚語彙で実現可能なオンデバイストークン不確実性定量化器に重点を置いている。
論文 参考訳(メタデータ) (2026-03-26T14:04:50Z) - Dual-Gated Epistemic Time-Dilation: Autonomous Compute Modulation in Asynchronous MARL [0.0]
MARL(Multi-Agent Reinforcement Learning)アルゴリズムは、複雑な連続したドメインをまたいだ前例のない成功を達成する。
標準のデプロイメントは、同期運用パラダイムに厳密に準拠する。
この高密度スループットは、熱的および代謝的予算が極めて制約されたエッジデバイス上での物理的展開の基本的な障壁として機能する。
本稿では, 心電図を用いた心電図を用いた心電図(ETD-MAPPO)を提案する。
論文 参考訳(メタデータ) (2026-03-24T21:19:06Z) - Blockchain-Enabled Routing for Zero-Trust Low-Altitude Intelligent Networks [77.17664010626726]
低高度インテリジェントネットワーク(LAIN)における複数のUAVクラスタによるルーティングに焦点を当てる。
潜在的な脅威によるダメージを最小限に抑えるため,ソフトウェア定義の周辺技術とブロックチェーン技術を用いたゼロトラストアーキテクチャを提案する。
提案手法は,平均E2E遅延を59%削減し,TSRを29%改善することを示した。
論文 参考訳(メタデータ) (2026-02-27T04:30:35Z) - Spatio-Temporal Token Pruning for Efficient High-Resolution GUI Agents [10.559617160878227]
GUIPrunerは、高解像度のGUIナビゲーションに適したトレーニング不要のフレームワークである。
時間分解能(TAR)とSSP(Stratified Structure-Aware Pruning)の相乗効果
常に最先端の性能を達成し、高解像度圧縮下での大規模モデルで観測される崩壊を効果的に防止する。
論文 参考訳(メタデータ) (2026-02-26T17:12:40Z) - LASER: An Efficient Target-Aware Segmented Attention Framework for End-to-End Long Sequence Modeling [20.507605423606282]
我々はXiaohongshu(RedNote)で開発・デプロイされたフルスタック最適化フレームワークLASERを紹介する。
システムの効率性: 長いユーザ履歴のための統合スキーマ対応サービスインフラストラクチャであるSeqVaultを紹介します。
アルゴリズム効率: 計算オーバーヘッドに対処するためのSTA(Segmented Target Attention)機構を提案する。
論文 参考訳(メタデータ) (2026-02-12T04:33:37Z) - Agentic Spatio-Temporal Grounding via Collaborative Reasoning [80.83158605034465]
時間的ビデオグラウンド(Temporal Video Grounding)は、テキストクエリが与えられたビデオ内の対象物または人の時間的チューブを検索することを目的としている。
本稿では,STVGの課題に対して,オープンワールドおよびトレーニングフリーシナリオに向けたエージェント時空間グラウンド(ASTG)フレームワークを提案する。
具体的には、現代多言語モデル(MLLM)を活用した2つの特殊エージェントSRA(Spatial Reasoning Agent)とTRA(Temporal Reasoning Agent)である。
人気のあるベンチマークの実験は、既存の弱教師付きおよびゼロショットアプローチをマージンで上回る提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2026-02-10T10:16:27Z) - Time2Vec Transformer for Robust Gesture Recognition from Low-Density sEMG [1.231764991565978]
本稿では筋電義手制御のための新しい,データ効率の高いディープラーニングフレームワークを提案する。
提案手法は, スパース2チャネル表面筋電図(sEMG)に最適化されたハイブリッドトランスフォーマーの実装である。
提案するフレームワークは, 迅速なパーソナライズが可能な次世代人工装具の堅牢で費用対効果の高い青写真を提供する。
論文 参考訳(メタデータ) (2026-02-02T09:28:27Z) - AVERY: Adaptive VLM Split Computing through Embodied Self-Awareness for Efficient Disaster Response Systems [6.294240680169978]
災害時の無人航空機(UAV)は、CNNが提供できない複雑なクエリー可能な知性を必要とする。
本稿では,適応型分割計算によるVLMデプロイメントを実現するフレームワークであるAVERYを紹介する。
論文 参考訳(メタデータ) (2025-11-22T18:42:04Z) - A theoretical framework for self-supervised contrastive learning for continuous dependent data [79.62732169706054]
自己教師付き学習(SSL)は、特にコンピュータビジョンの分野で、表現を学習するための強力なアプローチとして登場した。
本稿では,サンプル間のアンフェマティック独立に適した対照的なSSLの理論的枠組みを提案する。
具体的には、標準のUEAベンチマークとUCRベンチマークでTS2Vecを上回り、それぞれ4.17$%と2.08$%の精度で改善した。
論文 参考訳(メタデータ) (2025-06-11T14:23:47Z) - Linear-Time User-Level DP-SCO via Robust Statistics [55.350093142673316]
ユーザレベルの差分プライベート凸最適化(DP-SCO)は、マシンラーニングアプリケーションにおけるユーザのプライバシ保護の重要性から、大きな注目を集めている。
微分プライベート勾配勾配(DP-SGD)に基づくような現在の手法は、しばしば高雑音蓄積と準最適利用に苦しむ。
これらの課題を克服するために、ロバストな統計、特に中央値とトリミング平均を利用する新しい線形時間アルゴリズムを導入する。
論文 参考訳(メタデータ) (2025-02-13T02:05:45Z) - Lazy Layers to Make Fine-Tuned Diffusion Models More Traceable [70.77600345240867]
新たな任意の任意配置(AIAO)戦略は、微調整による除去に耐性を持たせる。
拡散モデルの入力/出力空間のバックドアを設計する既存の手法とは異なり,本手法では,サンプルサブパスの特徴空間にバックドアを埋め込む方法を提案する。
MS-COCO,AFHQ,LSUN,CUB-200,DreamBoothの各データセットに関する実証研究により,AIAOの堅牢性が確認された。
論文 参考訳(メタデータ) (2024-05-01T12:03:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。