論文の概要: Streamlining Resilient Kubernetes Autoscaling with Multi-Agent Systems via an Automated Online Design Framework
- arxiv url: http://arxiv.org/abs/2505.21559v1
- Date: Mon, 26 May 2025 20:39:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.161744
- Title: Streamlining Resilient Kubernetes Autoscaling with Multi-Agent Systems via an Automated Online Design Framework
- Title(参考訳): オンライン設計フレームワークによるマルチエージェントシステムによるレジリエントなKubernetes自動スケーリングの合理化
- Authors: Julien Soulé, Jean-Paul Jamont, Michel Occello, Louis-Marie Traonouez, Paul Théron,
- Abstract要約: クラウドネイティブなシステムは、ワークロード管理の貧弱な問題のために、運用上のレジリエンスに直面することが多い。
協調エージェントに委譲された障害固有のサブゴールに、運用上のレジリエンスを維持するという、包括的な目標を分解することを提案する。
1)クラスタトレースから構築されたディジタルツインのモデリング,2)障害コンテキストに適した役割やミッションを用いたシミュレーションエージェントのトレーニング,3)説明可能性のためのエージェント動作の解析,4)学習ポリシを実クラスタに転送する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In cloud-native systems, Kubernetes clusters with interdependent services often face challenges to their operational resilience due to poor workload management issues such as resource blocking, bottlenecks, or continuous pod crashes. These vulnerabilities are further amplified in adversarial scenarios, such as Distributed Denial-of-Service attacks (DDoS). Conventional Horizontal Pod Autoscaling (HPA) approaches struggle to address such dynamic conditions, while reinforcement learning-based methods, though more adaptable, typically optimize single goals like latency or resource usage, neglecting broader failure scenarios. We propose decomposing the overarching goal of maintaining operational resilience into failure-specific sub-goals delegated to collaborative agents, collectively forming an HPA Multi-Agent System (MAS). We introduce an automated, four-phase online framework for HPA MAS design: 1) modeling a digital twin built from cluster traces; 2) training agents in simulation using roles and missions tailored to failure contexts; 3) analyzing agent behaviors for explainability; and 4) transferring learned policies to the real cluster. Experimental results demonstrate that the generated HPA MASs outperform three state-of-the-art HPA systems in sustaining operational resilience under various adversarial conditions in a proposed complex cluster.
- Abstract(参考訳): クラウドネイティブシステムでは、リソースのブロッキングやボトルネック、継続的ポッドのクラッシュといったワークロード管理の問題により、相互依存型サービスを備えたKubernetesクラスタが、運用上のレジリエンスの課題に直面することが多い。
これらの脆弱性は、DDoS(Distributed Denial-of-Service attack)のような敵のシナリオでさらに増幅される。
従来の水平ポッド自動スケーリング(HPA)アプローチはこのような動的条件に対処するのに苦労するが、強化学習ベースの手法はより適応性が高く、一般的にはレイテンシやリソース使用などの単一目標を最適化し、より広範な障害シナリオを無視する。
本稿では,HPAマルチエージェントシステム(HPA Multi-Agent System, HPA Multi-Agent System, MAS)をまとめて, 協調エージェントに委譲された障害固有のサブゴールに運用のレジリエンスを維持するという,包括的な目標を分解することを提案する。
HPAMAS設計のための4段階自動オンラインフレームワークを紹介します。
1) クラスタトレースから構築されたディジタルツインをモデル化すること。
2 失敗状況に適合した役割及び任務を用いたシミュレーションの訓練員
3)説明可能性のためのエージェント行動の分析,及び
4) 学習したポリシを実クラスタに転送する。
実験結果から, HPAMASは, 複雑なクラスタにおいて, 種々の対向条件下での運用のレジリエンスを維持するために, 最先端の3つのHPAシステムより優れていることが示された。
関連論文リスト
- Offline Multi-agent Reinforcement Learning via Score Decomposition [51.23590397383217]
オフラインマルチエージェント強化学習(MARL)は、分散シフトと関節行動空間の高次元性に起因する重要な課題に直面している。
多様なマルチエージェント協調パターンをモデル化するための新しい2段階フレームワークを提案する。
本手法は,協調型マルチエージェントシステムにおけるオフライン協調と平衡選択に関する新たな知見を提供する。
論文 参考訳(メタデータ) (2025-05-09T11:42:31Z) - Graph Based Deep Reinforcement Learning Aided by Transformers for Multi-Agent Cooperation [2.8169258551959544]
本稿では、グラフニューラルネットワーク(GNN)、深層強化学習(DRL)、マルチエージェント協調と集合タスク実行の強化のためのトランスフォーマーベースのメカニズムを統合する新しいフレームワークを提案する。
提案手法はGNNを用いて,適応グラフ構築によるエージェントエージェントとエージェントゴールの相互作用をモデル化し,制約付き通信下での効率的な情報集約と意思決定を可能にする。
論文 参考訳(メタデータ) (2025-04-11T01:46:18Z) - AgentNet: Decentralized Evolutionary Coordination for LLM-based Multi-Agent Systems [22.291969093748005]
AgentNet(エージェントネット)は、マルチエージェントシステムのための分散化された検索型生成(RAG)ベースのフレームワークである。
静的代入や集中制御に依存する従来のマルチエージェントシステムとは異なり、エージェントは動的に専門化できる。
AgentNetはスケーラブルな適応性を促進し、組織間のプライバシ保護コラボレーションを可能にする。
論文 参考訳(メタデータ) (2025-04-01T09:45:25Z) - Intelligent Mobile AI-Generated Content Services via Interactive Prompt Engineering and Dynamic Service Provisioning [55.641299901038316]
AI生成コンテンツは、ネットワークエッジで協調的なMobile AIGC Service Providers(MASP)を編成して、リソース制約のあるユーザにユビキタスでカスタマイズされたコンテンツを提供することができる。
このようなパラダイムは2つの大きな課題に直面している: 1) 生のプロンプトは、ユーザーが特定のAIGCモデルで経験していないために、しばしば生成品質が低下する。
本研究では,Large Language Model (LLM) を利用してカスタマイズしたプロンプトコーパスを生成する対話型プロンプトエンジニアリング機構を開発し,政策模倣に逆強化学習(IRL)を用いる。
論文 参考訳(メタデータ) (2025-02-17T03:05:20Z) - Efficient Adversarial Training in LLMs with Continuous Attacks [99.5882845458567]
大規模言語モデル(LLM)は、安全ガードレールをバイパスできる敵攻撃に対して脆弱である。
本稿では,2つの損失からなる高速対向訓練アルゴリズム(C-AdvUL)を提案する。
C-AdvIPOは、対向的に堅牢なアライメントのためのユーティリティデータを必要としない、対向型のIPOである。
論文 参考訳(メタデータ) (2024-05-24T14:20:09Z) - MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
MADiffは拡散型マルチエージェント学習フレームワークである。
分散ポリシと集中型コントローラの両方として機能する。
実験の結果,MADiffは様々なマルチエージェント学習タスクにおいて,ベースラインアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2023-05-27T02:14:09Z) - Multi-Agent Reinforcement Learning for Long-Term Network Resource
Allocation through Auction: a V2X Application [7.326507804995567]
我々は,自律エージェント間の分散意思決定として,移動エージェントの動的グループ(自動車など)からの計算タスクのオフロードを定式化する。
我々は、競争と協力のバランスをとることで、そのようなエージェントにプライベートとシステム目標の整合を動機付けるインタラクションメカニズムを設計する。
本稿では,部分的,遅延,ノイズの多い状態情報を用いて学習する,新しいマルチエージェントオンライン学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-29T10:29:06Z) - Adaptative Perturbation Patterns: Realistic Adversarial Learning for
Robust NIDS [0.3867363075280543]
アドリアックは、機械学習とそれに依存するシステムにとって大きな脅威となる。
この研究は、グレーボックス設定でこれらの制約を満たすためにAdaptative Perturbation Pattern Method (A2PM)を導入する。
A2PMは、各クラスの特性に独立して適応し、有効で一貫性のあるデータ摂動を生成するパターン配列に依存している。
論文 参考訳(メタデータ) (2022-03-08T17:52:09Z) - Automated Adversary Emulation for Cyber-Physical Systems via
Reinforcement Learning [4.763175424744536]
我々は,サイバー物理システムに対する敵エミュレーションに対するドメイン認識の自動化手法を開発した。
我々は、マルコフ決定プロセス(MDP)モデルを定式化し、ハイブリッドアタックグラフ上で最適なアタックシーケンスを決定する。
モデルベースおよびモデルフリー強化学習(RL)法を用いて,離散連続型MDPをトラクタブルな方法で解く。
論文 参考訳(メタデータ) (2020-11-09T18:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。