論文の概要: ANSC: Probabilistic Capacity Health Scoring for Datacenter-Scale Reliability
- arxiv url: http://arxiv.org/abs/2508.16119v1
- Date: Fri, 22 Aug 2025 06:19:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.266127
- Title: ANSC: Probabilistic Capacity Health Scoring for Datacenter-Scale Reliability
- Title(参考訳): ANSC: データセンター規模の信頼性のための確率論的容量ヘルススコアリング
- Authors: Madhava Gaikwad, Abhishek Gandhi,
- Abstract要約: ANSCは、問題の緊急性を示すカラーコードスコアリングシステムを提供する。
我々は、ANSCにより、400以上のデータセンターと60のリージョンで、オペレーターが修復を優先順位付けできることを実証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present ANSC, a probabilistic capacity health scoring framework for hyperscale datacenter fabrics. While existing alerting systems detect individual device or link failures, they do not capture the aggregate risk of cascading capacity shortfalls. ANSC provides a color-coded scoring system that indicates the urgency of issues \emph{not solely by current impact, but by the probability of imminent capacity violations}. Our system accounts for both current residual capacity and the probability of additional failures, normalized at datacenter and regional level. We demonstrate that ANSC enables operators to prioritize remediation across more than 400 datacenters and 60 regions, reducing noise and aligning SRE focus on the most critical risks.
- Abstract(参考訳): 我々は、超大規模データセンターファブリックのための確率的キャパシティヘルススコアリングフレームワークANSCを提案する。
既存のアラートシステムは個々のデバイスやリンク障害を検出するが、カスケード能力不足の総括リスクを捉えない。
ANSCは、現在のインパクトだけでなく、差し迫ったキャパシティ違反の確率によってのみ、問題 \emph{emph{emph{emph{emph{emph{emph} の緊急性を示す色付きスコアシステムを提供する。
我々のシステムは、データセンターと地域レベルで正規化されている、現在の残容量と追加故障の確率の両方を考慮に入れている。
我々は、ANSCにより、400以上のデータセンタと60のリージョンで修正を優先順位付けし、ノイズを低減し、SREを最も重要なリスクに合わせることができることを実証した。
関連論文リスト
- Towards Robust Stability Prediction in Smart Grids: GAN-based Approach under Data Constraints and Adversarial Challenges [53.2306792009435]
本稿では,安定したデータのみを用いて,スマートグリッドの不安定性を検出する新しいフレームワークを提案する。
最大98.1%の精度でグリッド安定性を予測でき、98.9%で敵の攻撃を検知できる。
シングルボードコンピュータ上で実装され、7ms以下の平均応答時間でリアルタイムな意思決定を可能にする。
論文 参考訳(メタデータ) (2025-01-27T20:48:25Z) - Towards Robust Unsupervised Attention Prediction in Autonomous Driving [40.84001015982244]
本稿では,自律走行システムに対するロバストな無監督注意予測手法を提案する。
不確かさマイニングブランチは、自然の場面における複数の事前訓練されたモデル間の共通点と相違点を分析して、予測を洗練する。
知識埋め込みブロックは、擬似ラベルを適応的に強化するために駆動知識を取り入れることで、ドメインギャップを橋渡しする。
ソフトアテンションとダイナミックアメンデーションにより, 破損に対する堅牢性を向上する新しいデータアメンデーション手法を提案する。
論文 参考訳(メタデータ) (2025-01-25T03:01:26Z) - Unleashing the Power of Continual Learning on Non-Centralized Devices: A Survey [37.07938402225207]
非連続学習(NCCL)は、分散デバイスが共同の非定常環境からストリーミングデータを処理できるようにするための新たなパラダイムとなっている。
本調査は,非集中型連続学習アルゴリズムの開発と,分散デバイスへの実環境展開に焦点を当てる。
論文 参考訳(メタデータ) (2024-12-18T13:33:28Z) - Privacy-Preserving Distributed Learning for Residential Short-Term Load
Forecasting [11.185176107646956]
電力システムの負荷データは、住宅ユーザの日常のルーチンを不注意に明らかにし、彼らの財産のセキュリティにリスクを及ぼす可能性がある。
我々はマルコフスイッチ方式の分散学習フレームワークを導入し、その収束は厳密な理論的解析によって実証される。
実世界の電力系統負荷データを用いたケーススタディにより,提案アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2024-02-02T16:39:08Z) - Unsupervised Learning for Fault Detection of HVAC Systems: An OPTICS
-based Approach for Terminal Air Handling Units [1.0878040851638]
本研究では,ターミナルエアハンドリングユニットとその関連システムにおける故障を検出するための教師なし学習戦略を提案する。
この手法は、主成分分析を用いて歴史的センサデータを前処理して次元を合理化する。
その結果,オプティクスは季節ごとの精度で常にk平均を上回っていた。
論文 参考訳(メタデータ) (2023-12-18T18:08:54Z) - A Novel Federated Learning-Based IDS for Enhancing UAVs Privacy and Security [1.2999518604217852]
フライングアドホックネットワーク(FANET)内で運用されている無人航空機(UAV)は、これらのネットワークの動的で分散的な性質のためにセキュリティ上の問題に直面している。
以前の研究では、すべてのデバイスからのデータを保存し分析する中心的なエンティティとして、集中的な侵入検出に主に焦点をあてていた。
本稿では、FANETにおける集中型システムによる課題に対処するFL-IDS(Federated Learning-based Intrusion Detection System)を提案する。
論文 参考訳(メタデータ) (2023-12-07T08:50:25Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Center Prediction Loss for Re-identification [65.58923413172886]
我々は, 中心予測率に基づく新たな損失, すなわち, 試料が特徴空間の位置に位置しなければならず, そこから同一クラス標本の中心の位置を大まかに予測できることを示す。
今回の新たな損失により,クラス間サンプルの分離性が向上しつつ,クラス内分散制約がより柔軟になることを示す。
論文 参考訳(メタデータ) (2021-04-30T03:57:31Z) - Graph-Homomorphic Perturbations for Private Decentralized Learning [64.26238893241322]
ローカルな見積もりの交換は、プライベートデータに基づくデータの推測を可能にする。
すべてのエージェントで独立して選択された摂動により、パフォーマンスが著しく低下する。
本稿では,特定のヌル空間条件に従って摂動を構成する代替スキームを提案する。
論文 参考訳(メタデータ) (2020-10-23T10:35:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。