論文の概要: A Holistic Framework for Automated Configuration Recommendation for Cloud Service Monitoring
- arxiv url: http://arxiv.org/abs/2603.12268v1
- Date: Sat, 07 Feb 2026 07:54:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.190856
- Title: A Holistic Framework for Automated Configuration Recommendation for Cloud Service Monitoring
- Title(参考訳): クラウドサービス監視のための自動構成推奨のための全体的フレームワーク
- Authors: Anson Bastos, Shreeya Venneti, Anjaly Parayil, Ayush Choure, Chetan Bansal, Rujia Wang,
- Abstract要約: 大規模クラウドサービスの信頼性は、ユーザの満足度とビジネス継続性に不可欠である。
大企業では、堅牢なヘルスモニタリングシステムを必要とするリージョンに複数のサービスがデプロイされます。
現在の監視設定プロセスは手動で、大部分がリアクティブでアドホックで、カバレッジと冗長なアラートのギャップが生じる。
- 参考スコア(独自算出の注目度): 10.02304021245375
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Reliability of large-scale cloud services is critical for user satisfaction and business continuity. Despite significant investments in reliability engineering, production incidents remain inevitable, often leading to customer impact and operational overhead. In large cloud companies, multiple services are deployed across regions necessitating robust health monitoring systems. However, the current monitor configuration process is manual, largely reactive and ad hoc, resulting in gaps in coverage and redundant alerts. In this paper, we present a comprehensive study of monitor creation in Microsoft, identifying key components in the existing process. We further design a modular recommendation framework that processes the graph structured service entities to suggest optimal monitor configurations. Through extensive experimentation on historical data and user study of recommendations for production services at Microsoft, we demonstrate the efficacy of our approach in providing relevant recommendations for monitor configurations.
- Abstract(参考訳): 大規模クラウドサービスの信頼性は、ユーザの満足度とビジネス継続性に不可欠である。
信頼性エンジニアリングに多大な投資をしているにも関わらず、生産インシデントは避けられないままであり、しばしば顧客への影響や運用上のオーバーヘッドにつながる。
大企業では、堅牢なヘルスモニタリングシステムを必要とするリージョンに複数のサービスがデプロイされます。
しかしながら、現在の監視設定プロセスは手動で、大部分がリアクティブでアドホックで、カバレッジと冗長なアラートのギャップが生じる。
本稿では,Microsoftにおけるモニタ作成の包括的研究を行い,既存のプロセスにおける重要なコンポーネントを同定する。
さらに、最適な監視設定を提案するために、グラフ構造化サービスエンティティを処理するモジュラーレコメンデーションフレームワークを設計します。
本研究は,Microsoftの製品サービスにおける履歴データとユーザによる推奨事項のユーザスタディを通じて,モニタリング設定に関する推奨事項の提供において,我々のアプローチの有効性を実証する。
関連論文リスト
- Attention Enhanced Entity Recommendation for Intelligent Monitoring in Cloud Systems [20.57785917249615]
DeRecGNNは、Microsoftにおけるクラウドサービス監視のための注目度の高いエンティティレコメンデーションフレームワークである。
当社は、クラウドサービス所有者が認識しているこの機能の有用性と、デプロイメントから学んだ教訓について、洞察を提供する。
論文 参考訳(メタデータ) (2025-10-23T15:14:09Z) - Tracing and Metrics Design Patterns for Monitoring Cloud-native Applications [0.0]
この記事では,クラウドネイティブアプリケーションの監視において重要な課題に対処する3つのデザインパターンを紹介する。
Application Metricsは、意味のあるパフォーマンス指標を備えたアプリケーション計測のための構造化されたアプローチを提供し、Infrastructure Metricsは、システムが運用されている環境の監視に重点を置いている。
論文 参考訳(メタデータ) (2025-10-03T13:32:15Z) - A Decentralized and Self-Adaptive Approach for Monitoring Volatile Edge Environments [40.96858640950632]
エッジのための分散自己適応監視システムであるDEMonを提案する。
提案システムは軽量でポータブルなコンテナベースシステムとして実装し,実験を通じて評価する。
その結果, エッジモニタリングの課題に対処するため, DEMonは効率的にモニタリング情報を拡散し, 回収することがわかった。
論文 参考訳(メタデータ) (2024-05-13T14:47:34Z) - Intelligent Monitoring Framework for Cloud Services: A Data-Driven Approach [8.862212993027658]
監視のギャップは、インシデント検出の遅延と、顧客の重大なネガティブな影響につながる可能性がある。
開発者は部族的知識と、主に試行錯誤に基づくプロセスを使ってモニターを作成する。
サービスプロパティに基づいたクラウドサービスの監視を推奨するインテリジェントな監視フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-29T19:40:32Z) - Monitoring Auditable Claims in the Cloud [0.0]
本稿では,観測システムの実装に依存しないフレキシブルなモニタリング手法を提案する。
提案手法は,分散データログベースのプログラムと,Trillianをベースとしたタンパー保護ストレージを組み合わせたものである。
我々は、無人航空機の編成にクラウドインフラを使用する産業ユースケースに適用する。
論文 参考訳(メタデータ) (2023-12-19T11:21:18Z) - Optimal Event Monitoring through Internet Mashup over Multivariate Time
Series [77.34726150561087]
このフレームワークは、モデル定義、クエリ、パラメータ学習、モデル評価、データ監視、決定レコメンデーション、Webポータルのサービスをサポートする。
さらに、MTSAデータモデルとクエリ言語を拡張して、学習、監視、レコメンデーションのサービスにおいて、この種の問題をサポートする。
論文 参考訳(メタデータ) (2022-10-18T16:56:17Z) - Device-Cloud Collaborative Recommendation via Meta Controller [65.97416287295152]
オンデバイスレコメンデータとクラウドベースのレコメンデータの協調を動的に管理するメタコントローラを提案する。
対策サンプルと拡張トレーニングに基づいて,産業レコメンデーションシナリオにおける広範な実験は,メタコントローラの可能性を示唆している。
論文 参考訳(メタデータ) (2022-07-07T03:23:04Z) - Prescriptive Process Monitoring: Quo Vadis? [64.39761523935613]
本論文はシステム文献レビュー(SLR)を通して,本分野における既存手法について考察する。
SLRは今後の研究の課題や分野に関する洞察を提供し、規範的なプロセス監視手法の有用性と適用性を高めることができる。
論文 参考訳(メタデータ) (2021-12-03T08:06:24Z) - Reproducible Performance Optimization of Complex Applications on the
Edge-to-Cloud Continuum [55.6313942302582]
エッジ・ツー・クラウド・コンティニュム上でのリアルタイムアプリケーションの最適化を支援する手法を提案する。
提案手法は, 制御されたテストベッド環境において, その動作を理解するための厳密な構成解析に頼っている。
当社の方法論はEdge-to-Cloud Continuumの他のアプリケーションに一般化することができる。
論文 参考訳(メタデータ) (2021-08-04T07:35:14Z) - Monitoring and explainability of models in production [58.720142291102135]
デプロイされたモデルを監視することは、高品質の機械学習対応サービスの継続的なプロビジョニングに不可欠である。
これらの領域でソリューションの実装を成功させる上での課題を,オープンソースツールを使用した本番環境対応ソリューションの最近の例で論じる。
論文 参考訳(メタデータ) (2020-07-13T10:37:05Z) - A Privacy-Preserving Distributed Architecture for
Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。
クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文 参考訳(メタデータ) (2020-03-30T15:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。