論文の概要: Online Self-Evolving Anomaly Detection in Cloud Computing Environments
- arxiv url: http://arxiv.org/abs/2111.08232v1
- Date: Tue, 16 Nov 2021 05:13:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 02:42:48.972147
- Title: Online Self-Evolving Anomaly Detection in Cloud Computing Environments
- Title(参考訳): クラウドコンピューティング環境におけるオンライン自己進化的異常検出
- Authors: Haili Wang, Jingda Guo, Xu Ma, Song Fu, Qing Yang, Yunzhong Xu
- Abstract要約: 本稿では,クラウド信頼性保証のための自己進化型異常検出(SEAD)フレームワークを提案する。
我々のフレームワークは、新たに検証された異常記録を探索し、オンラインの異常検出を継続的に更新することによって、自己進化する。
我々の検出器は感度88.94%、平均94.60%を達成でき、実際の展開に適している。
- 参考スコア(独自算出の注目度): 6.480575492140354
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Modern cloud computing systems contain hundreds to thousands of computing and
storage servers. Such a scale, combined with ever-growing system complexity, is
causing a key challenge to failure and resource management for dependable cloud
computing. Autonomic failure detection is a crucial technique for understanding
emergent, cloud-wide phenomena and self-managing cloud resources for
system-level dependability assurance. To detect failures, we need to monitor
the cloud execution and collect runtime performance data. These data are
usually unlabeled, and thus a prior failure history is not always available in
production clouds. In this paper, we present a \emph{self-evolving anomaly
detection} (SEAD) framework for cloud dependability assurance. Our framework
self-evolves by recursively exploring newly verified anomaly records and
continuously updating the anomaly detector online. As a distinct advantage of
our framework, cloud system administrators only need to check a small number of
detected anomalies, and their decisions are leveraged to update the detector.
Thus, the detector evolves following the upgrade of system hardware, update of
the software stack, and change of user workloads. Moreover, we design two types
of detectors, one for general anomaly detection and the other for type-specific
anomaly detection. With the help of self-evolving techniques, our detectors can
achieve 88.94\% in sensitivity and 94.60\% in specificity on average, which
makes them suitable for real-world deployment.
- Abstract(参考訳): 現代のクラウドコンピューティングシステムには、数百から数千のコンピューティングとストレージサーバーがある。
このようなスケールとシステム複雑性の増大が相まって、依存可能なクラウドコンピューティングの障害やリソース管理の重要な課題となっている。
自律的障害検出は、創発的、クラウド全体の現象、およびシステムレベルの信頼性を保証するための自己管理型クラウドリソースを理解するための重要な技術である。
障害を検出するには、クラウドの実行を監視し、実行時のパフォーマンスデータを収集する必要がある。
これらのデータは通常ラベル付けされていないため、前回の障害履歴が運用クラウドで常に利用できるとは限らない。
本稿では,クラウド信頼性保証のための,emph{self-evolving anomaly detection} (SEAD) フレームワークを提案する。
提案手法は,新たに検証された異常記録を再帰的に探索し,オンラインで異常検出器を継続的に更新することで自己発生する。
私たちのフレームワークの明確な利点として、クラウドシステム管理者は検出された少数の異常をチェックするだけでよい。
これにより、システムハードウェアのアップグレード、ソフトウェアスタックのアップデート、ユーザワークロードの変更を経て、検出器が進化する。
さらに, 一般異常検出のための検出器と, タイプ特異的異常検出のための検出器を2種類設計した。
自己進化技術の助けを借りて、検出器は感度88.94\%、特異度94.60\%を平均で達成し、現実世界の展開に適している。
関連論文リスト
- Anomaly Detection in Large-Scale Cloud Systems: An Industry Case and Dataset [1.293050392312921]
我々は、IBM Cloud Consoleから4.5ヶ月以上にわたって収集された、IBM Cloudからの新しい高次元データセットを紹介します。
このデータセットは39,365行と117,448列のテレメトリデータからなる。
本稿では、異常検出のための機械学習モデルの応用を実演し、このプロセスで直面する重要な課題について論じる。
論文 参考訳(メタデータ) (2024-11-13T22:04:19Z) - MELODY: Robust Semi-Supervised Hybrid Model for Entity-Level Online Anomaly Detection with Multivariate Time Series [11.754433499581879]
欠陥のあるコード変更は、ターゲットサービスのパフォーマンスを低下させ、ダウンストリームサービスのカスケード障害を引き起こす可能性がある。
本稿では,デプロイメントにおける異常検出の問題について検討する。
我々は、エンティティレベルオンラインアノミクス検出のための新しいフレームワーク、半教師付きハイブリッドモデル(MELODY)を提案する。
論文 参考訳(メタデータ) (2024-01-18T19:02:41Z) - MoniLog: An Automated Log-Based Anomaly Detection System for Cloud
Computing Infrastructures [3.04585143845864]
MoniLogは、大規模環境でリアルタイムな異常を検出する分散アプローチである。
マルチソースログストリーム内のシーケンシャルかつ定量的な異常を検出することを目的としている。
論文 参考訳(メタデータ) (2023-04-24T09:21:52Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - A Robust and Explainable Data-Driven Anomaly Detection Approach For
Power Electronics [56.86150790999639]
本稿では,2つの異常検出・分類手法,すなわち行列プロファイルアルゴリズムと異常変換器を提案する。
行列プロファイルアルゴリズムは、ストリーミング時系列データにおけるリアルタイム異常を検出するための一般化可能なアプローチとして適している。
検知器の感度、リコール、検出精度を調整するために、一連のカスタムフィルタが作成され、追加される。
論文 参考訳(メタデータ) (2022-09-23T06:09:35Z) - CloudShield: Real-time Anomaly Detection in the Cloud [8.406912571507569]
CloudShieldは、クラウドコンピューティングのためのリアルタイムの異常および攻撃検知システムである。
良心的なプログラム、既知の攻撃、ゼロデイ攻撃を区別する。
誤報を最大99.0%減らす。
論文 参考訳(メタデータ) (2021-08-20T03:14:18Z) - Learning Dependencies in Distributed Cloud Applications to Identify and
Localize Anomalies [58.88325379746632]
本稿では、システムコンポーネントをノードとしてモデル化し、その依存関係をエッジとしてモデル化し、異常の識別と局在を改善するニューラルグラフ変換手法であるArvalusとその変種D-Arvalusを紹介します。
一連のメトリックを考えると、私たちの方法は最も可能性の高いシステム状態 - 正常または異常クラス - を予測し、異常が検出されたときにローカライズを行います。
この評価は、一般にArvalusの良好な予測性能を示し、システムコンポーネント依存性に関する情報を組み込んだD-Arvalusの利点を明らかにします。
論文 参考訳(メタデータ) (2021-03-09T06:34:05Z) - TELESTO: A Graph Neural Network Model for Anomaly Classification in
Cloud Services [77.454688257702]
機械学習(ML)と人工知能(AI)はITシステムの運用とメンテナンスに適用される。
1つの方向は、修復自動化を可能にするために、繰り返し発生する異常タイプを認識することである。
与えられたデータの次元変化に不変な手法を提案する。
論文 参考訳(メタデータ) (2021-02-25T14:24:49Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Anomaly Detection in a Large-scale Cloud Platform [9.283888139549067]
クラウドコンピューティングはユビキタスで、ますます多くの企業がワークロードをクラウドに移行している。
サービスプロバイダは、成長を続ける製品の品質を効果的に監視する必要があります。
我々は,IBM Cloud Platform用の自動監視システムを設計,実装した。
論文 参考訳(メタデータ) (2020-10-21T12:58:36Z) - Adaptive Anomaly Detection for IoT Data in Hierarchical Edge Computing [71.86955275376604]
本稿では,階層型エッジコンピューティング(HEC)システムに対する適応型異常検出手法を提案する。
本研究では,入力データから抽出した文脈情報に基づいてモデルを選択する適応的手法を設計し,異常検出を行う。
提案手法を実際のIoTデータセットを用いて評価し,検出タスクをクラウドにオフロードするのとほぼ同じ精度を維持しながら,検出遅延を84%削減できることを実証した。
論文 参考訳(メタデータ) (2020-01-10T05:29:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。