論文の概要: Learning Dependencies in Distributed Cloud Applications to Identify and
Localize Anomalies
- arxiv url: http://arxiv.org/abs/2103.05245v1
- Date: Tue, 9 Mar 2021 06:34:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-10 14:45:12.164697
- Title: Learning Dependencies in Distributed Cloud Applications to Identify and
Localize Anomalies
- Title(参考訳): 分散クラウドアプリケーションにおける依存関係の学習と異常の特定とローカライズ
- Authors: Dominik Scheinert, Alexander Acker, Lauritz Thamsen, Morgan K.
Geldenhuys, Odej Kao
- Abstract要約: 本稿では、システムコンポーネントをノードとしてモデル化し、その依存関係をエッジとしてモデル化し、異常の識別と局在を改善するニューラルグラフ変換手法であるArvalusとその変種D-Arvalusを紹介します。
一連のメトリックを考えると、私たちの方法は最も可能性の高いシステム状態 - 正常または異常クラス - を予測し、異常が検出されたときにローカライズを行います。
この評価は、一般にArvalusの良好な予測性能を示し、システムコンポーネント依存性に関する情報を組み込んだD-Arvalusの利点を明らかにします。
- 参考スコア(独自算出の注目度): 58.88325379746632
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Operation and maintenance of large distributed cloud applications can quickly
become unmanageably complex, putting human operators under immense stress when
problems occur. Utilizing machine learning for identification and localization
of anomalies in such systems supports human experts and enables fast
mitigation. However, due to the various inter-dependencies of system
components, anomalies do not only affect their origin but propagate through the
distributed system. Taking this into account, we present Arvalus and its
variant D-Arvalus, a neural graph transformation method that models system
components as nodes and their dependencies and placement as edges to improve
the identification and localization of anomalies. Given a series of metric
KPIs, our method predicts the most likely system state - either normal or an
anomaly class - and performs localization when an anomaly is detected. During
our experiments, we simulate a distributed cloud application deployment and
synthetically inject anomalies. The evaluation shows the generally good
prediction performance of Arvalus and reveals the advantage of D-Arvalus which
incorporates information about system component dependencies.
- Abstract(参考訳): 大規模な分散クラウドアプリケーションの運用とメンテナンスは、すぐに管理不能に複雑になり、問題が発生したときに人間のオペレータが大きなストレスにさらされます。
このようなシステムにおける異常の識別と局在化に機械学習を利用することは、人間の専門家をサポートし、迅速な緩和を可能にします。
しかしながら、システムコンポーネントのさまざまな相互依存のため、異常はその起源に影響を与えるだけでなく、分散システムを通じて伝播する。
そこで本研究では,システムコンポーネントをノードとしてモデル化し,その依存関係と配置をエッジとしてモデル化し,異常の識別と局在性を改善するニューラルネットワーク変換手法であるArvalusとその変種であるD-Arvalusを提案する。
一連のメトリクスKPIを考えると、私たちの方法は最も可能性の高いシステム状態 - 正常または異常クラス - を予測し、異常が検出されたときにローカライズを行います。
実験では、分散クラウドアプリケーションのデプロイをシミュレートし、異常を合成的に注入する。
この評価は、一般にArvalusの良好な予測性能を示し、システムコンポーネント依存性に関する情報を組み込んだD-Arvalusの利点を明らかにします。
関連論文リスト
- MLAD: A Unified Model for Multi-system Log Anomaly Detection [35.68387377240593]
複数のシステムにまたがる意味的関係推論を組み込んだ新しい異常検出モデルMLADを提案する。
具体的には、Sentence-bertを用いてログシーケンス間の類似性を捉え、それらを高次元の学習可能な意味ベクトルに変換する。
我々は,各キーワードのシーケンスにおける意義を識別し,マルチシステムデータセットの全体分布をモデル化するために,アテンション層の公式を改訂する。
論文 参考訳(メタデータ) (2024-01-15T12:51:13Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - Heterogeneous Anomaly Detection for Software Systems via Semi-supervised
Cross-modal Attention [29.654681594903114]
ヘテロジニアスデータに基づいてシステム異常を識別する,最初のエンドツーエンドの半教師付きアプローチであるHadesを提案する。
当社のアプローチでは,ログセマンティクスとメトリックパターンを融合させることで,システムステータスのグローバルな表現を学ぶために階層的アーキテクチャを採用している。
我々はHuawei Cloudの大規模シミュレーションデータとデータセットに基づいてHadesを広範囲に評価する。
論文 参考訳(メタデータ) (2023-02-14T09:02:11Z) - Prototypical Residual Networks for Anomaly Detection and Localization [80.5730594002466]
本稿では,PRN(Prototypeal Residual Network)というフレームワークを提案する。
PRNは、異常領域の分割マップを正確に再構築するために、異常領域と正常パターンの間の様々なスケールとサイズの特徴的残差を学習する。
異常を拡大・多様化するために,見かけの相違と外観の相違を考慮に入れた様々な異常発生戦略を提示する。
論文 参考訳(メタデータ) (2022-12-05T05:03:46Z) - Causality-Based Multivariate Time Series Anomaly Detection [63.799474860969156]
我々は、因果的観点から異常検出問題を定式化し、多変量データを生成するための通常の因果的メカニズムに従わない事例として、異常を考察する。
次に、まずデータから因果構造を学習し、次に、あるインスタンスが局所因果機構に対して異常であるかどうかを推定する因果検出手法を提案する。
我々は、実世界のAIOpsアプリケーションに関するケーススタディと同様に、シミュレートされたデータセットとパブリックなデータセットの両方を用いて、私たちのアプローチを評価します。
論文 参考訳(メタデータ) (2022-06-30T06:00:13Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - A Survey on Anomaly Detection for Technical Systems using LSTM Networks [0.0]
異常は、意図されたシステムの動作から逸脱し、部分的または完全なシステム障害と同様に効率が低下する可能性がある。
本稿では,ディープニューラルネットワーク,特に長期記憶ネットワークを用いた最先端異常検出に関する調査を行う。
調査したアプローチは、アプリケーションシナリオ、データ、異常タイプ、およびさらなるメトリクスに基づいて評価される。
論文 参考訳(メタデータ) (2021-05-28T13:24:40Z) - TELESTO: A Graph Neural Network Model for Anomaly Classification in
Cloud Services [77.454688257702]
機械学習(ML)と人工知能(AI)はITシステムの運用とメンテナンスに適用される。
1つの方向は、修復自動化を可能にするために、繰り返し発生する異常タイプを認識することである。
与えられたデータの次元変化に不変な手法を提案する。
論文 参考訳(メタデータ) (2021-02-25T14:24:49Z) - Multi-Source Anomaly Detection in Distributed IT Systems [0.2538209532048867]
分散システムにおける異常検出のタスクには、分散トレースとシステムログデータからの共同表現を利用します。
我々は、ログと分散トレースの両方の異常検出の一般化として使用される学習タスク(次のテンプレート予測NTP)を形式化する。
論文 参考訳(メタデータ) (2021-01-13T10:11:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。