論文の概要: How Industry Tackles Anomalies during Runtime: Approaches and Key Monitoring Parameters
- arxiv url: http://arxiv.org/abs/2408.07816v1
- Date: Wed, 14 Aug 2024 21:10:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-16 15:38:42.346058
- Title: How Industry Tackles Anomalies during Runtime: Approaches and Key Monitoring Parameters
- Title(参考訳): 業界が実行中に異常に対処する - アプローチとキーモニタリングパラメータ
- Authors: Monika Steidl, Benedikt Dornauer, Michael Felderer, Rudolf Ramler, Mircea-Cristian Racasan, Marko Gattringer,
- Abstract要約: 本稿では,様々な産業分野における異常や現在の異常検出手法を理解することを目的とする。
また、実行時の監視データを通じて異常を特定するのに必要なパラメータを特定することも目標としている。
- 参考スコア(独自算出の注目度): 4.041882008624403
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deviations from expected behavior during runtime, known as anomalies, have become more common due to the systems' complexity, especially for microservices. Consequently, analyzing runtime monitoring data, such as logs, traces for microservices, and metrics, is challenging due to the large volume of data collected. Developing effective rules or AI algorithms requires a deep understanding of this data to reliably detect unforeseen anomalies. This paper seeks to comprehend anomalies and current anomaly detection approaches across diverse industrial sectors. Additionally, it aims to pinpoint the parameters necessary for identifying anomalies via runtime monitoring data. Therefore, we conducted semi-structured interviews with fifteen industry participants who rely on anomaly detection during runtime. Additionally, to supplement information from the interviews, we performed a literature review focusing on anomaly detection approaches applied to industrial real-life datasets. Our paper (1) demonstrates the diversity of interpretations and examples of software anomalies during runtime and (2) explores the reasons behind choosing rule-based approaches in the industry over self-developed AI approaches. AI-based approaches have become prominent in published industry-related papers in the last three years. Furthermore, we (3) identified key monitoring parameters collected during runtime (logs, traces, and metrics) that assist practitioners in detecting anomalies during runtime without introducing bias in their anomaly detection approach due to inconclusive parameters.
- Abstract(参考訳): 実行時に期待される振る舞いからの逸脱(異常と呼ばれる)は、特にマイクロサービスにおいて、システムの複雑さのためにより一般的になっています。
結果として、ログやマイクロサービスのトレース、メトリクスといったランタイム監視データの解析は、収集された大量のデータのために難しい。
効果的なルールやAIアルゴリズムを開発するには、予期せぬ異常を確実に検出するために、このデータを深く理解する必要がある。
本稿では,様々な産業分野における異常や現在の異常検出手法を理解することを目的とする。
さらに、実行時の監視データを通じて異常を識別するために必要なパラメータをピンポイントすることを目的としている。
そこで,実行中の異常検出に依存する15の業界参加者を対象に,半構造化インタビューを行った。
さらに,本研究では,産業用実生活データセットに適用した異常検出手法に着目した文献レビューを行った。
本稿は,実行中のソフトウェア異常の解釈や例の多様性を実証し,また,自己開発型AIアプローチよりも業界におけるルールベースのアプローチを選択する理由を考察する。
AIベースのアプローチは、過去3年間で業界関連の論文で顕著になっている。
さらに,実行中に収集した重要な監視パラメータ(ログ,トレース,メトリクス)を特定し,不確定なパラメータによる異常検出アプローチのバイアスを発生させることなく,実行中の異常検出を支援する。
関連論文リスト
- A Survey of Time Series Anomaly Detection Methods in the AIOps Domain [16.92261613814882]
インターネットベースのサービスは目覚ましい成功を収め、キーパフォーマンス指標(KPI)を大量に生成している。
このレビューは、AIOps(AI Ops for IT Operation)における時系列異常検出の総合的な概要を提供する。
近年の進歩に基づいて,実世界と次世代の時系列異常検出の今後の方向性を探究する。
論文 参考訳(メタデータ) (2023-08-01T09:13:57Z) - Precursor-of-Anomaly Detection for Irregular Time Series [31.73234935455713]
本稿では,新しいタイプの異常検出法であるPrecursor-of-Anomaly(PoA)について述べる。
両問題を同時に解くために,ニューラルネットワークとマルチタスク学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-27T14:10:09Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - From Explanation to Action: An End-to-End Human-in-the-loop Framework
for Anomaly Reasoning and Management [15.22568616519016]
ALARMは、異常採掘サイクルを包括的にサポートするエンドツーエンドフレームワークである。
異常な説明と、ヒューマン・イン・ザ・ループ・プロセスのための対話型GUIを提供する。
我々は、金融業界の詐欺アナリストによる一連のケーススタディを通じて、ALARMの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-06T20:49:36Z) - Real-Time Outlier Detection with Dynamic Process Limits [0.609170287691728]
本稿では,既存のリアルタイムインフラストラクチャを対象としたオンライン異常検出アルゴリズムを提案する。
オンライン逆累積分布に基づく手法を導入し、オフライン異常検出器の一般的な問題を排除した。
提案手法の利点は, 実マイクログリッド演算データの2例に示すように, 使いやすさ, 高速計算, 展開性である。
論文 参考訳(メタデータ) (2023-01-31T10:23:02Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Deep Learning for Time Series Anomaly Detection: A Survey [53.83593870825628]
時系列異常検出は、製造業や医療を含む幅広い研究分野や応用に応用されている。
時系列の大規模かつ複雑なパターンにより、研究者は異常パターンを検出するための特別な深層学習モデルを開発するようになった。
本調査は,ディープラーニングを用いた構造化および総合的時系列異常検出モデルの提供に焦点を当てる。
論文 参考訳(メタデータ) (2022-11-09T22:40:22Z) - Causality-Based Multivariate Time Series Anomaly Detection [63.799474860969156]
我々は、因果的観点から異常検出問題を定式化し、多変量データを生成するための通常の因果的メカニズムに従わない事例として、異常を考察する。
次に、まずデータから因果構造を学習し、次に、あるインスタンスが局所因果機構に対して異常であるかどうかを推定する因果検出手法を提案する。
我々は、実世界のAIOpsアプリケーションに関するケーススタディと同様に、シミュレートされたデータセットとパブリックなデータセットの両方を用いて、私たちのアプローチを評価します。
論文 参考訳(メタデータ) (2022-06-30T06:00:13Z) - Functional Anomaly Detection: a Benchmark Study [4.444788548423704]
異常検出は、非常に高い周波数でサンプリングされた測定に依存することができる。
本研究の目的は, 実データセット上の機能的設定において, 異常検出のための最近の手法の性能について検討することである。
論文 参考訳(メタデータ) (2022-01-13T18:20:32Z) - A2Log: Attentive Augmented Log Anomaly Detection [53.06341151551106]
異常検出は、ITサービスの信頼性とサービス性にとってますます重要になる。
既存の教師なし手法は、適切な決定境界を得るために異常な例を必要とする。
我々は,異常判定と異常判定の2段階からなる教師なし異常検出手法であるA2Logを開発した。
論文 参考訳(メタデータ) (2021-09-20T13:40:21Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。