論文の概要: What Information Contributes to Log-based Anomaly Detection? Insights from a Configurable Transformer-Based Approach
- arxiv url: http://arxiv.org/abs/2409.20503v1
- Date: Mon, 30 Sep 2024 17:03:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-02 02:20:11.682806
- Title: What Information Contributes to Log-based Anomaly Detection? Insights from a Configurable Transformer-Based Approach
- Title(参考訳): ログベースの異常検出に寄与する情報 : 構成可能なトランスフォーマーによるアプローチからの考察
- Authors: Xingfang Wu, Heng Li, Foutse Khomh,
- Abstract要約: ログデータのセマンティック、シーケンシャル、時間的情報をキャプチャするトランスフォーマーに基づく異常検出モデルを提案する。
入力特徴の異なる組み合わせによる一連の実験を行い、異常検出における異なる種類の情報の役割を評価する。
その結果, 事象発生情報は異常を識別する上で重要な役割を担っていることが明らかとなった。
- 参考スコア(独自算出の注目度): 12.980238412281471
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Log data are generated from logging statements in the source code, providing insights into the execution processes of software applications and systems. State-of-the-art log-based anomaly detection approaches typically leverage deep learning models to capture the semantic or sequential information in the log data and detect anomalous runtime behaviors. However, the impacts of these different types of information are not clear. In addition, existing approaches have not captured the timestamps in the log data, which can potentially provide more fine-grained temporal information than sequential information. In this work, we propose a configurable transformer-based anomaly detection model that can capture the semantic, sequential, and temporal information in the log data and allows us to configure the different types of information as the model's features. Additionally, we train and evaluate the proposed model using log sequences of different lengths, thus overcoming the constraint of existing methods that rely on fixed-length or time-windowed log sequences as inputs. With the proposed model, we conduct a series of experiments with different combinations of input features to evaluate the roles of different types of information in anomaly detection. When presented with log sequences of varying lengths, the model can attain competitive and consistently stable performance compared to the baselines. The results indicate that the event occurrence information plays a key role in identifying anomalies, while the impact of the sequential and temporal information is not significant for anomaly detection in the studied public datasets. On the other hand, the findings also reveal the simplicity of the studied public datasets and highlight the importance of constructing new datasets that contain different types of anomalies to better evaluate the performance of anomaly detection models.
- Abstract(参考訳): ログデータはソースコードのロギングステートメントから生成され、ソフトウェアアプリケーションやシステムの実行プロセスに関する洞察を提供する。
最先端のログベースの異常検出アプローチは、一般的にディープラーニングモデルを利用してログデータのセマンティックな情報やシーケンシャルな情報をキャプチャし、異常な実行時動作を検出する。
しかし、これらの異なる種類の情報の影響は明らかではない。
さらに、既存のアプローチではログデータのタイムスタンプをキャプチャしていないため、シーケンシャル情報よりも詳細な時間情報を提供できる可能性がある。
本研究では,ログデータ中のセマンティック,シーケンシャル,時間的情報をキャプチャし,異なるタイプの情報をモデルの特徴として設定できる,構成可能なトランスフォーマーに基づく異常検出モデルを提案する。
さらに、異なる長さのログシーケンスを用いて、提案したモデルをトレーニングし、評価し、固定長またはタイムウインドしたログシーケンスを入力として依存する既存のメソッドの制約を克服する。
提案モデルを用いて,入力特徴の異なる組み合わせによる一連の実験を行い,異常検出における異なる種類の情報の役割を評価する。
様々な長さのログシーケンスを提示すると、ベースラインと比較して競争力があり、安定したパフォーマンスが得られる。
その結果, 事象発生情報は異常を識別する上で重要な役割を担っていることが明らかとなった。
一方,研究対象の公開データセットの単純さも明らかにし,異常検出モデルの性能を評価するために,異なる種類の異常を含む新しいデータセットを構築することの重要性を強調した。
関連論文リスト
- Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - GLAD: Content-aware Dynamic Graphs For Log Anomaly Detection [49.9884374409624]
GLADは、システムログの異常を検出するように設計されたグラフベースのログ異常検出フレームワークである。
システムログの異常を検出するために設計されたグラフベースのログ異常検出フレームワークであるGLADを紹介する。
論文 参考訳(メタデータ) (2023-09-12T04:21:30Z) - A Critical Review of Common Log Data Sets Used for Evaluation of
Sequence-based Anomaly Detection Techniques [2.5339493426758906]
6つの公開ログデータセットを解析し,異常の顕在化と検出のための簡単な手法に着目した。
以上の結果から,ほとんどの異常は逐次的出現とは直接関係がなく,これらのデータセットに対して高い検出率を達成するために高度な検出技術は必要ないことが示唆された。
論文 参考訳(メタデータ) (2023-09-06T09:31:17Z) - WePaMaDM-Outlier Detection: Weighted Outlier Detection using Pattern
Approaches for Mass Data Mining [0.6754597324022876]
外乱検出は、システム障害、不正行為、およびデータ内のパターンに関する重要な情報を明らかにすることができる。
本稿では、異なる質量データマイニング領域を持つWePaMaDM-Outlier Detectionを提案する。
また, 監視, 故障検出, 傾向解析において, 異常検出技術におけるデータモデリングの重要性についても検討した。
論文 参考訳(メタデータ) (2023-06-09T07:00:00Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Causality-Based Multivariate Time Series Anomaly Detection [63.799474860969156]
我々は、因果的観点から異常検出問題を定式化し、多変量データを生成するための通常の因果的メカニズムに従わない事例として、異常を考察する。
次に、まずデータから因果構造を学習し、次に、あるインスタンスが局所因果機構に対して異常であるかどうかを推定する因果検出手法を提案する。
我々は、実世界のAIOpsアプリケーションに関するケーススタディと同様に、シミュレートされたデータセットとパブリックなデータセットの両方を用いて、私たちのアプローチを評価します。
論文 参考訳(メタデータ) (2022-06-30T06:00:13Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Detecting Log Anomalies with Multi-Head Attention (LAMA) [2.0684234025249713]
テンプレートアクティビティ(イベント)シーケンスとしてログストリームを処理するマルチヘッドアテンションに基づくシーケンシャルモデルであるlamaを提案する。
次にイベント予測タスクを適用して、異常検出のためのモデルをトレーニングする。
論文 参考訳(メタデータ) (2021-01-07T06:15:59Z) - Self-Attentive Classification-Based Anomaly Detection in Unstructured
Logs [59.04636530383049]
ログ表現を学習するための分類法であるLogsyを提案する。
従来の方法と比較して,F1スコアの平均0.25の改善を示す。
論文 参考訳(メタデータ) (2020-08-21T07:26:55Z) - Dividing Deep Learning Model for Continuous Anomaly Detection of
Inconsistent ICT Systems [0.0]
本稿では,ログデータの相関関係に基づいて,ディープラーニングモデルを用いたICTシステム監視手法を提案する。
ログデータの一部が変更されると、ログデータの変化の影響を受けない分割されたモデルで健康モニタリングを継続できる。
論文 参考訳(メタデータ) (2020-03-24T11:32:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。