論文の概要: Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models
- arxiv url: http://arxiv.org/abs/2102.11570v1
- Date: Tue, 23 Feb 2021 09:17:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-24 14:07:50.052189
- Title: Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models
- Title(参考訳): 事前学習型言語モデルを用いたログデータのロバストと転送可能な異常検出
- Authors: Harold Ott, Jasmin Bogatinovski, Alexander Acker, Sasho Nedelkoski,
Odej Kao
- Abstract要約: クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 59.04636530383049
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Anomalies or failures in large computer systems, such as the cloud, have an
impact on a large number of users that communicate, compute, and store
information. Therefore, timely and accurate anomaly detection is necessary for
reliability, security, safe operation, and mitigation of losses in these
increasingly important systems. Recently, the evolution of the software
industry opens up several problems that need to be tackled including (1)
addressing the software evolution due software upgrades, and (2) solving the
cold-start problem, where data from the system of interest is not available. In
this paper, we propose a framework for anomaly detection in log data, as a
major troubleshooting source of system information. To that end, we utilize
pre-trained general-purpose language models to preserve the semantics of log
messages and map them into log vector embeddings. The key idea is that these
representations for the logs are robust and less invariant to changes in the
logs, and therefore, result in a better generalization of the anomaly detection
models. We perform several experiments on a cloud dataset evaluating different
language models for obtaining numerical log representations such as BERT,
GPT-2, and XL. The robustness is evaluated by gradually altering log messages,
to simulate a change in semantics. Our results show that the proposed approach
achieves high performance and robustness, which opens up possibilities for
future research in this direction.
- Abstract(参考訳): クラウドのような大規模コンピュータシステムにおける異常や障害は、情報を伝える、計算し、保存する多くのユーザに影響を与える。
したがって, 信頼性, セキュリティ, 安全操作, 損失軽減のためには, 時間的かつ正確な異常検出が必要である。
近年,ソフトウェア産業の進化は,(1)ソフトウェアアップグレードに伴うソフトウェア進化に対処すること,(2)興味あるシステムからのデータが入手できないコールドスタート問題の解決など,取り組まなければならない問題のいくつかを解決している。
本稿では,システム情報の主要なトラブルシューティング源として,ログデータの異常検出のためのフレームワークを提案する。
そのために、事前訓練された汎用言語モデルを用いてログメッセージの意味を保存し、それらをログベクトル埋め込みにマッピングする。
重要なアイデアは、ログのこれらの表現は堅牢であり、ログの変更に不変ではないため、異常検出モデルのより良い一般化をもたらすということです。
BERT、GPT-2、XLなどの数値ログ表現を得るために、異なる言語モデルを評価するクラウドデータセット上でいくつかの実験を行います。
セマンティクスの変化をシミュレートするために、ログメッセージを徐々に変更することでロバスト性を評価する。
その結果,提案手法は高い性能と頑健性を実現し,今後の研究の可能性を開くことができた。
関連論文リスト
- Anomaly Detection on Unstable Logs with GPT Models [1.9713190626298576]
本稿では,不安定なログの異常検出のための微調整LDMと代替モデルの実験的比較について報告する。
膨大なデータセット上でのLLMの事前トレーニングは、多様なパターンやコンテキスト情報の堅牢な理解を可能にする可能性がある。
GPT-3と他の教師付きアプローチの違いは、ログシーケンスの変化の度合いが増加するにつれて、より顕著になる傾向にある。
論文 参考訳(メタデータ) (2024-06-11T17:13:18Z) - LogFormer: A Pre-train and Tuning Pipeline for Log Anomaly Detection [73.69399219776315]
本稿では,ログ異常検出(LogFormer)のためのTransformerベースの統合フレームワークを提案する。
具体的には、ログデータの共有セマンティック知識を得るために、まず、ソースドメイン上で事前学習を行う。
そして、そのような知識を共有パラメータを介して対象領域に転送する。
論文 参考訳(メタデータ) (2024-01-09T12:55:21Z) - EvLog: Identifying Anomalous Logs over Software Evolution [31.46106509190191]
解析なしでログを処理するためのEvolving Log extractor (EvLog) という新しい教師なし手法を提案する。
EvLogは、異常なログを識別し、不安定なシーケンスによって引き起こされる問題を回避するために、注意機構を備えた異常判別器を実装している。
EvLogは、平均F1スコアが0.955と0.847の2つの実世界のシステム進化ログデータセットにおいて、それぞれバージョン内設定とバージョン間設定で有効であることを示した。
論文 参考訳(メタデータ) (2023-06-02T12:58:00Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - LAnoBERT: System Log Anomaly Detection based on BERT Masked Language
Model [12.00171674362062]
システムログ異常検出の目的は、人間の介入を最小限に抑えつつ、即座に異常を識別することである。
従来の研究では、様々なログデータを標準化されたテンプレートに変換した後、アルゴリズムによる異常検出が行われた。
本研究では,自然言語処理性能に優れたLAnoBERTを提案する。
論文 参考訳(メタデータ) (2021-11-18T07:46:35Z) - LogLAB: Attention-Based Labeling of Log Data Anomalies via Weak
Supervision [63.08516384181491]
専門家の手作業を必要とせず,ログメッセージの自動ラベル付けのための新しいモデリング手法であるLogLABを提案する。
本手法は,監視システムが提供する推定故障時間ウィンドウを用いて,正確なラベル付きデータセットを振り返りに生成する。
我々の評価によると、LogLABは3つの異なるデータセットで9つのベンチマークアプローチを一貫して上回り、大規模な障害時ウィンドウでも0.98以上のF1スコアを維持している。
論文 参考訳(メタデータ) (2021-11-02T15:16:08Z) - Log-based Anomaly Detection Without Log Parsing [7.66638994053231]
ログ解析を必要としない新しいログベースの異常検出手法であるNeuralLogを提案する。
実験の結果,提案手法はログメッセージの意味を効果的に理解できることがわかった。
全体として、NeuralLogは4つの公開データセットで0.95以上のF1スコアを獲得し、既存のアプローチを上回っている。
論文 参考訳(メタデータ) (2021-08-04T10:42:13Z) - TELESTO: A Graph Neural Network Model for Anomaly Classification in
Cloud Services [77.454688257702]
機械学習(ML)と人工知能(AI)はITシステムの運用とメンテナンスに適用される。
1つの方向は、修復自動化を可能にするために、繰り返し発生する異常タイプを認識することである。
与えられたデータの次元変化に不変な手法を提案する。
論文 参考訳(メタデータ) (2021-02-25T14:24:49Z) - Self-Attentive Classification-Based Anomaly Detection in Unstructured
Logs [59.04636530383049]
ログ表現を学習するための分類法であるLogsyを提案する。
従来の方法と比較して,F1スコアの平均0.25の改善を示す。
論文 参考訳(メタデータ) (2020-08-21T07:26:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。