論文の概要: LogLAB: Attention-Based Labeling of Log Data Anomalies via Weak
Supervision
- arxiv url: http://arxiv.org/abs/2111.01657v1
- Date: Tue, 2 Nov 2021 15:16:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-03 14:01:05.521758
- Title: LogLAB: Attention-Based Labeling of Log Data Anomalies via Weak
Supervision
- Title(参考訳): LogLAB: 弱スーパービジョンによるログデータ異常の注意に基づくラベル付け
- Authors: Thorsten Wittkopp and Philipp Wiesner and Dominik Scheinert and
Alexander Acker
- Abstract要約: 専門家の手作業を必要とせず,ログメッセージの自動ラベル付けのための新しいモデリング手法であるLogLABを提案する。
本手法は,監視システムが提供する推定故障時間ウィンドウを用いて,正確なラベル付きデータセットを振り返りに生成する。
我々の評価によると、LogLABは3つの異なるデータセットで9つのベンチマークアプローチを一貫して上回り、大規模な障害時ウィンドウでも0.98以上のF1スコアを維持している。
- 参考スコア(独自算出の注目度): 63.08516384181491
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With increasing scale and complexity of cloud operations, automated detection
of anomalies in monitoring data such as logs will be an essential part of
managing future IT infrastructures. However, many methods based on artificial
intelligence, such as supervised deep learning models, require large amounts of
labeled training data to perform well. In practice, this data is rarely
available because labeling log data is expensive, time-consuming, and requires
a deep understanding of the underlying system. We present LogLAB, a novel
modeling approach for automated labeling of log messages without requiring
manual work by experts. Our method relies on estimated failure time windows
provided by monitoring systems to produce precise labeled datasets in
retrospect. It is based on the attention mechanism and uses a custom objective
function for weak supervision deep learning techniques that accounts for
imbalanced data. Our evaluation shows that LogLAB consistently outperforms nine
benchmark approaches across three different datasets and maintains an F1-score
of more than 0.98 even at large failure time windows.
- Abstract(参考訳): クラウド運用の規模と複雑さの増大により、ログなどのデータ監視における異常の自動検出は、将来のITインフラストラクチャを管理する上で不可欠な部分となるでしょう。
しかし、教師付きディープラーニングモデルのような人工知能に基づく多くの手法は、うまく機能するために大量のラベル付きトレーニングデータを必要とする。
実際、ログデータのラベリングは高価で時間がかかり、基礎となるシステムを深く理解する必要があるため、このデータはめったに利用できない。
専門家の手作業を必要としないログメッセージの自動ラベル付けのための新しいモデリング手法であるLogLABを提案する。
本手法は,監視システムが提供する推定故障時間ウィンドウを用いて,正確なラベル付きデータセットを生成する。
注意機構に基づいており、不均衡なデータを考慮に入れた弱監視深層学習技術にカスタム目的関数を使用する。
我々の評価によると、LogLABは3つの異なるデータセットで9つのベンチマークアプローチを一貫して上回り、大規模な障害時ウィンドウでも0.98以上のF1スコアを維持している。
関連論文リスト
- LogSD: Detecting Anomalies from System Logs through Self-supervised Learning and Frequency-based Masking [14.784236273395017]
我々は,新しい半教師付き自己教師付き学習手法であるLogSDを提案する。
我々は,LogSDが8つの最先端ベンチマーク手法を著しく上回っていることを示す。
論文 参考訳(メタデータ) (2024-04-17T12:00:09Z) - RAPID: Training-free Retrieval-based Log Anomaly Detection with PLM
considering Token-level information [7.861095039299132]
特に現実世界のアプリケーションでは、ログ異常検出の必要性が高まっている。
従来のディープラーニングベースの異常検出モデルでは、データセット固有のトレーニングが必要で、それに対応する遅延が発生する。
本稿では,ログデータ固有の特徴を活かして,トレーニング遅延を伴わずに異常検出を可能にするモデルRAPIDを紹介する。
論文 参考訳(メタデータ) (2023-11-09T06:11:44Z) - Log-based Anomaly Detection based on EVT Theory with feedback [31.949892354842525]
本研究では,SeaLogと呼ばれる高精度で軽量かつ適応的なログベースの異常検出フレームワークを提案する。
本稿では,リアルタイムな異常検出を行うために,軽量で動的に成長するトリエ構造を用いたTrie-based Detection Agent (TDA)を提案する。
ログデータの進化に対応してTDAの精度を高めるため,専門家からフィードバックを得られるようにした。
論文 参考訳(メタデータ) (2023-06-08T08:34:58Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Failure Identification from Unstable Log Data using Deep Learning [0.27998963147546146]
故障同定手法としてCLogを提案する。
ログデータをログイベントのシーケンスではなくサブプロセスのシーケンスとして表現することにより、不安定なログデータの効果を低減する。
実験の結果,学習したサブプロセス表現が入力の不安定性を低下させることが示された。
論文 参考訳(メタデータ) (2022-04-06T07:41:48Z) - A2Log: Attentive Augmented Log Anomaly Detection [53.06341151551106]
異常検出は、ITサービスの信頼性とサービス性にとってますます重要になる。
既存の教師なし手法は、適切な決定境界を得るために異常な例を必要とする。
我々は,異常判定と異常判定の2段階からなる教師なし異常検出手法であるA2Logを開発した。
論文 参考訳(メタデータ) (2021-09-20T13:40:21Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Self-Attentive Classification-Based Anomaly Detection in Unstructured
Logs [59.04636530383049]
ログ表現を学習するための分類法であるLogsyを提案する。
従来の方法と比較して,F1スコアの平均0.25の改善を示す。
論文 参考訳(メタデータ) (2020-08-21T07:26:55Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。