論文の概要: Hue: A User-Adaptive Parser for Hybrid Logs
- arxiv url: http://arxiv.org/abs/2308.07085v1
- Date: Mon, 14 Aug 2023 11:28:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 14:21:38.539279
- Title: Hue: A User-Adaptive Parser for Hybrid Logs
- Title(参考訳): Hue: ハイブリッドログのためのユーザ適応パーザ
- Authors: Junjielong Xu, Qiuai Fu, Zhouruixing Zhu, Yutong Cheng, Zhijing Li,
Yuchi Ma, Pinjia He
- Abstract要約: Hueは各ログメッセージをキーキャストテーブルを使用して特別なワイルドカードのシーケンスに変換する。
Hueは、新しいマージ・リジェクト戦略を通じて、ユーザのフィードバックを効果的に活用することができる。
Hueは、日々のハイブリッドログ解析のために、実運用環境でのデプロイに成功している。
- 参考スコア(独自算出の注目度): 4.783349633632601
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Log parsing, which extracts log templates from semi-structured logs and
produces structured logs, is the first and the most critical step in automated
log analysis. While existing log parsers have achieved decent results, they
suffer from two major limitations by design. First, they do not natively
support hybrid logs that consist of both single-line logs and multi-line logs
(\eg Java Exception and Hadoop Counters). Second, they fall short in
integrating domain knowledge in parsing, making it hard to identify ambiguous
tokens in logs. This paper defines a new research problem, \textit{hybrid log
parsing}, as a superset of traditional log parsing tasks, and proposes
\textit{Hue}, the first attempt for hybrid log parsing via a user-adaptive
manner. Specifically, Hue converts each log message to a sequence of special
wildcards using a key casting table and determines the log types via line
aggregating and pattern extracting. In addition, Hue can effectively utilize
user feedback via a novel merge-reject strategy, making it possible to quickly
adapt to complex and changing log templates. We evaluated Hue on three hybrid
log datasets and sixteen widely-used single-line log datasets (\ie Loghub). The
results show that Hue achieves an average grouping accuracy of 0.845 on hybrid
logs, which largely outperforms the best results (0.563 on average) obtained by
existing parsers. Hue also exhibits SOTA performance on single-line log
datasets. Furthermore, Hue has been successfully deployed in a real production
environment for daily hybrid log parsing.
- Abstract(参考訳): ログ解析は、半構造化ログからログテンプレートを抽出するもので、構造化ログを生成する。
既存のログパーサは良好な結果を得たが、設計上の2つの大きな制限に苦しんでいる。
まず、シングルラインログとマルチラインログ(\eg Java ExceptionとHadoop Counters)の両方からなるハイブリッドログをネイティブにサポートしていない。
第二に、解析におけるドメイン知識の統合に不足しているため、ログ内のあいまいなトークンを特定するのが難しくなる。
本稿では,従来のログ解析タスクのスーパーセットとして,新しい研究課題である‘textit{hybrid log parsing} を定義し,ユーザ適応方式によるハイブリッドログ解析の最初の試みである‘textit{Hue} を提案する。
具体的には、各ログメッセージをキーキャスティングテーブルを用いて特殊ワイルドカード列に変換し、行集約とパターン抽出を通じてログタイプを決定する。
さらにHueは,新たなマージ・リジェクト戦略を通じてユーザフィードバックを効果的に活用することで,複雑なログテンプレートへの迅速な適応を可能にする。
3つのハイブリッドログデータセットと16の広く使用されているシングルラインログデータセット(\ie loghub)でhueを評価した。
その結果,Hue はハイブリッドログ上で平均 0.845 のグルーピング精度を達成し,既存のパーサーで得られる最高の結果 (0.563 %) よりも優れていた。
Hueはまた、シングルラインログデータセット上でのSOTAパフォーマンスも示す。
さらにHueは、日々のハイブリッドログ解析のために、実運用環境でのデプロイに成功した。
関連論文リスト
- HELP: Hierarchical Embeddings-based Log Parsing [0.25112747242081457]
ログは、ソフトウェアのメンテナンスと障害診断のための、第一級の情報ソースである。
ログ解析は、異常検出、トラブルシューティング、根本原因分析などの自動ログ解析タスクの前提条件である。
既存のオンライン解析アルゴリズムは、ログドリフトの影響を受けやすい。
論文 参考訳(メタデータ) (2024-08-15T17:54:31Z) - LibreLog: Accurate and Efficient Unsupervised Log Parsing Using Open-Source Large Language Models [3.7960472831772774]
本稿では,非教師なしのログ解析手法であるLibreLogを紹介する。
LogHub-2.0の評価では、LibreLogは最先端のLCMに比べて25%高い解析精度とプロセス2.7倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-08-02T21:54:13Z) - Stronger, Cheaper and Demonstration-Free Log Parsing with LLMs [18.240096266464544]
トレーニングプロセスやラベル付きデータを必要としない,費用対効果の高いLCMベースのログであるLogBatcherを提案する。
我々は16の公開ログデータセットの実験を行い、ログ解析にLogBatcherが有効であることを示した。
論文 参考訳(メタデータ) (2024-06-10T10:39:28Z) - LogFormer: A Pre-train and Tuning Pipeline for Log Anomaly Detection [73.69399219776315]
本稿では,ログ異常検出(LogFormer)のためのTransformerベースの統合フレームワークを提案する。
具体的には、ログデータの共有セマンティック知識を得るために、まず、ソースドメイン上で事前学習を行う。
そして、そのような知識を共有パラメータを介して対象領域に転送する。
論文 参考訳(メタデータ) (2024-01-09T12:55:21Z) - A Large-Scale Evaluation for Log Parsing Techniques: How Far Are We? [42.56249610409624]
実世界のソフトウェアシステムにおけるログデータの特徴をよりよく反映できる,アノテーション付きログデータセットの新たなコレクションであるLoghub-2.0を提供する。
我々は、より厳密で実践的な設定で15の最先端ログを徹底的に再評価し、特に、既存のメトリクスの非バランスなデータ分布に対する感度を緩和する新しい評価基準を導入する。
論文 参考訳(メタデータ) (2023-08-21T16:24:15Z) - Log Parsing Evaluation in the Era of Modern Software Systems [47.370291246632114]
自動ログ分析、ログ解析は、ログから洞察を導き出すための前提条件である。
本研究は,ログ解析分野の問題点,特に異種実世界のログ処理における非効率性を明らかにする。
本稿では,企業コンテキストにおけるログ解析性能を推定するツールであるLogchimeraを提案する。
論文 参考訳(メタデータ) (2023-08-17T14:19:22Z) - Prompting for Automatic Log Template Extraction [6.299547112893045]
DivLogは、大規模言語モデル(LLM)の非コンテキスト学習(ICL)能力に基づく効果的なログ解析フレームワークである。
プロンプト内の例のセマンティクスをマイニングすることで、DivLogはトレーニング不要な方法でターゲットログテンプレートを生成する。
論文 参考訳(メタデータ) (2023-07-19T12:44:59Z) - MURMUR: Modular Multi-Step Reasoning for Semi-Structured Data-to-Text
Generation [102.20036684996248]
多段階推論を用いた半構造化データからテキストを生成するための,ニューロシンボリックなモジュラーアプローチであるMURMURを提案する。
WebNLG や LogicNLG のような2つのデータ・テキスト生成タスクについて実験を行った。
論文 参考訳(メタデータ) (2022-12-16T17:36:23Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - On Automatic Parsing of Log Records [0.0]
繰り返しニューラルネットワークベースのMTモデルをトレーニングするために使用した合成Apacheログレコードを生成するツールを作成します。
実世界のログに対するモデルの評価は、モデルがApacheログフォーマットを学び、個々のログレコードを解析できることを示しています。
論文 参考訳(メタデータ) (2021-02-12T00:27:41Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。