論文の概要: Lost in Translation? Converting RegExes for Log Parsing into Dynatrace Pattern Language
- arxiv url: http://arxiv.org/abs/2506.19539v1
- Date: Tue, 24 Jun 2025 11:49:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-25 19:48:23.612251
- Title: Lost in Translation? Converting RegExes for Log Parsing into Dynatrace Pattern Language
- Title(参考訳): 翻訳における損失 : ログ解析のためのRegExesをDynatraceパターン言語に変換する
- Authors: Julian Fragner, Christian Macho, Bernhard Dieber, Martin Pinzger,
- Abstract要約: Reptileは、RegExesをDPLパターンに変換するためのルールベースのアプローチと、完全な変換が不可能な場合のベストプラクティスを組み合わせたものだ。
大企業から収集したRegExes 946の評価は、Reptileが73.7%を安全に変換したことを示している。
- 参考スコア(独自算出の注目度): 0.312488427986006
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Log files provide valuable information for detecting and diagnosing problems in enterprise software applications and data centers. Several log analytics tools and platforms were developed to help filter and extract information from logs, typically using regular expressions (RegExes). Recent commercial log analytics platforms provide domain-specific languages specifically designed for log parsing, such as Grok or the Dynatrace Pattern Language (DPL). However, users who want to migrate to these platforms must manually convert their RegExes into the new pattern language, which is costly and error-prone. In this work, we present Reptile, which combines a rule-based approach for converting RegExes into DPL patterns with a best-effort approach for cases where a full conversion is impossible. Furthermore, it integrates GPT-4 to optimize the obtained DPL patterns. The evaluation with 946 RegExes collected from a large company shows that Reptile safely converted 73.7% of them. The evaluation of Reptile's pattern optimization with 23 real-world RegExes showed an F1-score and MCC above 0.91. These results are promising and have ample practical implications for companies that migrate to a modern log analytics platform, such as Dynatrace.
- Abstract(参考訳): ログファイルは、エンタープライズソフトウェアアプリケーションやデータセンターの問題を検出し診断するための貴重な情報を提供する。
いくつかのログ分析ツールとプラットフォームが開発され、通常正規表現(RegExes)を使用してログから情報をフィルタリングし抽出するのに役立つ。
最近の商用ログ分析プラットフォームは、GrokやDynatrace Pattern Language(DPL)など、ログ解析用に特別に設計されたドメイン固有言語を提供する。
しかし、これらのプラットフォームに移行したいユーザは、手動でRegExesを新しいパターン言語に変換する必要がある。
本稿では,RegExesをDPLパターンに変換するルールベースのアプローチと,完全変換が不可能な場合のベストプラクティスを組み合わせたReptileを提案する。
さらに、GPT-4を統合して得られたDPLパターンを最適化する。
大企業から収集したRegExes 946の評価は、Reptileが73.7%を安全に変換したことを示している。
23個の実世界のRegExを用いたReptileのパターン最適化の評価では、F1スコアとMCCが0.91以上であった。
これらの結果は有望であり、Dynatraceのような現代的なログ分析プラットフォームに移行する企業にとって大きな意味を持つ。
関連論文リスト
- A Word is Worth 4-bit: Efficient Log Parsing with Binary Coded Decimal Recognition [0.0]
本稿では,文字埋め込みを集約するニューラルアーキテクチャを用いた文字レベルログを提案する。
提案手法は,高粒度なログテンプレート抽出を実現するために,バイナリコード付き十進数列を推定する。
論文 参考訳(メタデータ) (2025-06-01T20:00:00Z) - Data is all you need: Finetuning LLMs for Chip Design via an Automated design-data augmentation framework [50.02710905062184]
本稿では,Verilog と EDA スクリプトに適合する高ボリュームかつ高品質な自然言語を生成する自動設計データ拡張フレームワークを提案する。
Verilog生成の精度は現在の最先端のオープンソースVerilog生成モデルを超え、同じベンチマークで58.8%から70.6%に増加した。
論文 参考訳(メタデータ) (2024-03-17T13:01:03Z) - A Novel Approach for Automatic Program Repair using Round-Trip
Translation with Large Language Models [50.86686630756207]
研究によると、ある文の文法的誤りは、それを他の言語に翻訳し、その語を返せば修正できる。
現在の自動プログラム修復(APR)生成モデルは、ソースコードで事前訓練され、修正のために微調整されている。
本稿では,あるプログラミング言語から別のプログラミング言語,あるいは自然言語へのコード変換,そして,その逆といった,微調整ステップをバイパスし,ラウンド・トリップ変換(RTT)を用いる手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T22:36:31Z) - Paloma: A Benchmark for Evaluating Language Model Fit [112.481957296585]
言語モデル (LM) の評価では、トレーニングから切り離されたモノリシックなデータに難易度が報告されるのが一般的である。
Paloma(Perplexity Analysis for Language Model Assessment)は、546の英語およびコードドメインに適合するLMを測定するベンチマークである。
論文 参考訳(メタデータ) (2023-12-16T19:12:45Z) - Prompting for Automatic Log Template Extraction [6.299547112893045]
DivLogは、大規模言語モデル(LLM)の非コンテキスト学習(ICL)能力に基づく効果的なログ解析フレームワークである。
プロンプト内の例のセマンティクスをマイニングすることで、DivLogはトレーニング不要な方法でターゲットログテンプレートを生成する。
論文 参考訳(メタデータ) (2023-07-19T12:44:59Z) - Log Parsing: How Far Can ChatGPT Go? [15.568467566404529]
本稿では,ChatGPTが2つの研究課題に対処してログ解析を行う能力を評価する。
以上の結果から,ChatGPTは適切なプロンプトでログ解析を行う上で有望な結果が得られることがわかった。
本稿では,ChatGPTに基づくログ解析の課題と可能性について概説する。
論文 参考訳(メタデータ) (2023-06-02T14:58:43Z) - Zero-Shot Cross-lingual Semantic Parsing [56.95036511882921]
7つのテスト言語に対する並列データを持たないゼロショット問題として,言語間セマンティックパーシングについて検討した。
英文論理形式ペアデータのみを用いて解析知識を付加言語に転送するマルチタスクエンコーダデコーダモデルを提案する。
このシステムは、ゼロショット解析を潜時空間アライメント問題としてフレーム化し、事前訓練されたモデルを改善し、最小のクロスリンガル転送ペナルティで論理形式を生成することができる。
論文 参考訳(メタデータ) (2021-04-15T16:08:43Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。