論文の概要: Revelio: ML-Generated Debugging Queries for Distributed Systems
- arxiv url: http://arxiv.org/abs/2106.14347v1
- Date: Mon, 28 Jun 2021 00:23:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 17:45:01.976601
- Title: Revelio: ML-Generated Debugging Queries for Distributed Systems
- Title(参考訳): Revelio: 分散システム用のML生成デバッグクエリ
- Authors: Pradeep Dogga (1), Karthik Narasimhan (2), Anirudh Sivaraman (3), Shiv
Kumar Saini (4), George Varghese (1), Ravi Netravali (2) ((1) UCLA, (2)
Princeton University, (3) NYU, (4) Adobe Research, India)
- Abstract要約: Revelioはユーザレポートとシステムログを入力として、開発者がバグの根本原因を見つけるために使用できるクエリを出力する。
ディープニューラルネットワークを使用して、多様な入力ソースと潜在的クエリを高次元ベクトル空間に均一に埋め込む。
私たちは、Revelioが予想されるトップ3関連クエリの96%に最も有用なクエリが含まれていることを示しています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A major difficulty in debugging distributed systems lies in manually
determining which of the many available debugging tools to use and how to query
its logs. Our own study of a production debugging workflow confirms the
magnitude of this burden. This paper explores whether a machine-learning model
can assist developers in distributed systems debugging. We present Revelio, a
debugging assistant which takes user reports and system logs as input, and
outputs debugging queries that developers can use to find a bug's root cause.
The key challenges lie in (1) combining inputs of different types (e.g.,
natural language reports and quantitative logs) and (2) generalizing to unseen
faults. Revelio addresses these by employing deep neural networks to uniformly
embed diverse input sources and potential queries into a high-dimensional
vector space. In addition, it exploits observations from production systems to
factorize query generation into two computationally and statistically simpler
learning tasks. To evaluate Revelio, we built a testbed with multiple
distributed applications and debugging tools. By injecting faults and training
on logs and reports from 800 Mechanical Turkers, we show that Revelio includes
the most helpful query in its predicted list of top-3 relevant queries 96% of
the time. Our developer study confirms the utility of Revelio.
- Abstract(参考訳): 分散システムのデバッグにおける大きな困難は、利用可能な多くのデバッグツールのどれを使うか、ログのクエリの仕方を手動で決定することだ。
プロダクションデバッグワークフローに関する私たちの独自の研究は、この負担の大きさを確認します。
本稿では,分散システムのデバッグを支援する機械学習モデルを提案する。
ユーザのレポートとシステムログを入力として取得し,バグの根本原因を見つけるために開発者が使用可能なデバッグクエリを出力するデバッグアシスタントであるrevelioを提案する。
主な課題は、(1)異なるタイプの入力(例えば、自然言語のレポートと量的ログ)を組み合わせて、(2)見つからない障害に一般化することである。
Revelioはディープニューラルネットワークを使用して、多様な入力ソースと潜在的クエリを高次元ベクトル空間に均一に埋め込む。
さらに、プロダクションシステムからの観測を利用して、クエリ生成を2つの計算的および統計的に単純な学習タスクに分解する。
Revelioを評価するために、複数の分散アプリケーションとデバッグツールを使ったテストベッドを構築しました。
800のMechanical Turkersのログとレポートに障害を注入してトレーニングを行うことで、Revelioは予測されるトップ3関連クエリの96%に最も有用なクエリが含まれていることを示す。
私たちの開発者調査はRevelioの有用性を確認します。
関連論文リスト
- KGym: A Platform and Dataset to Benchmark Large Language Models on Linux Kernel Crash Resolution [59.20933707301566]
大規模言語モデル(LLM)は、ますます現実的なソフトウェア工学(SE)タスクにおいて一貫して改善されている。
現実世界のソフトウェアスタックでは、Linuxカーネルのような基本的なシステムソフトウェアの開発にSEの取り組みが費やされています。
このような大規模システムレベルのソフトウェアを開発する際にMLモデルが有用かどうかを評価するため、kGymとkBenchを紹介する。
論文 参考訳(メタデータ) (2024-07-02T21:44:22Z) - RAGLog: Log Anomaly Detection using Retrieval Augmented Generation [0.0]
本稿では,ベクトルデータベースを利用してログから異常を検出する検索拡張大言語モデルについて検討する。
我々の知る限り、RAGLogと呼ばれる我々の実験は、新しいもので、実験結果は、非常に有望であることを示している。
論文 参考訳(メタデータ) (2023-11-09T10:40:04Z) - Teaching Large Language Models to Self-Debug [62.424077000154945]
大規模言語モデル(LLM)は、コード生成において素晴らしいパフォーマンスを達成した。
本稿では,大規模言語モデルで予測プログラムを数発のデモでデバッグする自己デバッグを提案する。
論文 参考訳(メタデータ) (2023-04-11T10:43:43Z) - Leveraging Log Instructions in Log-based Anomaly Detection [0.5949779668853554]
本稿では,システムログからの信頼性と実用的な異常検出手法を提案する。
1000以上のGitHubプロジェクトのソースコードからログインストラクションを備えた異常検出モデルを構築することで、関連する作業の一般的な欠点を克服する。
提案手法はADLILogと呼ばれ,興味あるシステム(ターゲットシステム)からのログ命令とデータを組み合わせて,深層ニューラルネットワークモデルを学習する。
論文 参考訳(メタデータ) (2022-07-07T10:22:10Z) - DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation [61.99379022383108]
本稿では,バグトリアージ問題を解決するための新しいディープラーニングモデルを提案する。
モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいている。
ランキングの質を向上させるために,バージョン管理システムのアノテーションから追加情報を利用することを提案する。
論文 参考訳(メタデータ) (2022-01-14T00:16:57Z) - Discovering and Validating AI Errors With Crowdsourced Failure Reports [10.4818618376202]
クラウドソースの障害レポートや、モデルが失敗した理由や理由に関するエンドユーザの説明を導入し、開発者がAIエラーの検出にどのように使用できるかを示します。
また、障害レポートを合成する視覚分析システムであるDeblinderを設計、実装する。
半構造化されたインタビューと10人のAI実践者とのシンク・アラウド・スタディでは、現実の環境でのDeblinderシステムと障害報告の適用可能性について検討する。
論文 参考訳(メタデータ) (2021-09-23T23:26:59Z) - S3M: Siamese Stack (Trace) Similarity Measure [55.58269472099399]
本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。
BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。
私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
論文 参考訳(メタデータ) (2021-03-18T21:10:41Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。