Fugu-MT 論文翻訳(概要): Better Debugging: Combining Static Analysis and LLMs for Explainable Crashing Fault Localization

論文の概要: Better Debugging: Combining Static Analysis and LLMs for Explainable Crashing Fault Localization

arxiv url: http://arxiv.org/abs/2408.12070v1
Date: Thu, 22 Aug 2024 02:18:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-23 15:33:26.014557
Title: Better Debugging: Combining Static Analysis and LLMs for Explainable Crashing Fault Localization
Title（参考訳）: デバッグの改善: 説明可能なクラッシングフォールトローカライゼーションのための静的解析とLLMを組み合わせる
Authors: Jiwei Yan, Jinhao Huang, Chunrong Fang, Jun Yan, Jian Zhang,
Abstract要約: 本稿では,静的解析とLLM手法を組み合わせた説明可能なクラッシュ断層定位手法を提案する。フレームワークコードで例外をスローするステートメントのセマンティクスを理解することは、バグだらけのメソッドをアプリコードで見つけて認識するのに役立ちます。この考え方に基づいて、まず、各フレームワーク固有の例外に関連する重要な要素を記述する例外スローの要約(ETS)を設計する。そして、その重要な要素をデータ追跡して、与えられたクラッシュのバグのある候補を特定し、ソートします。
参考スコア（独自算出の注目度）: 12.103194723136406
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Nowadays, many applications do not exist independently but rely on various frameworks or libraries. The frequent evolution and the complex implementation of framework APIs induce many unexpected post-release crashes. Starting from the crash stack traces, existing approaches either perform direct call graph (CG) tracing or construct datasets with similar crash-fixing records to locate buggy methods. However, these approaches are limited by the completeness of CG or dependent on historical fixing records. Moreover, they fail to explain the buggy candidates by revealing their relationship with the crashing point. To fill the gap, we propose an explainable crashing fault localization approach by combining static analysis and LLM techniques. Our primary insight is that understanding the semantics of exception-throwing statements in the framework code can help find and apprehend the buggy methods in the app code. Based on this idea, first, we design the exception-thrown summary (ETS) that describes the key elements related to each framework-specific exception and extract ETSs by performing static analysis. Then we make data-tracking of its key elements to identify and sort buggy candidates for the given crash. After that, we introduce LLMs to improve the explainability of the localization results. To construct effective LLM prompts, we design the candidate information summary (CIS) that describes multiple types of explanation-related contexts and then extract CISs via static analysis. We apply our approach to one typical scenario, i.e., locating Android framework-specific crashing faults, and implement a tool CrashTracker. For fault localization, it exhibited an overall MRR value of 0.91 in precision. For fault explanation, compared to the naive one produced by static analysis only, the LLM-powered explanation achieved a 67.04% improvement in users' satisfaction score.
Abstract（参考訳）: 現在、多くのアプリケーションは独立して存在するのではなく、様々なフレームワークやライブラリに依存している。頻繁な進化とフレームワークAPIの複雑な実装は、リリース後の予期せぬクラッシュを引き起こします。クラッシュスタックトレースから始めると、既存のアプローチは直接コールグラフ(CG)トレースを実行するか、同様のクラッシュ修正レコードを持つデータセットを構築してバグのあるメソッドを見つける。しかし、これらのアプローチはCGの完全性によって制限されるか、または過去の固定記録に依存している。さらに、彼らは衝突点との関係を明らかにすることで、バグのある候補を説明することができませんでした。このギャップを埋めるために,静的解析とLLM技術を組み合わせた説明可能なクラッシュ断層定位手法を提案する。フレームワークコードで例外をスローするステートメントのセマンティクスを理解することは、バグだらけのメソッドをアプリコードで見つけて認識するのに役立ちます。この考え方に基づいて、まず、各フレームワーク固有の例外に関連するキー要素を記述した例外スローの要約(ETS)を設計し、静的解析を行うことでETSを抽出する。そして、その重要な要素をデータ追跡して、与えられたクラッシュのバグのある候補を特定し、ソートします。その後,LLMを導入し,ローカライズ結果の説明性を向上させる。有効なLCMプロンプトを構築するために,複数のタイプの説明関連コンテキストを記述した候補情報要約(CIS)を設計し,静的解析によりCISを抽出する。当社のアプローチは,Androidフレームワーク固有のクラッシュ障害の特定と,ツールのCrashTrackerの実装という,ひとつの典型的なシナリオに適用しています。フォールトローカライゼーションでは、MRR全体の精度は0.91であった。故障説明では, 静的解析のみによって生成された単純な説明に比べ, LLMを用いた説明は, ユーザの満足度スコアが67.04%向上した。

関連論文リスト

The Hitchhiker's Guide to Program Analysis, Part II: Deep Thoughts by LLMs [17.497629884237647]
BugLensは、静的解析の精度を大幅に改善する、ポストリファインメントフレームワークである。 0.10 (raw) と 0.50 (半自動精製) から 0.72 に精度を上げ、偽陽性を著しく減少させる。この結果から,構造化LCMベースのワークフローは静的解析ツールの有効性を有意に向上させることができることが示唆された。
論文参考訳（メタデータ） (2025-04-16T02:17:06Z)
Fault Localization via Fine-tuning Large Language Models with Mutation Generated Stack Traces [3.3158239079459655]
本稿では,スタックトレース情報のみに基づいて障害をローカライズする新たな手法を提案する。 64,369件のクラッシュの微調整によって、コードベースの4100万件の突然変異により、66.9%の精度で、クラッシュの根本原因の位置を正確に予測できる。
論文参考訳（メタデータ） (2025-01-29T21:40:32Z)
Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文参考訳（メタデータ） (2024-06-16T03:10:16Z)
Are you still on track!? Catching LLM Task Drift with Activations [55.75645403965326]
タスクドリフトは攻撃者がデータを流出させたり、LLMの出力に影響を与えたりすることを可能にする。そこで, 簡易線形分類器は, 分布外テストセット上で, ほぼ完全なLOC AUCでドリフトを検出することができることを示す。このアプローチは、プロンプトインジェクション、ジェイルブレイク、悪意のある指示など、目に見えないタスクドメインに対して驚くほどうまく一般化する。
論文参考訳（メタデータ） (2024-06-02T16:53:21Z)
Crash Report Accumulation During Continuous Fuzzing [0.0]
本稿では,CASRツールセットの一部として,クラッシュ蓄積手法を提案し,実装する。ファジィ結果から得られた事故報告に対する我々のアプローチを評価する。
論文参考訳（メタデータ） (2024-05-28T13:36:31Z)
Disperse-Then-Merge: Pushing the Limits of Instruction Tuning via Alignment Tax Reduction [75.25114727856861]
大規模言語モデル(LLM)は、スーパービジョンされた微調整プロセスの後半で劣化する傾向にある。この問題に対処するための単純な分散結合フレームワークを導入する。我々のフレームワークは、一連の標準知識と推論ベンチマークに基づいて、データキュレーションや正規化の訓練など、様々な高度な手法より優れています。
論文参考訳（メタデータ） (2024-05-22T08:18:19Z)
Fake Alignment: Are LLMs Really Aligned Well? [91.26543768665778]
本研究では,複数質問とオープンエンド質問の相違点について検討した。ジェイルブレイク攻撃パターンの研究にインスパイアされた我々は、これが不一致の一般化によって引き起こされたと論じている。
論文参考訳（メタデータ） (2023-11-10T08:01:23Z)
Better patching using LLM prompting, via Self-Consistency [5.892272127970584]
自己整合性(Self-Consistency, S-C)は、問題の説明を生成する上で、エキサイティングで極めて優れたテクニックである。本稿では,修正作業のコミットログを説明として,S-C手法のプログラム修復への応用について述べる。我々は,MODITデータセット上で,プログラムの修正を促そうとする従来のアプローチを破って,最先端の成果を得た。
論文参考訳（メタデータ） (2023-05-31T18:28:46Z)
Large-scale Crash Localization using Multi-Task Learning [3.4383679424643456]
我々は,スタックトレースにおける非難フレームを識別するための,新しいマルチタスクシーケンスラベリング手法を開発した。当社のモデルは、4つの人気のあるMicrosoftアプリケーションから100万以上の現実世界のクラッシュで評価しています。
論文参考訳（メタデータ） (2021-09-29T10:26:57Z)
S3M: Siamese Stack (Trace) Similarity Measure [55.58269472099399]
本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。 BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
論文参考訳（メタデータ） (2021-03-18T21:10:41Z)
A Fault Localization and Debugging Support Framework driven by Bug Tracking Data [0.11915976684257382]
この論文は、さまざまなソースからのデータを組み合わせることで、フォールトローカリゼーションフレームワークを提供することを目指しています。これを実現するために,バグ分類スキーマを導入し,ベンチマークを作成し,履歴データに基づく新しいフォールトローカライズ手法を提案する。
論文参考訳（メタデータ） (2021-03-03T13:23:13Z)
D2A: A Dataset Built for AI-Based Vulnerability Detection Methods Using Differential Analysis [55.15995704119158]
静的解析ツールによって報告されたラベル問題に対する差分解析に基づくアプローチであるD2Aを提案する。 D2Aを使用して大きなラベル付きデータセットを生成し、脆弱性識別のためのモデルをトレーニングします。
論文参考訳（メタデータ） (2021-02-16T07:46:53Z)
TIDE: A General Toolbox for Identifying Object Detection Errors [28.83233218686898]
本稿では、オブジェクト検出とインスタンス分割アルゴリズムにおけるエラーの原因を分析するためのフレームワークおよび関連するツールボックスであるTIDEを紹介する。我々のフレームワークはデータセットにまたがって適用でき、基盤となる予測システムに関する知識を必要とせずに、直接予測ファイルを出力することができる。
論文参考訳（メタデータ） (2020-08-18T18:30:53Z)
Tracking Road Users using Constraint Programming [79.32806233778511]
本稿では,マルチオブジェクトトラッキング(MOT)問題のトラッキング・バイ・検出パラダイムに見られるデータアソシエーションフェーズに対する制約プログラミング(CP)アプローチを提案する。提案手法は車両追跡データを用いてテストし,UA-DETRACベンチマークの上位手法よりも優れた結果を得た。
論文参考訳（メタデータ） (2020-03-10T00:04:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。