論文の概要: WELL: Applying Bug Detectors to Bug Localization via Weakly Supervised
Learning
- arxiv url: http://arxiv.org/abs/2305.17384v2
- Date: Thu, 8 Jun 2023 13:30:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 05:15:59.953722
- Title: WELL: Applying Bug Detectors to Bug Localization via Weakly Supervised
Learning
- Title(参考訳): WELL: 弱監視学習によるバグ検出をバグローカライゼーションに適用
- Authors: Zhuo Li, Huangzhao Zhang, Zhi Jin, Ge Li
- Abstract要約: 本稿では,バグローカライゼーションモデルをトレーニングするためのWEakly supervised bug LocaLization (WELL) 手法を提案する。
CodeBERTはバギーまたはノーのバイナリラベル付きデータに基づいて微調整されるため、WELLはバグのローカライゼーションを弱教師付きで解決することができる。
- 参考スコア(独自算出の注目度): 37.09621161662761
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bug localization, which is used to help programmers identify the location of
bugs in source code, is an essential task in software development. Researchers
have already made efforts to harness the powerful deep learning (DL) techniques
to automate it. However, training bug localization model is usually challenging
because it requires a large quantity of data labeled with the bug's exact
location, which is difficult and time-consuming to collect. By contrast,
obtaining bug detection data with binary labels of whether there is a bug in
the source code is much simpler. This paper proposes a WEakly supervised bug
LocaLization (WELL) method, which only uses the bug detection data with binary
labels to train a bug localization model. With CodeBERT finetuned on the
buggy-or-not binary labeled data, WELL can address bug localization in a weakly
supervised manner. The evaluations on three method-level synthetic datasets and
one file-level real-world dataset show that WELL is significantly better than
the existing SOTA model in typical bug localization tasks such as variable
misuse and other programming bugs.
- Abstract(参考訳): バグローカライゼーション(バグローカライゼーション)は、プログラマがソースコード中のバグの位置を特定するのに役立つもので、ソフトウェア開発において必須のタスクである。
研究者はすでに、強力なディープラーニング(DL)技術を活用して自動化している。
しかしながら、バグローカライズモデルのトレーニングは通常、バグの正確な位置をラベル付けする大量のデータを必要とするため、収集が難しく、時間がかかるため、困難である。
対照的に、ソースコードにバグがあるかどうかのバイナリラベルでバグ検出データを取得するのは、ずっと簡単です。
本稿では,バグ検出データとバイナリラベルのみを用いて,バグローカライゼーションモデルをトレーニングするWEakly supervised bug LocaLization (WELL)法を提案する。
CodeBERTはバギーまたはノーのバイナリラベル付きデータに基づいて微調整されるため、WELLはバグのローカライゼーションを弱い管理方法で解決することができる。
3つのメソッドレベルの合成データセットと1つのファイルレベルの実世界のデータセットに対する評価は、変数誤用や他のプログラミングバグなどの典型的なバグローカライゼーションタスクにおいて、WELLが既存のSOTAモデルよりもはるかに優れていることを示している。
関連論文リスト
- DebugBench: Evaluating Debugging Capability of Large Language Models [80.73121177868357]
DebugBench - LLM(Large Language Models)のベンチマーク。
C++、Java、Pythonの4つの主要なバグカテゴリと18のマイナータイプをカバーする。
ゼロショットシナリオで2つの商用および4つのオープンソースモデルを評価する。
論文 参考訳(メタデータ) (2024-01-09T15:46:38Z) - Language Models are Better Bug Detector Through Code-Pair Classification [0.26107298043931204]
本稿では,バグギー版とバグギー版の両方をモデルに付与するコードペア分類タスクを提案し,バグギー版とバグギー版を識別する。
実験によると、LLMはバグのないバージョンのコードからバグを拾うことができ、コードペアの分類タスクはスニペットを与え、バグが存在するかどうかを判断するよりもずっと簡単である。
論文 参考訳(メタデータ) (2023-11-14T07:20:57Z) - Automated Bug Generation in the era of Large Language Models [6.0770779409377775]
BugFarmは任意のコードを複数の複雑なバグに変換する。
BUGFARMが生成した1.9万以上の変異株から435k以上のバグを総合的に評価する。
論文 参考訳(メタデータ) (2023-10-03T20:01:51Z) - PreciseBugCollector: Extensible, Executable and Precise Bug-fix
Collection [8.79879909193717]
正確な多言語バグ収集手法であるPreciseBugCollectorを紹介する。
外部バグリポジトリでリポジトリをマップしてバグタイプ情報をトレースするバグトラッカと、プロジェクト固有のバグを生成するバグインジェクタの2つの新しいコンポーネントに基づいている。
現在、PreciseBugCollectorは2968のオープンソースプロジェクトから抽出された1057818のバグを含んでいる。
論文 参考訳(メタデータ) (2023-09-12T13:47:44Z) - Too Few Bug Reports? Exploring Data Augmentation for Improved
Changeset-based Bug Localization [7.884766610628946]
本稿では,バグレポートの異なる構成要素に作用する新しいデータ拡張演算子を提案する。
また、拡張バグレポートのコーパス作成を目的としたデータバランス戦略についても述べる。
論文 参考訳(メタデータ) (2023-05-25T19:06:01Z) - Teaching Large Language Models to Self-Debug [62.424077000154945]
大規模言語モデル(LLM)は、コード生成において素晴らしいパフォーマンスを達成した。
本稿では,大規模言語モデルで予測プログラムを数発のデモでデバッグする自己デバッグを提案する。
論文 参考訳(メタデータ) (2023-04-11T10:43:43Z) - Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。
このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文 参考訳(メタデータ) (2022-11-11T16:37:33Z) - BigIssue: A Realistic Bug Localization Benchmark [89.8240118116093]
BigIssueは、現実的なバグローカライゼーションのためのベンチマークである。
実際のJavaバグと合成Javaバグの多様性を備えた一般的なベンチマークを提供する。
われわれは,バグローカライゼーションの最先端技術として,APRの性能向上と,現代の開発サイクルへの適用性の向上を期待している。
論文 参考訳(メタデータ) (2022-07-21T20:17:53Z) - On Distribution Shift in Learning-based Bug Detectors [4.511923587827301]
まず、モデルをバグ検出領域に適応させるため、次に実際のバグ検出領域に適応させるために、モデルを実際の配布に向けて駆動するために、バグ検出装置を2つのフェーズで訓練する。
我々は,本手法を広範に研究した3種類のバグタイプに対して評価し,実際のバグ分布を捉えるために慎重に設計された新しいデータセットを構築した。
論文 参考訳(メタデータ) (2022-04-21T12:17:22Z) - DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation [61.99379022383108]
本稿では,バグトリアージ問題を解決するための新しいディープラーニングモデルを提案する。
モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいている。
ランキングの質を向上させるために,バージョン管理システムのアノテーションから追加情報を利用することを提案する。
論文 参考訳(メタデータ) (2022-01-14T00:16:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。