論文の概要: Predicting Line-Level Defects by Capturing Code Contexts with
Hierarchical Transformers
- arxiv url: http://arxiv.org/abs/2312.11889v1
- Date: Tue, 19 Dec 2023 06:25:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 16:49:13.376138
- Title: Predicting Line-Level Defects by Capturing Code Contexts with
Hierarchical Transformers
- Title(参考訳): 階層変換器によるコードコンテキストのキャプチャによるラインレベル欠陥の予測
- Authors: Parvez Mahbub and Mohammad Masudur Rahman
- Abstract要約: Bugsplorerは、ラインレベルの欠陥予測のための新しいディープラーニング技術である。
上位1~3%の疑わしい線のうち、最初の20%の欠陥線をランク付けできる。
欠陥ラインのランクを高くすることで、SQAコストを大幅に削減する可能性がある。
- 参考スコア(独自算出の注目度): 4.73194777046253
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Software defects consume 40% of the total budget in software development and
cost the global economy billions of dollars every year. Unfortunately, despite
the use of many software quality assurance (SQA) practices in software
development (e.g., code review, continuous integration), defects may still
exist in the official release of a software product. Therefore, prioritizing
SQA efforts for the vulnerable areas of the codebase is essential to ensure the
high quality of a software release. Predicting software defects at the line
level could help prioritize the SQA effort but is a highly challenging task
given that only ~3% of lines of a codebase could be defective. Existing works
on line-level defect prediction often fall short and cannot fully leverage the
line-level defect information. In this paper, we propose Bugsplorer, a novel
deep-learning technique for line-level defect prediction. It leverages a
hierarchical structure of transformer models to represent two types of code
elements: code tokens and code lines. Unlike the existing techniques that are
optimized for file-level defect prediction, Bugsplorer is optimized for a
line-level defect prediction objective. Our evaluation with five performance
metrics shows that Bugsplorer has a promising capability of predicting
defective lines with 26-72% better accuracy than that of the state-of-the-art
technique. It can rank the first 20% defective lines within the top 1-3%
suspicious lines. Thus, Bugsplorer has the potential to significantly reduce
SQA costs by ranking defective lines higher.
- Abstract(参考訳): ソフトウェア欠陥はソフトウェア開発の総予算の40%を消費し、毎年数十億ドルを世界経済に費やしている。
残念なことに、多くのソフトウェア品質保証(SQA)プラクティスがソフトウェア開発(例えば、コードレビュー、継続的インテグレーション)で使用されているにもかかわらず、ソフトウェア製品の公式リリースにはまだ欠陥が存在する可能性がある。
したがって、コードベースの脆弱な領域に対するSQAの取り組みの優先順位付けは、ソフトウェアリリースの高品質を保証するために不可欠である。
ソフトウェア欠陥をラインレベルで予測することは、SQAの作業の優先順位付けに役立ちますが、コードベースの3%程度しか欠陥がないため、非常に難しい作業です。
ラインレベルの欠陥予測に関する既存の作業は、しばしば不足し、ラインレベルの欠陥情報を完全に活用できない。
本稿では,ラインレベルの欠陥予測のための新しいディープラーニング手法であるbugsplorerを提案する。
トランスフォーマーモデルの階層構造を利用して、コードトークンとコードラインの2つのタイプのコード要素を表現する。
ファイルレベルの欠陥予測に最適化された既存の技術とは異なり、bugsplorerはラインレベルの欠陥予測目的に最適化されている。
5つのパフォーマンス指標による評価から,bugsplorerは最先端技術よりも26~72%高い精度で欠陥ラインを予測できる有望な性能を示している。
上位1~3%の疑わしい線のうち、最初の20%の欠陥線をランク付けできる。
したがって、Bugsplorerは欠陥線を高くランク付けすることでSQAコストを大幅に削減する可能性がある。
関連論文リスト
- Code Revert Prediction with Graph Neural Networks: A Case Study at J.P. Morgan Chase [10.961209762486684]
コードリバース予測は、コード変更がソフトウェア開発で逆転またはロールバックされる可能性を予測または予測することを目的としている。
コード欠陥検出の以前の方法は、独立した機能に依存していたが、コードスクリプト間の関係を無視していた。
本稿では,コードインポートグラフとコード特徴を統合した,コード逆転予測のための系統的研究について述べる。
論文 参考訳(メタデータ) (2024-03-14T15:54:29Z) - BAFLineDP: Code Bilinear Attention Fusion Framework for Line-Level
Defect Prediction [0.0]
本稿では,BAFLineDP(Code Bilinear attention fusion framework)に基づくラインレベルの欠陥予測手法を提案する。
以上の結果から,BAFLineDPは現在のファイルレベルおよびラインレベルの欠陥予測手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-02-11T09:01:42Z) - RAP-Gen: Retrieval-Augmented Patch Generation with CodeT5 for Automatic
Program Repair [75.40584530380589]
新たな検索型パッチ生成フレームワーク(RAP-Gen)を提案する。
RAP-Gen 以前のバグ修正ペアのリストから取得した関連する修正パターンを明示的に活用する。
RAP-GenをJavaScriptのTFixベンチマークとJavaのCode RefinementとDefects4Jベンチマークの2つのプログラミング言語で評価する。
論文 参考訳(メタデータ) (2023-09-12T08:52:56Z) - PrAIoritize: Automated Early Prediction and Prioritization of Vulnerabilities in Smart Contracts [1.081463830315253]
スマートコントラクトは、未公表の脆弱性とコードの弱点のために、数多くのセキュリティ脅威を引き起こす。
スマートコントラクトのセキュリティには、効率的な優先順位付けが不可欠です。
我々の研究は、重要なコードの弱点を優先順位付けし予測するための自動アプローチPrAIoritizeを提供することを目的としています。
論文 参考訳(メタデータ) (2023-08-21T23:30:39Z) - Bridging Precision and Confidence: A Train-Time Loss for Calibrating
Object Detection [58.789823426981044]
本稿では,境界ボックスのクラス信頼度を予測精度に合わせることを目的とした,新たな補助損失定式化を提案する。
その結果,列車の走行時間損失はキャリブレーション基準を超過し,キャリブレーション誤差を低減させることがわかった。
論文 参考訳(メタデータ) (2023-03-25T08:56:21Z) - Generation Probabilities Are Not Enough: Uncertainty Highlighting in AI Code Completions [54.55334589363247]
本研究では,不確実性に関する情報を伝達することで,プログラマがより迅速かつ正確にコードを生成することができるかどうかを検討する。
トークンのハイライトは、編集される可能性が最も高いので、タスクの完了が早くなり、よりターゲットを絞った編集が可能になることがわかりました。
論文 参考訳(メタデータ) (2023-02-14T18:43:34Z) - Fault-Aware Neural Code Rankers [64.41888054066861]
サンプルプログラムの正しさを予測できる故障認識型ニューラルネットワークローダを提案する。
我々のフォールト・アウェア・ローダは、様々なコード生成モデルのpass@1精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-06-04T22:01:05Z) - A Universal Error Measure for Input Predictions Applied to Online Graph
Problems [57.58926849872494]
本稿では,入力予測における誤差の定量化のための新しい尺度を提案する。
この尺度は、予測されていない要求と予測されていない実際の要求によるエラーをキャプチャする。
論文 参考訳(メタデータ) (2022-05-25T15:24:03Z) - HEDP: A Method for Early Forecasting Software Defects based on Human
Error Mechanisms [1.0660480034605238]
ソフトウェア欠陥の背後にある主なプロセスは、エラーを起こしやすいシナリオがヒューマンエラーモードを引き起こすことである。
提案されたアイデアは、潜在的な欠陥の正確な位置と形を予測することを強調する。
論文 参考訳(メタデータ) (2021-10-13T14:44:23Z) - Measuring Coding Challenge Competence With APPS [54.22600767666257]
コード生成のベンチマークであるAPPSを紹介する。
私たちのベンチマークには1万の問題が含まれています。
GPT-Neoのような最近のモデルでは、導入問題のテストケースの約15%をパスできる。
論文 参考訳(メタデータ) (2021-05-20T17:58:42Z) - Machine Learning Techniques for Software Quality Assurance: A Survey [5.33024001730262]
我々は,障害予測とテストケース優先順位付けの両方における様々なアプローチについて考察する。
近年,障害予測のためのディープラーニングアルゴリズムは,プログラムのセマンティクスと障害予測機能とのギャップを埋めるのに役立つ。
論文 参考訳(メタデータ) (2021-04-29T00:37:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。