論文の概要: Detecting the Root Cause Code Lines in Bug-Fixing Commits by Heterogeneous Graph Learning
- arxiv url: http://arxiv.org/abs/2505.01022v3
- Date: Tue, 13 May 2025 10:46:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-14 12:30:10.396508
- Title: Detecting the Root Cause Code Lines in Bug-Fixing Commits by Heterogeneous Graph Learning
- Title(参考訳): 不均一グラフ学習によるバグフィクス通信におけるルート原因コード線の検出
- Authors: Liguo Ji, Chenchen Li, Shenglin Wang, Furui Zhan,
- Abstract要約: 自動欠陥予測ツールは、ソフトウェアプロジェクト内の欠陥に起因するソフトウェア変更を積極的に識別することができる。
異質で複雑なソフトウェアプロジェクトにおける既存の作業は、異質なコミット構造に苦労したり、コード変更におけるクロスライン依存関係を無視したりといった課題に直面し続けている。
本稿では,バグフィックスグラフ構築コンポーネント,コードセマンティックアグリゲーションコンポーネント,クロスラインセマンティック保持コンポーネントの3つの主要コンポーネントからなるRC_Detectorというアプローチを提案する。
- 参考スコア(独自算出の注目度): 1.5213722322518697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the continuous growth in the scale and complexity of software systems, defect remediation has become increasingly difficult and costly. Automated defect prediction tools can proactively identify software changes prone to defects within software projects, thereby enhancing software development efficiency. However, existing work in heterogeneous and complex software projects continues to face challenges, such as struggling with heterogeneous commit structures and ignoring cross-line dependencies in code changes, which ultimately reduce the accuracy of defect identification. To address these challenges, we propose an approach called RC_Detector. RC_Detector comprises three main components: the bug-fixing graph construction component, the code semantic aggregation component, and the cross-line semantic retention component. The bug-fixing graph construction component identifies the code syntax structures and program dependencies within bug-fixing commits and transforms them into heterogeneous graph formats by converting the source code into vector representations. The code semantic aggregation component adapts to heterogeneous data by using heterogeneous attention to learn the hidden semantic representation of target code lines. The cross-line semantic retention component regulates propagated semantic information by using attenuation and reinforcement gates derived from old and new code semantic representations, effectively preserving cross-line semantic relationships. Extensive experiments were conducted to evaluate the performance of our model by collecting data from 87 open-source projects, including 675 bug-fixing commits. The experimental results demonstrate that our model outperforms state-of-the-art approaches, achieving significant improvements of 83.15%,96.83%,78.71%,74.15%,54.14%,91.66%,91.66%, and 34.82% in MFR, respectively, compared with the state-of-the-art approaches.
- Abstract(参考訳): ソフトウェアシステムのスケールの継続的な成長と複雑さにより、欠陥修復はますます困難でコストがかかるものになっています。
自動欠陥予測ツールは、ソフトウェアプロジェクトの欠陥によって引き起こされるソフトウェア変更を積極的に識別し、それによってソフトウェア開発の効率が向上する。
しかし、不均一で複雑なソフトウェアプロジェクトにおける既存の作業は、不均一なコミット構造に苦労したり、コード変更におけるクロスライン依存関係を無視したり、最終的には欠陥識別の精度を低下させたりといった課題に直面し続けている。
これらの課題に対処するために、RC_Detectorと呼ばれるアプローチを提案する。
RC_Detectorは、バグフィックスグラフ構築コンポーネント、コードセマンティックアグリゲーションコンポーネント、およびクロスラインセマンティック保持コンポーネントの3つの主要コンポーネントから構成されている。
バグフィックスグラフ構築コンポーネントは、バグフィックスコミット内のコード構文構造とプログラム依存性を特定し、ソースコードをベクトル表現に変換することで、それらを異種グラフフォーマットに変換する。
コードセマンティックアグリゲーションコンポーネントは、異種注意を用いて異種データに適応し、ターゲットコード行の隠されたセマンティック表現を学習する。
クロスラインセマンティック保持コンポーネントは、古いコードセマンティック表現から派生した減衰と補強ゲートを用いて、伝播セマンティック情報を規制し、効果的にクロスラインセマンティック関係を保存する。
675件のバグ修正コミットを含む87のオープンソースプロジェクトのデータを収集し,本モデルの性能評価を行った。
実験結果から,本モデルは最先端手法よりも83.15%,96.83%,78.71%,74.15%,54.14%,91.66%,91.66%,34.82%の大幅な改善が得られた。
関連論文リスト
- Identifying Root Cause of bugs by Capturing Changed Code Lines with Relational Graph Neural Networks [7.676213873923721]
本稿では,変化したコード行中のルート原因削除線を検出するRC検出法を提案する。
RC検出は、変更されたコード行中のルート原因の削除線を検出し、バグ修正コミットで導入されたバグの根本原因を特定するために使用される。
実験の結果,最も先進的な根本原因検出法と比較して,RC-detectionはRecall@1,Recall@2,Recall@3,MFRをそれぞれ4.107%,5.113%,4.289%,24.536%改善した。
論文 参考訳(メタデータ) (2025-05-02T04:29:09Z) - A Label-Free Heterophily-Guided Approach for Unsupervised Graph Fraud Detection [60.09453163562244]
本稿では,非教師付きGFDのための非教師付きグラフ不正検出手法(HUGE)を提案する。
推定モジュールでは、GFD の臨界グラフ特性をキャプチャする HALO と呼ばれる新しいラベルフリーなヘテロフィリー計量を設計する。
アライメントに基づく不正検出モジュールにおいて、ランキング損失と非対称アライメント損失を有する合同GNNアーキテクチャを開発する。
論文 参考訳(メタデータ) (2025-02-18T22:07:36Z) - An Empirical Study on the Impact of Code Duplication-aware Refactoring Practices on Quality Metrics [5.516979718589074]
128のオープンソースJavaプロジェクトから、日々の変更で開発者が適用し、ドキュメント化した332のコミットのコーパスを抽出します。
我々は、これらの操作が共通の最先端の設計品質指標に与える影響を実証的に分析する。
論文 参考訳(メタデータ) (2025-02-06T13:34:25Z) - A Combined Feature Embedding Tools for Multi-Class Software Defect and Identification [2.2020053359163305]
本稿では,GraphCodeBERTとGraph Convolutional Networkを組み合わせた実験手法であるCodeGraphNetを提案する。
この方法は、機能間の複雑な関係をキャプチャし、より正確な脆弱性の識別と分離を可能にする。
決定木とニューラルネットワークのハイブリッドであるDeepTreeモデルは、最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2024-11-26T17:33:02Z) - Hybrid-Segmentor: A Hybrid Approach to Automated Fine-Grained Crack Segmentation in Civil Infrastructure [52.2025114590481]
エンコーダ・デコーダをベースとした手法であるHybrid-Segmentorを導入する。
これにより、モデルは、様々な種類の形状、表面、き裂の大きさを区別する一般化能力を向上させることができる。
提案モデルは,5つの測定基準(精度0.971,精度0.804,リコール0.744,F1スコア0.770,IoUスコア0.630)で既存ベンチマークモデルより優れ,最先端の状態を達成している。
論文 参考訳(メタデータ) (2024-09-04T16:47:16Z) - An Unbiased Transformer Source Code Learning with Semantic Vulnerability
Graph [3.3598755777055374]
現在の脆弱性スクリーニング技術は、新しい脆弱性を特定したり、開発者がコード脆弱性と分類を提供するのに効果がない。
これらの問題に対処するために,変換器 "RoBERTa" とグラフ畳み込みニューラルネットワーク (GCN) を組み合わせたマルチタスク・アンバイアス脆弱性分類器を提案する。
本稿では、逐次フロー、制御フロー、データフローからエッジを統合することで生成されたソースコードからのセマンティック脆弱性グラフ(SVG)表現と、Poacher Flow(PF)と呼ばれる新しいフローを利用したトレーニングプロセスを提案する。
論文 参考訳(メタデータ) (2023-04-17T20:54:14Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。