論文の概要: DeMuVGN: Effective Software Defect Prediction Model by Learning Multi-view Software Dependency via Graph Neural Networks
- arxiv url: http://arxiv.org/abs/2410.19550v1
- Date: Fri, 25 Oct 2024 13:24:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-28 13:38:06.902414
- Title: DeMuVGN: Effective Software Defect Prediction Model by Learning Multi-view Software Dependency via Graph Neural Networks
- Title(参考訳): DeMuVGN: グラフニューラルネットワークによる多視点ソフトウェア依存学習による効果的なソフトウェア欠陥予測モデル
- Authors: Yu Qiao, Lina Gong, Yu Zhao, Yongwei Wang, Mingqiang Wei,
- Abstract要約: DeMuVGNは、グラフニューラルネットワークを介してマルチビューソフトウェア依存を学習する欠陥予測モデルである。
データ、呼び出し、開発者の依存関係を統合するマルチビューソフトウェア依存性グラフを導入します。
20バージョンにわたる8つのオープンソースプロジェクトのケーススタディでは、DeMuVGNが大幅に改善されている。
- 参考スコア(独自算出の注目度): 37.928355252723996
- License:
- Abstract: Software defect prediction (SDP) aims to identify high-risk defect modules in software development, optimizing resource allocation. While previous studies show that dependency network metrics improve defect prediction, most methods focus on code-based dependency graphs, overlooking developer factors. Current metrics, based on handcrafted features like ego and global network metrics, fail to fully capture defect-related information. To address this, we propose DeMuVGN, a defect prediction model that learns multi-view software dependency via graph neural networks. We introduce a Multi-view Software Dependency Graph (MSDG) that integrates data, call, and developer dependencies. DeMuVGN also leverages the Synthetic Minority Oversampling Technique (SMOTE) to address class imbalance and enhance defect module identification. In a case study of eight open-source projects across 20 versions, DeMuVGN demonstrates significant improvements: i) models based on multi-view graphs improve F1 scores by 11.1% to 12.1% over single-view models; ii) DeMuVGN improves F1 scores by 17.4% to 45.8% in within-project contexts and by 17.9% to 41.0% in cross-project contexts. Additionally, DeMuVGN excels in software evolution, showing more improvement in later-stage software versions. Its strong performance across different projects highlights its generalizability. We recommend future research focus on multi-view dependency graphs for defect prediction in both mature and newly developed projects.
- Abstract(参考訳): ソフトウェア欠陥予測(SDP)は、ソフトウェア開発におけるリスクの高い欠陥モジュールを特定し、リソース割り当てを最適化することを目的としている。
以前の研究では、依存関係ネットワークのメトリクスが欠陥予測を改善することが示されていたが、ほとんどのメソッドはコードベースの依存性グラフに焦点を当てており、開発者の要因を見下ろしている。
現在のメトリクスは、egoやグローバルネットワークメトリクスといった手作りの機能に基づいており、欠陥関連情報をフルにキャプチャすることができない。
そこで本稿では,グラフニューラルネットワークを用いてマルチビューソフトウェア依存性を学習する欠陥予測モデルであるDeMuVGNを提案する。
データ、呼び出し、開発者の依存関係を統合するマルチビューソフトウェア依存性グラフ(MSDG)を導入します。
DeMuVGNはまた、SMOTE(Synthetic Minority Oversampling Technique)を利用してクラス不均衡に対処し、欠陥モジュールの識別を強化する。
20バージョンにわたる8つのオープンソースプロジェクトのケーススタディでは、DeMuVGNが大幅に改善されている。
i) マルチビューグラフに基づくモデルは、単一ビューモデルよりもF1スコアを11.1%から12.1%改善する。
ii)DeMuVGNはプロジェクト内コンテキストにおいてF1スコアを17.4%から45.8%改善し、クロスプロジェクトコンテキストでは17.9%から41.0%改善する。
さらに、DeMuVGNはソフトウェアの進化に優れており、後期のソフトウェアバージョンでは改善されている。
異なるプロジェクト間での強力なパフォーマンスは、その一般化性を強調している。
我々は、成熟したプロジェクトと新しく開発されたプロジェクトの両方において、欠陥予測のためのマルチビュー依存グラフに重点を置くことを推奨する。
関連論文リスト
- Lingma SWE-GPT: An Open Development-Process-Centric Language Model for Automated Software Improvement [62.94719119451089]
Lingma SWE-GPTシリーズは、現実世界のコード提出活動から学び、シミュレーションする。
Lingma SWE-GPT 72BはGitHubの30.20%の問題を解決する。
論文 参考訳(メタデータ) (2024-11-01T14:27:16Z) - Imbalanced Graph-Level Anomaly Detection via Counterfactual Augmentation and Feature Learning [1.3756846638796]
本稿では,非バランスなGLAD手法を提案する。
我々は、このモデルを脳疾患データセットに適用し、我々の研究の能力を証明することができる。
論文 参考訳(メタデータ) (2024-07-13T13:40:06Z) - Opinion-Unaware Blind Image Quality Assessment using Multi-Scale Deep Feature Statistics [54.08757792080732]
我々は,事前学習された視覚モデルからの深い特徴を統計的解析モデルと統合して,意見認識のないBIQA(OU-BIQA)を実現することを提案する。
提案モデルは,最先端のBIQAモデルと比較して,人間の視覚的知覚との整合性に優れる。
論文 参考訳(メタデータ) (2024-05-29T06:09:34Z) - Deep Incremental Learning of Imbalanced Data for Just-In-Time Software
Defect Prediction [3.2022080692044352]
この研究は、Just-In-Time Software Defect Prediction (JIT-SDP)モデルに関する3つの観測から生まれた。
まず,JIT-SDP問題を分類問題として扱う。
第二に、JIT-SDP 以前の研究では、クラスバランス処理がソフトウェア変更セットデータの基盤となる特性を変えるとは考えていない。
論文 参考訳(メタデータ) (2023-10-18T19:42:34Z) - Learning Strong Graph Neural Networks with Weak Information [64.64996100343602]
我々は、弱い情報(GLWI)を用いたグラフ学習問題に対する原則的アプローチを開発する。
非完全構造を持つ入力グラフ上で長距離情報伝搬を行うデュアルチャネルGNNフレームワークであるD$2$PTを提案するが、グローバルな意味的類似性を符号化するグローバルグラフも提案する。
論文 参考訳(メタデータ) (2023-05-29T04:51:09Z) - Graph-Based Machine Learning Improves Just-in-Time Defect Prediction [0.38073142980732994]
グラフベースの機械学習を使用して、Just-In-Time(JIT)の欠陥予測を改善します。
私たちの最高のモデルでは、コード変更がF1スコアが最大77.55%の欠陥につながるかどうかを予測できます。
これは、最先端のJIT欠陥予測よりも152%高いF1スコアと3%高いMCCを示している。
論文 参考訳(メタデータ) (2021-10-11T16:00:02Z) - Predicting the Number of Reported Bugs in a Software Repository [0.0]
本研究では,Long Short Term Memory Neural Networks (LSTM), Auto-Regressive Integrated moving average (ARIMA), Random Forest Regressorの8種類の時系列予測モデルについて検討した。
異なる性能指標に基づいて、各モデルの長期予測の品質を分析します。
評価は、大規模なオープンソースソフトウェアアプリケーションであるMozilla上で行われる。
論文 参考訳(メタデータ) (2021-04-24T19:06:35Z) - Model-Agnostic Graph Regularization for Few-Shot Learning [60.64531995451357]
グラフ組み込み数ショット学習に関する包括的な研究を紹介します。
本稿では,ラベル間のグラフ情報の組み込みによる影響をより深く理解できるグラフ正規化手法を提案する。
提案手法は,Mini-ImageNetで最大2%,ImageNet-FSで6.7%の性能向上を実現する。
論文 参考訳(メタデータ) (2021-02-14T05:28:13Z) - Software Defect Prediction Based On Deep Learning Models: Performance
Study [0.5735035463793008]
Stack Sparse Auto-Encoder(SSAE)とDeep Belief Network(DBN)の2つのディープラーニングモデルがデプロイされ、NASAデータセットを分類する。
実験の結果,十分なサンプルが得られたデータセットの精度が向上した。
論文 参考訳(メタデータ) (2020-04-02T06:02:14Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。