論文の概要: Cross Version Defect Prediction with Class Dependency Embeddings
- arxiv url: http://arxiv.org/abs/2212.14404v1
- Date: Thu, 29 Dec 2022 18:24:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 17:15:53.225814
- Title: Cross Version Defect Prediction with Class Dependency Embeddings
- Title(参考訳): クラス依存埋め込みを用いたクロスバージョン欠陥予測
- Authors: Moti Cohen, Lior Rokach, Rami Puzis
- Abstract要約: 欠陥の予測にはクラス依存性ネットワーク(CDN)を使用し、静的コードメトリクスと組み合わせています。
本手法では,手動でメトリクスを構築することなくCDN情報を活用するために,ネットワーク埋め込み技術を用いている。
- 参考スコア(独自算出の注目度): 17.110933073074584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software Defect Prediction aims at predicting which software modules are the
most probable to contain defects. The idea behind this approach is to save time
during the development process by helping find bugs early. Defect Prediction
models are based on historical data. Specifically, one can use data collected
from past software distributions, or Versions, of the same target application
under analysis. Defect Prediction based on past versions is called Cross
Version Defect Prediction (CVDP). Traditionally, Static Code Metrics are used
to predict defects. In this work, we use the Class Dependency Network (CDN) as
another predictor for defects, combined with static code metrics. CDN data
contains structural information about the target application being analyzed.
Usually, CDN data is analyzed using different handcrafted network measures,
like Social Network metrics. Our approach uses network embedding techniques to
leverage CDN information without having to build the metrics manually. In order
to use the embeddings between versions, we incorporate different embedding
alignment techniques. To evaluate our approach, we performed experiments on 24
software release pairs and compared it against several benchmark methods. In
these experiments, we analyzed the performance of two different graph embedding
techniques, three anchor selection approaches, and two alignment techniques. We
also built a meta-model based on two different embeddings and achieved a
statistically significant improvement in AUC of 4.7% (p < 0.002) over the
baseline method.
- Abstract(参考訳): ソフトウェア欠陥予測は、欠陥を含む最も可能性の高いソフトウェアモジュールを予測することを目的としている。
このアプローチの背景にある考え方は、バグの早期発見を支援することによって、開発プロセス中の時間を節約することだ。
欠陥予測モデルは過去のデータに基づく。
具体的には、分析中の同じターゲットアプリケーションの過去のソフトウェアディストリビューションやバージョンから収集したデータを利用することができる。
過去のバージョンに基づく欠陥予測はCross Version Defect Prediction (CVDP)と呼ばれる。
伝統的に、静的コードメトリクスは欠陥を予測するために使用される。
この作業では、静的コードメトリクスと組み合わせて、欠陥の別の予測手段としてClass Dependency Network(CDN)を使用します。
CDNデータは、分析対象のアプリケーションに関する構造情報を含む。
通常、cdnデータは、ソーシャルネットワークのメトリクスなど、さまざまな手作りのネットワーク計測によって分析される。
本手法では,手動でメトリクスを構築することなくCDN情報を活用するために,ネットワーク埋め込み技術を用いる。
バージョン間の埋め込みを利用するため、異なる埋め込みアライメント技術が組み込まれている。
提案手法を評価するため,24種類のソフトウェアリリースペアの実験を行い,いくつかのベンチマーク手法と比較した。
本研究では,2種類のグラフ埋め込み手法,3つのアンカー選択手法,および2つのアライメント手法の性能解析を行った。
また, 2種類の埋め込みをベースとしたメタモデルを構築し, ベースライン法よりも4.7% (p < 0.002) の統計的改善を実現した。
関連論文リスト
- Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - Method-Level Bug Severity Prediction using Source Code Metrics and LLMs [0.628122931748758]
本稿では,ソースコードのメトリクス,大言語モデル(LLM)を用いたソースコード表現,およびバグ重大度ラベルの予測におけるそれらの組み合わせについて検討する。
以上の結果から,決定木モデルとランダムフォレストモデルは,いくつかの評価指標に関して,他のモデルよりも優れていたことが示唆された。
CodeBERTの微調整により、いくつかの評価指標の29%-140%の範囲でバグの重大度予測が大幅に改善される。
論文 参考訳(メタデータ) (2023-09-06T14:38:07Z) - Bridging Precision and Confidence: A Train-Time Loss for Calibrating
Object Detection [58.789823426981044]
本稿では,境界ボックスのクラス信頼度を予測精度に合わせることを目的とした,新たな補助損失定式化を提案する。
その結果,列車の走行時間損失はキャリブレーション基準を超過し,キャリブレーション誤差を低減させることがわかった。
論文 参考訳(メタデータ) (2023-03-25T08:56:21Z) - Heterogeneous Ensemble Learning for Enhanced Crash Forecasts -- A
Frequentest and Machine Learning based Stacking Framework [0.803552105641624]
本研究では,都市および郊外の5車線未分割セグメント(5T)の衝突頻度をモデル化するために,重要なHEM手法の1つ,スタックリングを適用した。
Stackingの予測性能は、パラメトリック統計モデル(Poissonと負二項法)と機械学習技術の3つの状態(決定木、ランダム森林、勾配上昇)と比較される。
論文 参考訳(メタデータ) (2022-07-21T19:15:53Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Are Missing Links Predictable? An Inferential Benchmark for Knowledge
Graph Completion [79.07695173192472]
InferWikiは推論能力、仮定、パターンの既存のベンチマークを改善している。
各テストサンプルは、トレーニングセットの支持データで予測可能である。
実験では,大きさや構造が異なるInferWikiの2つの設定をキュレートし,比較データセットとしてCoDExに構築プロセスを適用する。
論文 参考訳(メタデータ) (2021-08-03T09:51:15Z) - Out-of-Vocabulary Entities in Link Prediction [1.9036571490366496]
リンク予測はしばしば、埋め込みの品質を評価するプロキシとして使用される。
ベンチマークはアルゴリズムの公正な比較に欠かせないため、より良いソリューションを開発するための確固たる基盤を提供するため、その品質が確実に確保される。
我々は、そのようなエンティティの発見と削除のためのアプローチの実装を提供し、データセットWN18RR、FB15K-237、YAGO3-10の修正版を提供する。
論文 参考訳(メタデータ) (2021-05-26T12:58:18Z) - D2A: A Dataset Built for AI-Based Vulnerability Detection Methods Using
Differential Analysis [55.15995704119158]
静的解析ツールによって報告されたラベル問題に対する差分解析に基づくアプローチであるD2Aを提案する。
D2Aを使用して大きなラベル付きデータセットを生成し、脆弱性識別のためのモデルをトレーニングします。
論文 参考訳(メタデータ) (2021-02-16T07:46:53Z) - The Integrity of Machine Learning Algorithms against Software Defect
Prediction [0.0]
本報告では,Liangらが開発したオンラインシーケンス・エクストリーム・ラーニング・マシン(OS-ELM)の性能を解析する。
OS-ELMは従来のディープニューラルネットワークよりも高速にトレーニングし、常にグローバルな最適解に収束する。
この分析は、NASAグループが実施する3つのプロジェクトKC1、PC4、PC3で実施される。
論文 参考訳(メタデータ) (2020-09-05T17:26:56Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。