論文の概要: Co-Change Graph Entropy: A New Process Metric for Defect Prediction
- arxiv url: http://arxiv.org/abs/2504.18511v1
- Date: Fri, 25 Apr 2025 17:27:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.857888
- Title: Co-Change Graph Entropy: A New Process Metric for Defect Prediction
- Title(参考訳): Co-Change Graph Entropy: 欠陥予測のための新しいプロセスメトリクス
- Authors: Ethari Hrishikesh, Amit Kumar, Meher Bhardwaj, Sonali Agarwal,
- Abstract要約: 共変化グラフエントロピー(Co-Change Graph Entropy)は、共変化をグラフとしてモデル化し、共変化散乱を定量化する新しい計量である。
ファイルレベルの欠陥分類では、変更エントロピーを共変化エントロピーに置き換えることで、AUROCは72.5%、MCCは62.5%改善する。
- 参考スコア(独自算出の注目度): 3.1049891832782848
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Process metrics, valued for their language independence and ease of collection, have been shown to outperform product metrics in defect prediction. Among these, change entropy (Hassan, 2009) is widely used at the file level and has proven highly effective. Additionally, past research suggests that co-change patterns provide valuable insights into software quality. Building on these findings, we introduce Co-Change Graph Entropy, a novel metric that models co-changes as a graph to quantify co-change scattering. Experiments on eight Apache projects reveal a significant correlation between co-change entropy and defect counts at the file level, with a Pearson correlation coefficient of up to 0.54. In filelevel defect classification, replacing change entropy with co-change entropy improves AUROC in 72.5% of cases and MCC in 62.5% across 40 experimental settings (five machine learning classifiers and eight projects), though these improvements are not statistically significant. However, when co-change entropy is combined with change entropy, AUROC improves in 82.5% of cases and MCC in 65%, with statistically significant gains confirmed via the Friedman test followed by the post-hoc Nemenyi test. These results indicate that co-change entropy complements change entropy, significantly enhancing defect classification performance and underscoring its practical importance in defect prediction.
- Abstract(参考訳): 言語独立性とコレクションの容易性に価値があるプロセスメトリクスは、欠陥予測において製品メトリクスよりも優れていることが示されている。
これらのうち、変更エントロピー(Hassan, 2009)はファイルレベルで広く使われており、非常に有効であることが証明されている。
さらに、過去の研究は、コ変革パターンがソフトウェア品質に関する貴重な洞察をもたらすことを示唆している。
これらの結果に基づいて,コチェンジグラフエントロピー(co-Change Graph Entropy)を導入し,コチェンジグラフをグラフとしてモデル化し,コチェンジ散乱の定量化を行う。
8つのApacheプロジェクトでの実験では、ファイルレベルでの共変更エントロピーと欠陥数との間に有意な相関が見られ、Pearson相関係数は最大0.54である。
ファイルレベルの欠陥分類では、変更エントロピーを共変化エントロピーに置き換えることで、AUROCが72.5%、MCCが62.5%、40の実験的な設定(5つの機械学習分類器と8つのプロジェクト)が62.5%向上するが、これらの改善は統計的に有意ではない。
しかし、共変エントロピーと変化エントロピーを組み合わせると、AUROCは82.5%の症例で改善し、MCCは65%のケースで改善する。
これらの結果から, 共変エントロピーは変化エントロピーを補完し, 欠陥分類性能を著しく向上し, 欠陥予測におけるその実用的重要性を裏付けることが示された。
関連論文リスト
- Confidence-calibrated covariate shift correction for few-shot classification in Vision-Language Models [2.6061534894032907]
我々は,共変量シフトを緩和するためのフィッシャー情報ペナルティと,誤分類例における過度な信頼を減らすための信頼ミスアライメントペナルティ(CMP)を組み合わせた統一的アプローチであるtextbfConfidence-Calibrated Covariate Shift Correction (CalShift)を導入する。
CalShiftはモデルのキャリブレーションを大幅に改善し、期待エラー(ECE)を最大5.82%削減する。
この結果から,CalShiftは実世界のアプリケーション向けに,堅牢で信頼性の高い低ショットビジョン言語システムを構築するための有望な戦略であることを強調した。
論文 参考訳(メタデータ) (2025-02-11T10:10:15Z) - Entropy Adaptive Decoding: Dynamic Model Switching for Efficient Inference [0.0]
本稿では,効率的な言語モデル推論のための新しいアプローチであるEntropy Adaptive Decoding (EAD)を提案する。
EADは予測の不確実性に基づいて、異なるサイズのモデル間で切り替える。
異なるモデルファミリー間で顕著な効率向上を示す。
論文 参考訳(メタデータ) (2025-02-05T22:15:21Z) - High-dimensional Statistics Applications to Batch Effects in Metabolomics [0.4834684822950222]
大規模な代謝学ではバッチ効果は避けられない。
品質制御に基づく同時テスト(QC-ST)と共分散補正(CoCo)を提案する。
QC-STは、異なるバッチ間でQCサンプルの平均ベクトルと共分散行列の統計的意義を同時に検出することができる。
論文 参考訳(メタデータ) (2024-12-13T15:10:48Z) - Semiparametric conformal prediction [79.6147286161434]
ベクトル値の非整合性スコアの結合相関構造を考慮した共形予測セットを構築する。
スコアの累積分布関数(CDF)を柔軟に推定する。
提案手法は,現実の回帰問題に対して,所望のカバレッジと競争効率をもたらす。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - PseudoNeg-MAE: Self-Supervised Point Cloud Learning using Conditional Pseudo-Negative Embeddings [55.55445978692678]
PseudoNeg-MAEは,ポイントマスク自動エンコーダのグローバルな特徴表現を強化する,自己教師型学習フレームワークである。
PseudoNeg-MAE は ModelNet40 と ScanObjectNN のデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-09-24T07:57:21Z) - Improving Variational Autoencoder Estimation from Incomplete Data with Mixture Variational Families [6.2279613160361995]
欠落したデータは、潜在変数に対するモデルの後部分布の複雑さを増大させることを示す。
複雑さの増大は、モデル後部分布とモデル後部分布のミスマッチに起因するモデルの適合性に悪影響を及ぼす可能性がある。
我々は, (i) 有限変分混合と (ii) 計算に基づく変分混合分布に基づく2つの戦略を導入し, 後続の複雑さの増加に対処する。
論文 参考訳(メタデータ) (2024-03-05T15:57:52Z) - Uncertainty quantification for predictions of atomistic neural networks [0.0]
本稿では、量子化学参照データに基づくトレーニングニューラルネットワーク(NN)の予測における不確かさの定量化値について検討する。
PhysNet NN のアーキテクチャを好適に修正し,キャリブレーションの定量化,予測品質,予測誤差と予測不確かさの相関性を評価した。
論文 参考訳(メタデータ) (2022-07-14T13:39:43Z) - Accuracy on the Line: On the Strong Correlation Between
Out-of-Distribution and In-Distribution Generalization [89.73665256847858]
分布外性能は,広範囲なモデルと分布シフトに対する分布内性能と強く相関していることを示す。
具体的には,CIFAR-10 と ImageNet の変種に対する分布内分布と分布外分布性能の強い相関関係を示す。
また,CIFAR-10-Cと組織分類データセットCamelyon17-WILDSの合成分布の変化など,相関が弱いケースについても検討した。
論文 参考訳(メタデータ) (2021-07-09T19:48:23Z) - When in Doubt: Neural Non-Parametric Uncertainty Quantification for
Epidemic Forecasting [70.54920804222031]
既存の予測モデルは不確実な定量化を無視し、誤校正予測をもたらす。
不確実性を考慮した時系列予測のためのディープニューラルネットワークの最近の研究にもいくつかの制限がある。
本稿では,予測タスクを確率的生成過程としてモデル化し,EPIFNPと呼ばれる機能的ニューラルプロセスモデルを提案する。
論文 参考訳(メタデータ) (2021-06-07T18:31:47Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。