論文の概要: Leveraging Commit Size Context and Hyper Co-Change Graph Centralities for Defect Prediction
- arxiv url: http://arxiv.org/abs/2604.01132v1
- Date: Wed, 01 Apr 2026 16:53:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:32.102032
- Title: Leveraging Commit Size Context and Hyper Co-Change Graph Centralities for Defect Prediction
- Title(参考訳): 欠陥予測のためのコミットサイズコンテキストとハイパーコチェンジグラフ集中の活用
- Authors: Amit Kumar, Ethari Hrishikesh, Sonali Agarwal,
- Abstract要約: まず、プロセスメトリクスをコミットサイズを意識したプロセスメトリックベクトルとして再定義します。
次に、ハイパーエッジがコミットサイズセマンティクスを自然にエンコードするハイパーコチェンジグラフとして、変更履歴をモデル化します。
- 参考スコア(独自算出の注目度): 4.980923816458701
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: File-level defect prediction models traditionally rely on product and process metrics. While process metrics effectively complement product metrics, they often overlook commit size the number of files changed per commit despite its strong association with software quality. Network centrality measures on dependency graphs have also proven to be valuable product level indicators. Motivated by this, we first redefine process metrics as commit size aware process metric vectors, transforming conventional scalar measures into 100 dimensional profiles that capture the distribution of changes across commit size strata. We then model change history as a hyper co change graph, where hyperedges naturally encode commit-size semantics. Vector centralities computed on these hypergraphs quantify size-aware node importance for source files. Experiments on nine long-lived Apache projects using five popular classifiers show that replacing scalar process metrics with the proposed commit size aware vectors, alongside product metrics, consistently improves predictive performance. These findings establish that commit size aware process metrics and hypergraph based vector centralities capture higher-order change semantics, leading to more discriminative, better calibrated, and statistically superior defect prediction models.
- Abstract(参考訳): ファイルレベルの欠陥予測モデルは、伝統的に製品とプロセスのメトリクスに依存しています。
プロセスメトリクスはプロダクトのメトリクスを効果的に補完しますが、ソフトウェアの品質と強く結びついているにも関わらず、コミット毎に変更されたファイルの数を見落としてしまうことが少なくありません。
依存グラフに対するネットワークの集中度も、価値のある製品レベルの指標であることが証明されている。
そこで我々はまず,コミットサイズを意識したプロセスメトリックベクトルとしてプロセスメトリクスを再定義し,従来のスカラー測度を100次元のプロファイルに変換する。
次に、ハイパーエッジがコミットサイズセマンティクスを自然にエンコードするハイパーコチェンジグラフとして、変更履歴をモデル化します。
これらのハイパーグラフで計算されたベクトル中心性は、ソースファイルのサイズ認識ノードの重要性を定量化する。
一般的な5つの分類器を使用した9つの長期Apacheプロジェクトの実験では、スカラープロセスメトリクスを製品メトリクスとともに提案されたコミットサイズ対応ベクタに置き換えることで、予測パフォーマンスが一貫して改善されている。
これらの結果から,コミットサイズを考慮したプロセスメトリクスとハイパーグラフに基づくベクトル集中度が高次変化セマンティクスを捕捉し,より識別性が高く,校正性が高く,統計的に優れた欠陥予測モデルが得られた。
関連論文リスト
- Scaling Laws for Reranking in Information Retrieval [24.00475965133032]
本稿では,リランカーのスケーリング法則に関する最初の体系的研究について述べる。
クロスエンコーダリランカーを用いた詳細なケーススタディを用いて、性能が予測可能なパワー則に従うことを示した。
本研究は,産業グレード検索システム構築のためのスケーリングの原則を確立し,実用的な洞察を提供するものである。
論文 参考訳(メタデータ) (2026-03-05T05:03:07Z) - Downsized and Compromised?: Assessing the Faithfulness of Model Compression [0.0]
本稿では,圧縮モデルにおける忠実度を評価するための新しい手法を提案する。
モデル行動の圧縮後の変化をキャプチャする,忠実度指標のセットを紹介し,実証する。
我々の貢献には、モデルアライアンスを用いたモデルと圧縮モデル間の予測整合性の評価手法の導入、および全体データセットと人口統計サブグループの両方にわたる予測パターンの統計的に有意な変化を検出するためのカイ二乗検定の適用が含まれる。
論文 参考訳(メタデータ) (2025-10-07T17:05:02Z) - EdiVal-Agent: An Object-Centric Framework for Automated, Fine-Grained Evaluation of Multi-Turn Editing [170.71134330650796]
EdiVal-Agentは、命令ベースの画像編集のためのオブジェクト指向評価フレームワークである。
標準のシングルターンだけでなく、マルチターンの命令ベースの編集を精度良く評価するように設計されている。
EdiVal-Benchは、インコンテキスト、フローマッチング、拡散パラダイムにまたがる9つの命令タイプと13の最先端編集モデルをカバーするベンチマークである。
論文 参考訳(メタデータ) (2025-09-16T17:45:39Z) - Quantifying Memory Utilization with Effective State-Size [73.52115209375343]
「我々は、テキスト・メモリ利用の尺度を策定する。」
この計量は、textitinput-invariant および textitinput-variant linear operator を持つシステムの基本的なクラスに適合する。
論文 参考訳(メタデータ) (2025-04-28T08:12:30Z) - Precision-Recall Divergence Optimization for Generative Modeling with
GANs and Normalizing Flows [54.050498411883495]
本研究では,ジェネレーティブ・アドバイサル・ネットワークや正規化フローなどの生成モデルのための新しいトレーニング手法を開発した。
指定された精度-リコールトレードオフを達成することは、textitPR-divergencesと呼ぶ家族からのユニークな$f$-divergenceを最小化することを意味する。
当社のアプローチは,ImageNetなどのデータセットでテストした場合の精度とリコールの両面で,BigGANのような既存の最先端モデルの性能を向上させる。
論文 参考訳(メタデータ) (2023-05-30T10:07:17Z) - Non-Separable Multi-Dimensional Network Flows for Visual Computing [62.50191141358778]
本研究では,非分離型多次元ネットワークフローに対する新しい定式化法を提案する。
フローは次元ごとに定義されるので、最大化フローは自動的に最適な特徴次元を選択する。
概念実証として,マルチオブジェクト追跡問題にフォーマリズムを適用し,ノイズに対するロバスト性の観点からMOT16ベンチマークのスカラー定式化よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-05-15T13:21:44Z) - Calibrated Interpretation: Confidence Estimation in Semantic Parsing [37.28245521206576]
一般的な4つのセマンティックパーシングデータセットのキャリブレーションについて検討する。
キャリブレーションエラーに関連する要因を分析し、2つの解析データセットの信頼度に基づく新たな課題分割を公表する。
論文 参考訳(メタデータ) (2022-11-14T15:17:55Z) - Learning Dynamic Compact Memory Embedding for Deformable Visual Object
Tracking [82.34356879078955]
本稿では,セグメント化に基づく変形可能な視覚追跡手法の識別を強化するために,コンパクトなメモリ埋め込みを提案する。
DAVIS 2017ベンチマークでは,D3SやSiamMaskなどのセグメンテーションベースのトラッカーよりも優れている。
論文 参考訳(メタデータ) (2021-11-23T03:07:12Z) - Using Source Code Density to Improve the Accuracy of Automatic Commit
Classification into Maintenance Activities [7.53201324244815]
コミットのネットサイズを測るソースコード密度を導入し、自動コミット分類の精度を向上させる方法を示す。
1つのプロジェクトでモデルをトレーニングし、他のプロジェクトに適用するクロスプロジェクトコミット分類では、最大89%の精度と0.82のKappaを達成します。
論文 参考訳(メタデータ) (2020-05-28T11:05:39Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。