論文の概要: Causal Inference for the Effect of Code Coverage on Bug Introduction
- arxiv url: http://arxiv.org/abs/2602.03585v1
- Date: Tue, 03 Feb 2026 14:36:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.512973
- Title: Causal Inference for the Effect of Code Coverage on Bug Introduction
- Title(参考訳): コードカバレッジがバグ導入に及ぼす影響の因果推論
- Authors: Lukas Schulte, Gordon Fraser, Steffen Herbold,
- Abstract要約: 成熟したJavaScriptとTypeScriptオープンソースプロジェクトのコンテキストにおけるバグ導入(アウトカム)に対するコードカバレッジの因果効果を定量化することを目指している。
- 参考スコア(独自算出の注目度): 11.877258445515318
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Context: Code coverage is widely used as a software quality assurance measure. However, its effect, and specifically the advisable dose, are disputed in both the research and engineering communities. Prior work reports only correlational associations, leaving results vulnerable to confounding factors. Objective: We aim to quantify the causal effect of code coverage (exposure) on bug introduction (outcome) in the context of mature JavaScript and TypeScript open source projects, addressing both the overall effect and its variance across coverage levels. Method: We construct a causal directed acyclic graph to identify confounders within the software engineering process, modeling key variables from the source code, issue- and review systems, and continuous integration. Using generalized propensity score adjustment, we will apply doubly robust regression-based causal inference for continuous exposure to a novel dataset of bug-introducing and non-bug-introducing changes. We estimate the average treatment effect and dose-response relationship to examine potential non-linear patterns (e.g., thresholds or diminishing returns) within the projects of our dataset.
- Abstract(参考訳): コンテキスト: コードカバレッジは、ソフトウェア品質保証尺度として広く使われています。
しかし、その効果、特に推奨される投与量は、研究コミュニティと工学コミュニティの両方で議論されている。
先行研究は相関関係のみを報告し、結果は相反する要因に弱いままである。
目的: 成熟したJavaScriptとTypeScriptオープンソースプロジェクトのコンテキストにおけるバグ導入(アウトカム)に対するコードカバレッジ(エクスポージャー)の因果効果を定量化し、カバレッジレベルの全体的な影響と分散の両方に対処することを目的としています。
方法: ソフトウェアエンジニアリングプロセスにおける共同創設者の特定,ソースコードからのキー変数のモデリング,イシュー・アンド・レビューシステム,継続的インテグレーションのための因果非循環グラフを構築した。
一般相対性スコア調整を用いて,バグ導入と非バグ導入の新たなデータセットに対して,2倍の頑健な回帰に基づく因果推論を適用した。
我々は,データセットのプロジェクトにおいて,潜在的非線形パターン(閾値,リターンの低下など)を調べるために,平均治療効果と線量-応答関係を推定する。
関連論文リスト
- Data Fusion for Partial Identification of Causal Effects [62.56890808004615]
本稿では,研究者が重要な疑問に答えられるような,新しい部分的識別フレームワークを提案する。
因果効果は肯定的か否定的か?
本研究の枠組みをSTARプロジェクトに適用し,第3級の標準試験性能に対する教室規模の影響について検討する。
論文 参考訳(メタデータ) (2025-05-30T07:13:01Z) - Black Box Causal Inference: Effect Estimation via Meta Prediction [56.277798874118425]
因果推論はデータセットレベルの予測問題であり,アルゴリズム設計を学習プロセスにオフロードする。
我々は,ブラックボックス因果推論 (BBCI) と呼ばれる,サンプルデータセットと効果ペアの因果効果の予測を学習することにより,ブラックボックス方式で推定器を構築する。
我々は,いくつかの因果推論問題に対して,BBCIを用いた平均治療効果(ATE)と条件平均治療効果(CATE)を正確に推定した。
論文 参考訳(メタデータ) (2025-03-07T23:43:19Z) - An AI-powered Bayesian generative modeling approach for causal inference in observational studies [4.4876925770439415]
CausalBGMはAIを利用したベイズ生成モデリングアプローチである。
低次元潜在特徴集合の個別分布を学習することにより、個別処理効果(ITE)を推定する。
論文 参考訳(メタデータ) (2025-01-01T06:52:45Z) - Large-Scale Targeted Cause Discovery via Learning from Simulated Data [66.51307552703685]
本稿では,観測結果から対象変数の因果変数を推定する機械学習手法を提案する。
我々は、シミュレートされたデータに基づいて教師あり学習を用いてニューラルネットワークを訓練し、因果関係を推定する。
大規模遺伝子制御ネットワークにおける因果関係の同定に優れた性能を示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-08-29T02:21:11Z) - Do Finetti: On Causal Effects for Exchangeable Data [45.96632286841583]
データをi.i.d.に含まない環境での因果効果の推定について検討する。
我々は、独立因果関係の仮定を満たす交換可能なデータに焦点を当てる。
論文 参考訳(メタデータ) (2024-05-29T07:31:18Z) - BayesIMP: Uncertainty Quantification for Causal Data Fusion [52.184885680729224]
本研究では,複数の因果グラフに関連するデータセットを組み合わせ,対象変数の平均処理効果を推定する因果データ融合問題について検討する。
本稿では、確率積分とカーネル平均埋め込みのアイデアを組み合わせて、再生されたカーネルヒルベルト空間における干渉分布を表現するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-07T10:14:18Z) - Targeted VAE: Variational and Targeted Learning for Causal Inference [39.351088248776435]
観測データによる因果推論は、幅広いタスクで非常に有用である。
観察データを用いた因果推論の実施には,2つの重要な課題がある。
構造化推論とターゲット学習を組み合わせることで、これらの2つの課題に対処する。
論文 参考訳(メタデータ) (2020-09-28T16:55:24Z) - Progressive Graph Learning for Open-Set Domain Adaptation [48.758366879597965]
ドメインシフトは、典型的にはソースとターゲットデータが異なる分布に従うときに発生する視覚認識の基本的な問題である。
本稿では、ターゲットデータにソースデータに存在しない追加のクラスを含むオープンセットドメインシフトのより現実的な問題に取り組む。
本稿では,その基礎となる条件シフトを抑制するために,エピソード学習を伴うグラフニューラルネットワークを統合したエンドツーエンドのプログレッシブグラフ学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T09:10:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。