論文の概要: Deep Synthetic Cross-Project Approaches for Software Reliability Growth Modeling
- arxiv url: http://arxiv.org/abs/2509.16939v1
- Date: Sun, 21 Sep 2025 06:15:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 14:52:25.406675
- Title: Deep Synthetic Cross-Project Approaches for Software Reliability Growth Modeling
- Title(参考訳): ソフトウェア信頼性成長モデリングのための深層合成クロスプロジェクトアプローチ
- Authors: Taehyoun Kim, Duksan Ryu, Jongmoon Baik,
- Abstract要約: Deep Synthetic Cross-Project SRGM (DSC-SRGM) は、合成データ生成とクロスプロジェクト移行学習を統合する新しいアプローチである。
DSC-SRGMは従来のSRGMよりも最大で23.3%精度が向上し、実際のデータセットでトレーニングされたクロスプロジェクトディープラーニングモデルでは32.2%となった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software Reliability Growth Models (SRGMs) are widely used to predict software reliability based on defect discovery data collected during testing or operational phases. However, their predictive accuracy often degrades in data-scarce environments, such as early-stage testing or safety-critical systems. Although cross-project transfer learning has been explored to mitigate this issue by leveraging data from past projects, its applicability remains limited due to the scarcity and confidentiality of real-world datasets. To overcome these limitations, we propose Deep Synthetic Cross-project SRGM (DSC-SRGM), a novel approach that integrates synthetic data generation with cross-project transfer learning. Synthetic datasets are generated using traditional SRGMs to preserve the statistical characteristics of real-world defect discovery trends. A cross-correlation-based clustering method is applied to identify synthetic datasets with patterns similar to the target project. These datasets are then used to train a deep learning model for reliability prediction. The proposed method is evaluated on 60 real-world datasets, and its performance is compared with both traditional SRGMs and cross-project deep learning models trained on real-world datasets. DSC-SRGM achieves up to 23.3% improvement in predictive accuracy over traditional SRGMs and 32.2% over cross-project deep learning models trained on real-world datasets. However, excessive use of synthetic data or a naive combination of synthetic and real-world data may degrade prediction performance, highlighting the importance of maintaining an appropriate data balance. These findings indicate that DSC-SRGM is a promising approach for software reliability prediction in data-scarce environments.
- Abstract(参考訳): ソフトウェア信頼性成長モデル(SRGM)は、テストまたは運用段階で収集された欠陥発見データに基づいて、ソフトウェアの信頼性を予測するために広く使用されている。
しかしながら、その予測精度は、アーリーステージテストやセーフティクリティカルシステムなど、データスカース環境で低下することが多い。
プロジェクト間の移行学習は、過去のプロジェクトからのデータを活用することでこの問題を軽減するために研究されてきたが、実際のデータセットの不足と機密性のため、適用性は制限されている。
これらの制約を克服するため、我々は、合成データ生成とクロスプロジェクト移行学習を統合する新しいアプローチであるDeep Synthetic Cross-Project SRGM (DSC-SRGM)を提案する。
合成データセットは従来のSRGMを使用して生成され、実世界の欠陥発見トレンドの統計的特性を保存する。
相互相関に基づくクラスタリング手法を用いて,ターゲットプロジェクトと類似したパターンを持つ合成データセットを同定する。
これらのデータセットは、信頼性予測のためのディープラーニングモデルをトレーニングするために使用される。
提案手法は60個の実世界のデータセットで評価し,その性能を実世界のデータセットで訓練された従来のSRGMとクロスプロジェクトディープラーニングモデルと比較した。
DSC-SRGMは従来のSRGMよりも最大で23.3%精度が向上し、実際のデータセットでトレーニングされたクロスプロジェクトディープラーニングモデルでは32.2%となった。
しかし、合成データの過剰使用や、合成データと実世界のデータの組み合わせは予測性能を低下させ、適切なデータバランスを維持することの重要性を強調している。
これらの結果から,DSC-SRGMはデータスカース環境でのソフトウェア信頼性予測に有望な手法であることが示唆された。
関連論文リスト
- Using Imperfect Synthetic Data in Downstream Inference Tasks [50.40949503799331]
モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を改善することができる。
論文 参考訳(メタデータ) (2025-08-08T18:32:52Z) - Privacy-Preserving Methods for Bug Severity Prediction [0.0]
ソースコードメトリクスと大規模言語モデルを用いたメソッドレベルのバグ重大度予測について検討する。
集中学習,フェデレート学習,合成データ生成を用いて学習したモデルの性能を比較した。
我々の発見は、産業環境で効果的なバグの深刻度予測を可能にするために、プライバシー保護アプローチの可能性を強調している。
論文 参考訳(メタデータ) (2025-06-28T04:40:51Z) - AugGen: Synthetic Augmentation Can Improve Discriminative Models [14.680260279598045]
合成データ生成は、外部データセットや事前訓練されたモデルに代わる有望な代替手段を提供する。
本稿では,自己完結型合成拡張技術であるAugGenを紹介する。
以上の結果から,慎重に統合された合成データは,プライバシー制約を緩和し,顔認識における識別性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2025-03-14T16:10:21Z) - zGAN: An Outlier-focused Generative Adversarial Network For Realistic Synthetic Data Generation [0.0]
ブラックスワン」は古典的な機械学習モデルの性能に挑戦している。
本稿では、外部特性を持つ合成データを生成する目的で開発されたzGANモデルアーキテクチャの概要について述べる。
リアルな合成データ生成の有望な結果と、モデル性能のアップリフト能力を示す。
論文 参考訳(メタデータ) (2024-10-28T07:55:11Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - Reliability in Semantic Segmentation: Can We Use Synthetic Data? [69.28268603137546]
セマンティックセグメンテーションモデルの現実的信頼性を総合的に評価するために、合成データを具体的に生成する方法を初めて示す。
この合成データは、事前訓練されたセグメンタの堅牢性を評価するために使用される。
セグメンタのキャリブレーションとOOD検出能力を向上するために,我々のアプローチをどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2023-12-14T18:56:07Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Foundations of Bayesian Learning from Synthetic Data [1.6249267147413522]
我々はベイズパラダイムを用いて、合成データから学習する際のモデルパラメータの更新を特徴付ける。
ベイジアン・アップデートの最近の成果は、決定理論に基づく新しい、堅牢な合成学習のアプローチを支持している。
論文 参考訳(メタデータ) (2020-11-16T21:49:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。