論文の概要: Predicting the Number of Reported Bugs in a Software Repository
- arxiv url: http://arxiv.org/abs/2104.12001v1
- Date: Sat, 24 Apr 2021 19:06:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 14:22:18.809583
- Title: Predicting the Number of Reported Bugs in a Software Repository
- Title(参考訳): ソフトウェアリポジトリの報告されるバグの数を予測する
- Authors: Hadi Jahanshahi, Mucahit Cevik, Ay\c{s}e Ba\c{s}ar
- Abstract要約: 本研究では,Long Short Term Memory Neural Networks (LSTM), Auto-Regressive Integrated moving average (ARIMA), Random Forest Regressorの8種類の時系列予測モデルについて検討した。
異なる性能指標に基づいて、各モデルの長期予測の品質を分析します。
評価は、大規模なオープンソースソフトウェアアプリケーションであるMozilla上で行われる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The bug growth pattern prediction is a complicated, unrelieved task, which
needs considerable attention. Advance knowledge of the likely number of bugs
discovered in the software system helps software developers in designating
sufficient resources at a convenient time. The developers may also use such
information to take necessary actions to increase the quality of the system and
in turn customer satisfaction. In this study, we examine eight different time
series forecasting models, including Long Short Term Memory Neural Networks
(LSTM), auto-regressive integrated moving average (ARIMA), and Random Forest
Regressor. Further, we assess the impact of exogenous variables such as
software release dates by incorporating those into the prediction models. We
analyze the quality of long-term prediction for each model based on different
performance metrics. The assessment is conducted on Mozilla, which is a large
open-source software application. The dataset is originally mined from Bugzilla
and contains the number of bugs for the project between Jan 2010 and Dec 2019.
Our numerical analysis provides insights on evaluating the trends in a bug
repository. We observe that LSTM is effective when considering long-run
predictions whereas Random Forest Regressor enriched by exogenous variables
performs better for predicting the number of bugs in the short term.
- Abstract(参考訳): バグ成長パターンの予測は複雑で未解決のタスクであり、かなりの注意が必要である。
ソフトウェアシステムで見つかる可能性のあるバグの数に関する高度な知識は、ソフトウェア開発者が十分なリソースを便利なタイミングで指定するのに役立ちます。
開発者はそのような情報を使ってシステムの品質を高め、顧客満足度を高めるために必要なアクションを取ることもできる。
本研究では,Long Short Term Memory Neural Networks (LSTM), Auto-Regressive Integrated moving average (ARIMA), Random Forest Regressorの8種類の時系列予測モデルについて検討した。
さらに,ソフトウェアリリース日などの外因性変数の影響を予測モデルに組み込むことで評価する。
我々は,各モデルの長期予測の質を,異なる性能指標に基づいて分析する。
この評価は、大規模なオープンソースソフトウェアアプリケーションであるMozillaで行われている。
データセットはもともとBugzillaから採掘されたもので、2010年1月から2019年12月までのプロジェクトのバグ数を含んでいる。
我々の数値解析は、バグリポジトリのトレンドを評価する洞察を提供する。
LSTMは長期予測において有効であるのに対し,外来変数に富んだランダムフォレスト回帰器は短期的なバグ数予測に優れていた。
関連論文リスト
- Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。
限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - Rating Multi-Modal Time-Series Forecasting Models (MM-TSFM) for Robustness Through a Causal Lens [10.103561529332184]
ノイズや不正なデータによる不正確さが誤った予測につながるような,マルチモーダルな時系列予測に重点を置いている。
本稿では,マルチモーダル時系列予測モデルのロバスト性を評価するための評価手法を提案する。
論文 参考訳(メタデータ) (2024-06-12T17:39:16Z) - Performative Time-Series Forecasting [71.18553214204978]
我々は,機械学習の観点から,パフォーマンス時系列予測(PeTS)を定式化する。
本稿では,予測分布シフトに対する遅延応答の概念を活用する新しい手法であるFeature Performative-Shifting(FPS)を提案する。
新型コロナウイルスの複数の時系列モデルと交通予報タスクを用いた総合的な実験を行った。
論文 参考訳(メタデータ) (2023-10-09T18:34:29Z) - Method-Level Bug Severity Prediction using Source Code Metrics and LLMs [0.628122931748758]
本稿では,ソースコードのメトリクス,大言語モデル(LLM)を用いたソースコード表現,およびバグ重大度ラベルの予測におけるそれらの組み合わせについて検討する。
以上の結果から,決定木モデルとランダムフォレストモデルは,いくつかの評価指標に関して,他のモデルよりも優れていたことが示唆された。
CodeBERTの微調整により、いくつかの評価指標の29%-140%の範囲でバグの重大度予測が大幅に改善される。
論文 参考訳(メタデータ) (2023-09-06T14:38:07Z) - Backward-Compatible Prediction Updates: A Probabilistic Approach [12.049279991559091]
本稿では,予測更新問題を定式化し,上記の質問に対する効率的な確率的アプローチを提案する。
標準分類ベンチマークデータセットの広範な実験において,提案手法は後方互換性のある予測更新のための代替戦略よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-07-02T13:05:31Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Curse of Small Sample Size in Forecasting of the Active Cases in
COVID-19 Outbreak [0.0]
新型コロナウイルス(COVID-19)のパンデミックでは、感染者数や今後の流行を予想する試みが多数行われている。
しかし、信頼性の高い方法では、新型コロナウイルス(COVID-19)の根本的特徴の中期的・長期的進化を許容できる精度で予測することができない。
本稿では,この予測問題における機械学習モデルの故障について説明する。
論文 参考訳(メタデータ) (2020-11-06T23:13:34Z) - Software Defect Prediction Based On Deep Learning Models: Performance
Study [0.5735035463793008]
Stack Sparse Auto-Encoder(SSAE)とDeep Belief Network(DBN)の2つのディープラーニングモデルがデプロイされ、NASAデータセットを分類する。
実験の結果,十分なサンプルが得られたデータセットの精度が向上した。
論文 参考訳(メタデータ) (2020-04-02T06:02:14Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。