Fugu-MT 論文翻訳(概要): Predicting the Number of Reported Bugs in a Software Repository

論文の概要: Predicting the Number of Reported Bugs in a Software Repository

arxiv url: http://arxiv.org/abs/2104.12001v1
Date: Sat, 24 Apr 2021 19:06:35 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-27 14:22:18.809583
Title: Predicting the Number of Reported Bugs in a Software Repository
Title（参考訳）: ソフトウェアリポジトリの報告されるバグの数を予測する
Authors: Hadi Jahanshahi, Mucahit Cevik, Ay\c{s}e Ba\c{s}ar
Abstract要約: 本研究では,Long Short Term Memory Neural Networks (LSTM), Auto-Regressive Integrated moving average (ARIMA), Random Forest Regressorの8種類の時系列予測モデルについて検討した。異なる性能指標に基づいて、各モデルの長期予測の品質を分析します。評価は、大規模なオープンソースソフトウェアアプリケーションであるMozilla上で行われる。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The bug growth pattern prediction is a complicated, unrelieved task, which needs considerable attention. Advance knowledge of the likely number of bugs discovered in the software system helps software developers in designating sufficient resources at a convenient time. The developers may also use such information to take necessary actions to increase the quality of the system and in turn customer satisfaction. In this study, we examine eight different time series forecasting models, including Long Short Term Memory Neural Networks (LSTM), auto-regressive integrated moving average (ARIMA), and Random Forest Regressor. Further, we assess the impact of exogenous variables such as software release dates by incorporating those into the prediction models. We analyze the quality of long-term prediction for each model based on different performance metrics. The assessment is conducted on Mozilla, which is a large open-source software application. The dataset is originally mined from Bugzilla and contains the number of bugs for the project between Jan 2010 and Dec 2019. Our numerical analysis provides insights on evaluating the trends in a bug repository. We observe that LSTM is effective when considering long-run predictions whereas Random Forest Regressor enriched by exogenous variables performs better for predicting the number of bugs in the short term.
Abstract（参考訳）: バグ成長パターンの予測は複雑で未解決のタスクであり、かなりの注意が必要である。ソフトウェアシステムで見つかる可能性のあるバグの数に関する高度な知識は、ソフトウェア開発者が十分なリソースを便利なタイミングで指定するのに役立ちます。開発者はそのような情報を使ってシステムの品質を高め、顧客満足度を高めるために必要なアクションを取ることもできる。本研究では,Long Short Term Memory Neural Networks (LSTM), Auto-Regressive Integrated moving average (ARIMA), Random Forest Regressorの8種類の時系列予測モデルについて検討した。さらに,ソフトウェアリリース日などの外因性変数の影響を予測モデルに組み込むことで評価する。我々は,各モデルの長期予測の質を,異なる性能指標に基づいて分析する。この評価は、大規模なオープンソースソフトウェアアプリケーションであるMozillaで行われている。データセットはもともとBugzillaから採掘されたもので、2010年1月から2019年12月までのプロジェクトのバグ数を含んでいる。我々の数値解析は、バグリポジトリのトレンドを評価する洞察を提供する。 LSTMは長期予測において有効であるのに対し,外来変数に富んだランダムフォレスト回帰器は短期的なバグ数予測に優れていた。

関連論文リスト

Scaling Open-Ended Reasoning to Predict the Future [56.672065928345525]
我々は、オープンエンドの予測質問の予測を行うために言語モデルを訓練する。トレーニングデータをスケールアップするために、毎日のニュースで報告されるグローバルイベントから新しい予測質問を合成する。トレーニングの予測によるキャリブレーションの改善は、一般的なベンチマークで一般化されている。
論文参考訳（メタデータ） (2025-12-31T18:59:51Z)
Bug Priority Change Prediction: An Exploratory Study on Apache Software [7.264561489832595]
本稿では,バグ修正の進化的特徴とクラス不均衡処理戦略に基づく2段階バグレポート優先度変更予測手法を提案する。提案手法の性能を評価するため,32の非自明なApacheプロジェクトから構築したバグデータセットを用いて実験を行った。
論文参考訳（メタデータ） (2025-12-10T00:59:51Z)
BugPilot: Complex Bug Generation for Efficient Learning of SWE Skills [59.003563837981886]
高品質なバグは、次世代の言語モデルベースソフトウェアエンジニアリング(SWE)エージェントをトレーニングする鍵となる。難易度および多種多様なバグを合成する新しい方法を提案する。
論文参考訳（メタデータ） (2025-10-22T17:58:56Z)
Accuracy Law for the Future of Deep Time Series Forecasting [65.46625911002202]
時系列予測は、部分的に観測可能で不確実な性質のため、本質的にゼロでない誤差の低い境界に直面する。本稿では、ディープ時系列予測の性能上限をどうやって推定するかという根本的な問題に焦点をあてる。新たに訓練された2,800以上の深層予測器の厳密な統計的テストに基づいて、深部モデルの最小予測誤差とウィンドウワイズ級数パターンの複雑さとの間に有意な指数関数的関係を見出した。
論文参考訳（メタデータ） (2025-10-03T05:18:47Z)
Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文参考訳（メタデータ） (2025-09-27T20:57:48Z)
Bug Destiny Prediction in Large Open-Source Software Repositories through Sentiment Analysis and BERT Topic Modeling [3.481985817302898]
バグが解決する前に利用可能な機能を活用して、予測精度を高めます。本手法は感情分析を取り入れ,感情性スコアと感情分類の両方を導出する。結果は、感情分析がバグの最終的な結果の貴重な予測要因であることを示している。
論文参考訳（メタデータ） (2025-04-22T15:18:14Z)
Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文参考訳（メタデータ） (2024-09-10T07:34:19Z)
Rating Multi-Modal Time-Series Forecasting Models (MM-TSFM) for Robustness Through a Causal Lens [10.103561529332184]
ノイズや不正なデータによる不正確さが誤った予測につながるような,マルチモーダルな時系列予測に重点を置いている。本稿では,マルチモーダル時系列予測モデルのロバスト性を評価するための評価手法を提案する。
論文参考訳（メタデータ） (2024-06-12T17:39:16Z)
Performative Time-Series Forecasting [71.18553214204978]
我々は,機械学習の観点から,パフォーマンス時系列予測(PeTS)を定式化する。本稿では,予測分布シフトに対する遅延応答の概念を活用する新しい手法であるFeature Performative-Shifting(FPS)を提案する。新型コロナウイルスの複数の時系列モデルと交通予報タスクを用いた総合的な実験を行った。
論文参考訳（メタデータ） (2023-10-09T18:34:29Z)
Method-Level Bug Severity Prediction using Source Code Metrics and LLMs [0.628122931748758]
本稿では,ソースコードのメトリクス,大言語モデル(LLM)を用いたソースコード表現,およびバグ重大度ラベルの予測におけるそれらの組み合わせについて検討する。以上の結果から,決定木モデルとランダムフォレストモデルは,いくつかの評価指標に関して,他のモデルよりも優れていたことが示唆された。 CodeBERTの微調整により、いくつかの評価指標の29%-140%の範囲でバグの重大度予測が大幅に改善される。
論文参考訳（メタデータ） (2023-09-06T14:38:07Z)
ASPEST: Bridging the Gap Between Active Learning and Selective Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文参考訳（メタデータ） (2023-04-07T23:51:07Z)
Backward-Compatible Prediction Updates: A Probabilistic Approach [12.049279991559091]
本稿では,予測更新問題を定式化し,上記の質問に対する効率的な確率的アプローチを提案する。標準分類ベンチマークデータセットの広範な実験において,提案手法は後方互換性のある予測更新のための代替戦略よりも優れていることを示す。
論文参考訳（メタデータ） (2021-07-02T13:05:31Z)
Back2Future: Leveraging Backfill Dynamics for Improving Real-time Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文参考訳（メタデータ） (2021-06-08T14:48:20Z)
Robust and Transferable Anomaly Detection in Log Data using Pre-Trained Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文参考訳（メタデータ） (2021-02-23T09:17:05Z)
Curse of Small Sample Size in Forecasting of the Active Cases in COVID-19 Outbreak [0.0]
新型コロナウイルス(COVID-19)のパンデミックでは、感染者数や今後の流行を予想する試みが多数行われている。しかし、信頼性の高い方法では、新型コロナウイルス(COVID-19)の根本的特徴の中期的・長期的進化を許容できる精度で予測することができない。本稿では,この予測問題における機械学習モデルの故障について説明する。
論文参考訳（メタデータ） (2020-11-06T23:13:34Z)
Software Defect Prediction Based On Deep Learning Models: Performance Study [0.5735035463793008]
Stack Sparse Auto-Encoder(SSAE)とDeep Belief Network(DBN)の2つのディープラーニングモデルがデプロイされ、NASAデータセットを分類する。実験の結果,十分なサンプルが得られたデータセットの精度が向上した。
論文参考訳（メタデータ） (2020-04-02T06:02:14Z)
Ambiguity in Sequential Data: Predicting Uncertain Futures with Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文参考訳（メタデータ） (2020-03-10T09:15:42Z)
Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文参考訳（メタデータ） (2020-03-10T03:10:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。