論文の概要: A Meta-analytical Comparison of Naive Bayes and Random Forest for
Software Defect Prediction
- arxiv url: http://arxiv.org/abs/2306.15369v1
- Date: Tue, 27 Jun 2023 10:35:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-28 13:40:06.703337
- Title: A Meta-analytical Comparison of Naive Bayes and Random Forest for
Software Defect Prediction
- Title(参考訳): ソフトウェア欠陥予測のためのナイーブベイズとランダム森林のメタ解析的比較
- Authors: Ch Muhammad Awais, Wei Gu, Gcinizwe Dlamini, Zamira Kholmatova,
Giancarlo Succi
- Abstract要約: 系統的な文献レビューとメタアナリシスを行い,2つのモデルを比較した。
その結果,ナイーブベイズがランサムフォレストと異なり,リコール,F測定,精度の点で異なるという有意な統計的証拠は得られなかった。
- 参考スコア(独自算出の注目度): 3.005513700369406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Is there a statistical difference between Naive Bayes and Random Forest in
terms of recall, f-measure, and precision for predicting software defects? By
utilizing systematic literature review and meta-analysis, we are answering this
question. We conducted a systematic literature review by establishing criteria
to search and choose papers, resulting in five studies. After that, using the
meta-data and forest-plots of five chosen papers, we conducted a meta-analysis
to compare the two models. The results have shown that there is no significant
statistical evidence that Naive Bayes perform differently from Random Forest in
terms of recall, f-measure, and precision.
- Abstract(参考訳): Naive BayesとRandom Forestの間には、ソフトウェア欠陥のリコール、F測定、精度の統計的違いがあるのだろうか?
体系的な文献レビューとメタ分析を活用することで、この問題に答える。
論文の検索と選択の基準を定め,体系的な文献レビューを行い,5つの研究結果を得た。
その後,5つの論文のメタデータとフォレストプロットを用いて,2つのモデルを比較するメタ分析を行った。
その結果,ナイーブベイズがランサムフォレストと異なり,リコール,F測定,精度の点で異なるという有意な統計的証拠は得られなかった。
関連論文リスト
- Post-hoc Probabilistic Vision-Language Models [51.12284891724463]
視覚言語モデル(VLM)は、分類、検索、生成タスクにおいて顕著な成功を収めている。
追加トレーニングを必要としないVLMにおけるポストホック不確実性評価を提案する。
この結果から,大規模モデルの安全性クリティカルな応用が期待できることがわかった。
論文 参考訳(メタデータ) (2024-12-08T18:16:13Z) - Global Censored Quantile Random Forest [2.8413279736755017]
我々は,正しい検閲対象データに対する条件付き量子化過程を予測するために,GCQRF(Global Censored Quantile Random Forest)を提案する。
我々は、無限の森林を仮定することなく予測過程の変動を定量化し、その弱収束を確立する。
提案手法の予測精度は,既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-16T04:05:01Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Uncertain Evidence in Probabilistic Models and Stochastic Simulators [80.40110074847527]
我々は、不確実性を伴う観測を伴う確率論的モデルにおいて、ベイズ的推論を行うという問題について考察する。
我々は、不確実な証拠をどう解釈するかを探求し、潜伏変数の推論に関連する適切な解釈の重要性を拡大する。
我々は、不確実な証拠を説明するための具体的なガイドラインを考案し、特に一貫性に関する新しい洞察を提供する。
論文 参考訳(メタデータ) (2022-10-21T20:32:59Z) - On Variance Estimation of Random Forests [0.0]
本稿では,不完全U-統計量に基づく不偏分散推定器を開発する。
我々は,計算コストを増大させることなく,より低いバイアスとより正確な信頼区間のカバレッジを評価できることを示した。
論文 参考訳(メタデータ) (2022-02-18T03:35:47Z) - Geometry- and Accuracy-Preserving Random Forest Proximities [3.265773263570237]
我々はランダムフォレスト-ジオメトリー(Random Forest-Geometry- and Accuracy-Preserving Proximities:RF-GAP)と呼ばれるランダムフォレスト確率の新しい定義を導入する。
RF-GAPは乱林予測と正確に一致していることが証明された。
この幾何表現の改善は、データ計算などのタスクにおいて従来のランダムな森の確率よりも優れており、学習したデータ幾何と整合した外れ値の検出と可視化結果を提供する。
論文 参考訳(メタデータ) (2022-01-29T23:13:53Z) - A Statistical Analysis of Summarization Evaluation Metrics using
Resampling Methods [60.04142561088524]
信頼区間は比較的広く,信頼性の高い自動測定値の信頼性に高い不確実性を示す。
多くのメトリクスはROUGEよりも統計的改善を示していないが、QAEvalとBERTScoreという2つの最近の研究は、いくつかの評価設定で行われている。
論文 参考訳(メタデータ) (2021-03-31T18:28:14Z) - Achieving Reliable Causal Inference with Data-Mined Variables: A Random
Forest Approach to the Measurement Error Problem [1.5749416770494704]
一般的な実証的戦略は、利用可能なデータから関心のある変数を'マイニング'する予測モデリング手法の適用を含む。
最近の研究は、機械学習モデルからの予測は必然的に不完全であるため、予測変数に基づく計量分析は測定誤差によるバイアスに悩まされる可能性が高いことを強調している。
ランダムフォレストと呼ばれるアンサンブル学習技術を用いて,これらのバイアスを軽減する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-12-19T21:48:23Z) - Density of States Estimation for Out-of-Distribution Detection [69.90130863160384]
DoSEは状態推定器の密度である。
我々は、他の教師なしOOD検出器に対するDoSEの最先端性能を実証する。
論文 参考訳(メタデータ) (2020-06-16T16:06:25Z) - Trees, forests, and impurity-based variable importance [0.0]
MDI(Mean Decrease Impurity)という2つのよく知られたランダムな森林変動の重要度を分析した。
入力変数が独立であり、相互作用がない場合、MDIは出力の分散分解を提供する。
分析の結果,単木に比べて森林の利用にはいくつかの利点がある可能性が示唆された。
論文 参考訳(メタデータ) (2020-01-13T14:38:53Z) - Censored Quantile Regression Forest [81.9098291337097]
我々は、検閲に適応し、データが検閲を示さないときに量子スコアをもたらす新しい推定方程式を開発する。
提案手法は, パラメトリックなモデリング仮定を使わずに, 時間単位の定量を推定することができる。
論文 参考訳(メタデータ) (2020-01-08T23:20:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。