論文の概要: A Simulation Study of Bandit Algorithms to Address External Validity of
Software Fault Prediction
- arxiv url: http://arxiv.org/abs/2003.05094v2
- Date: Tue, 17 Mar 2020 10:08:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 15:42:48.770715
- Title: A Simulation Study of Bandit Algorithms to Address External Validity of
Software Fault Prediction
- Title(参考訳): ソフトウェア故障予測の外部妥当性に対処する帯域アルゴリズムのシミュレーションによる検討
- Authors: Teruki Hayakawa, Masateru Tsunoda, Koji Toda, Keitaro Nakasai, Kenichi
Matsumoto
- Abstract要約: 我々は,様々な人工断層予測モデルを開発し,帯域幅アルゴリズムを用いて動的に予測する。
トムソンサンプリングアルゴリズムは, 一つの予測モデルを用いた場合と比較して, 最良または第2の予測性能を示した。
- 参考スコア(独自算出の注目度): 1.7574349189932983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various software fault prediction models and techniques for building
algorithms have been proposed. Many studies have compared and evaluated them to
identify the most effective ones. However, in most cases, such models and
techniques do not have the best performance on every dataset. This is because
there is diversity of software development datasets, and therefore, there is a
risk that the selected model or technique shows bad performance on a certain
dataset. To avoid selecting a low accuracy model, we apply bandit algorithms to
predict faults. Consider a case where player has 100 coins to bet on several
slot machines. Ordinary usage of software fault prediction is analogous to the
player betting all 100 coins in one slot machine. In contrast, bandit
algorithms bet one coin on each machine (i.e., use prediction models)
step-by-step to seek the best machine. In the experiment, we developed an
artificial dataset that includes 100 modules, 15 of which include faults. Then,
we developed various artificial fault prediction models and selected them
dynamically using bandit algorithms. The Thomson sampling algorithm showed the
best or second-best prediction performance compared with using only one
prediction model.
- Abstract(参考訳): 様々なソフトウェア故障予測モデルとアルゴリズム構築手法が提案されている。
多くの研究がそれらを比較評価し、最も有効なものを特定してきた。
しかし、ほとんどの場合、そのようなモデルやテクニックはデータセットごとに最高のパフォーマンスを持っていない。
これは、ソフトウェア開発データセットの多様性があるため、選択したモデルやテクニックが特定のデータセットで悪いパフォーマンスを示すリスクがあるためです。
低精度モデルの選択を避けるために,障害予測にbanditアルゴリズムを適用する。
プレイヤーが複数のスロットマシンに賭ける100枚のコインを持っている場合を考えてみよう。
ソフトウェア故障予測の通常の使用法は、プレイヤーが1つのスロットマシンで100コイン全てを賭けるのと類似している。
対照的に、バンディットアルゴリズムは各マシン(すなわち予測モデル)に1つのコインを賭けて、最良のマシンを探す。
実験では,100個のモジュールを含む人工データセットを開発した。
次に,様々な人工断層予測モデルを開発し,バンディットアルゴリズムを用いて動的に選択した。
トムソンサンプリングアルゴリズムは, 一つの予測モデルを用いた場合と比較して, 最良または第2の予測性能を示した。
関連論文リスト
- Streaming Algorithms for Learning with Experts: Deterministic Versus
Robust [62.98860182111096]
エキスパート問題を伴うオンライン学習では、アルゴリズムは、T$day(または時間)ごとに結果を予測する必要がある。
目標は最小限のコストで予測を行うことだ。
最良専門家が$M$の誤りを犯したとき、後悔する$R$を達成するような決定論的アルゴリズムに対して、$widetildeOmegaleft(fracnMRTright)$の空間下界を示す。
論文 参考訳(メタデータ) (2023-03-03T04:39:53Z) - Fallen Angel Bonds Investment and Bankruptcy Predictions Using Manual
Models and Automated Machine Learning [0.0]
私たちは、倒産を予測できる最適な機械学習モデルを作成しました。
モデルは、当初のデータセット上での破産をうまく予測しなかった。
しかし、過剰サンプリングされた機能選択データセットは、非常によく機能しました。
論文 参考訳(メタデータ) (2022-12-07T04:39:49Z) - Algorithms with Prediction Portfolios [23.703372221079306]
我々は、マッチング、ロードバランシング、非クレアボイラントスケジューリングなど、多くの基本的な問題に対する複数の予測器の使用について検討する。
これらの問題のそれぞれに対して、複数の予測器を利用する新しいアルゴリズムを導入し、その結果のパフォーマンスに限界を証明します。
論文 参考訳(メタデータ) (2022-10-22T12:58:07Z) - Heterogeneous Ensemble Learning for Enhanced Crash Forecasts -- A
Frequentest and Machine Learning based Stacking Framework [0.803552105641624]
本研究では,都市および郊外の5車線未分割セグメント(5T)の衝突頻度をモデル化するために,重要なHEM手法の1つ,スタックリングを適用した。
Stackingの予測性能は、パラメトリック統計モデル(Poissonと負二項法)と機械学習技術の3つの状態(決定木、ランダム森林、勾配上昇)と比較される。
論文 参考訳(メタデータ) (2022-07-21T19:15:53Z) - Non-Clairvoyant Scheduling with Predictions Revisited [77.86290991564829]
非論理的スケジューリングでは、優先度不明な処理条件でジョブをスケジューリングするためのオンライン戦略を見つけることが課題である。
我々はこのよく研究された問題を、アルゴリズム設計に(信頼できない)予測を統合する、最近人気の高い学習強化された設定で再検討する。
これらの予測には所望の特性があり, 高い性能保証を有するアルゴリズムと同様に, 自然な誤差測定が可能であることを示す。
論文 参考訳(メタデータ) (2022-02-21T13:18:11Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Robustification of Online Graph Exploration Methods [59.50307752165016]
我々は、古典的で有名なオンライングラフ探索問題の学習強化版について研究する。
本稿では,予測をよく知られたNearest Neighbor(NN)アルゴリズムに自然に統合するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-10T10:02:31Z) - Time Series Anomaly Detection with label-free Model Selection [0.6303112417588329]
ラベルのない時系列データに対するラベルなしモデル選択を用いた新しい異常検出アルゴリズムであるLaF-ADを提案する。
我々のアルゴリズムは容易に並列化可能であり、不条件データや季節データに対してより堅牢であり、多数の異常モデルに対して非常にスケーラブルである。
論文 参考訳(メタデータ) (2021-06-11T00:21:06Z) - Double Coverage with Machine-Learned Advice [100.23487145400833]
オンラインの基本的な$k$-serverの問題を学習強化環境で研究する。
我々のアルゴリズムは任意の k に対してほぼ最適の一貫性-破壊性トレードオフを達成することを示す。
論文 参考訳(メタデータ) (2021-03-02T11:04:33Z) - Random Machines Regression Approach: an ensemble support vector
regression model with free kernel choice [0.0]
本稿では,重み付きサポートベクターモデルを用いて回帰問題を解く手法を提案する。
その結果、チューニングプロセス中に最適なカーネル関数を選択することなく、より低い一般化誤差により回帰ランダムマシンの性能が向上した。
論文 参考訳(メタデータ) (2020-03-27T21:30:59Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。