論文の概要: A Simulation Study of Bandit Algorithms to Address External Validity of
Software Fault Prediction
- arxiv url: http://arxiv.org/abs/2003.05094v2
- Date: Tue, 17 Mar 2020 10:08:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 15:42:48.770715
- Title: A Simulation Study of Bandit Algorithms to Address External Validity of
Software Fault Prediction
- Title(参考訳): ソフトウェア故障予測の外部妥当性に対処する帯域アルゴリズムのシミュレーションによる検討
- Authors: Teruki Hayakawa, Masateru Tsunoda, Koji Toda, Keitaro Nakasai, Kenichi
Matsumoto
- Abstract要約: 我々は,様々な人工断層予測モデルを開発し,帯域幅アルゴリズムを用いて動的に予測する。
トムソンサンプリングアルゴリズムは, 一つの予測モデルを用いた場合と比較して, 最良または第2の予測性能を示した。
- 参考スコア(独自算出の注目度): 1.7574349189932983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various software fault prediction models and techniques for building
algorithms have been proposed. Many studies have compared and evaluated them to
identify the most effective ones. However, in most cases, such models and
techniques do not have the best performance on every dataset. This is because
there is diversity of software development datasets, and therefore, there is a
risk that the selected model or technique shows bad performance on a certain
dataset. To avoid selecting a low accuracy model, we apply bandit algorithms to
predict faults. Consider a case where player has 100 coins to bet on several
slot machines. Ordinary usage of software fault prediction is analogous to the
player betting all 100 coins in one slot machine. In contrast, bandit
algorithms bet one coin on each machine (i.e., use prediction models)
step-by-step to seek the best machine. In the experiment, we developed an
artificial dataset that includes 100 modules, 15 of which include faults. Then,
we developed various artificial fault prediction models and selected them
dynamically using bandit algorithms. The Thomson sampling algorithm showed the
best or second-best prediction performance compared with using only one
prediction model.
- Abstract(参考訳): 様々なソフトウェア故障予測モデルとアルゴリズム構築手法が提案されている。
多くの研究がそれらを比較評価し、最も有効なものを特定してきた。
しかし、ほとんどの場合、そのようなモデルやテクニックはデータセットごとに最高のパフォーマンスを持っていない。
これは、ソフトウェア開発データセットの多様性があるため、選択したモデルやテクニックが特定のデータセットで悪いパフォーマンスを示すリスクがあるためです。
低精度モデルの選択を避けるために,障害予測にbanditアルゴリズムを適用する。
プレイヤーが複数のスロットマシンに賭ける100枚のコインを持っている場合を考えてみよう。
ソフトウェア故障予測の通常の使用法は、プレイヤーが1つのスロットマシンで100コイン全てを賭けるのと類似している。
対照的に、バンディットアルゴリズムは各マシン(すなわち予測モデル)に1つのコインを賭けて、最良のマシンを探す。
実験では,100個のモジュールを含む人工データセットを開発した。
次に,様々な人工断層予測モデルを開発し,バンディットアルゴリズムを用いて動的に選択した。
トムソンサンプリングアルゴリズムは, 一つの予測モデルを用いた場合と比較して, 最良または第2の予測性能を示した。
関連論文リスト
- Awareness of uncertainty in classification using a multivariate model and multi-views [1.3048920509133808]
提案モデルでは,不確かさ予測を正規化し,予測と不確かさ推定の両方を計算する訓練を行う。
複数ビュー予測と不確かさと信頼度を考慮し、最終的な予測を計算する方法をいくつか提案した。
提案手法はクリーンでノイズの多いラベル付きCIFAR-10データセットを用いて検証した。
論文 参考訳(メタデータ) (2024-04-16T06:40:51Z) - Best of Many in Both Worlds: Online Resource Allocation with Predictions under Unknown Arrival Model [16.466711636334587]
オンライン意思決定者は、到着や要求など、将来の変数に関する予測を得ることが多い。
意思決定者にとって予測精度は未知であるため、予測に盲目的に追従することは有害である。
我々は未知の予測精度に頑健な方法で予測を利用するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-02-21T04:57:32Z) - Streaming Algorithms for Learning with Experts: Deterministic Versus
Robust [62.98860182111096]
エキスパート問題を伴うオンライン学習では、アルゴリズムは、T$day(または時間)ごとに結果を予測する必要がある。
目標は最小限のコストで予測を行うことだ。
最良専門家が$M$の誤りを犯したとき、後悔する$R$を達成するような決定論的アルゴリズムに対して、$widetildeOmegaleft(fracnMRTright)$の空間下界を示す。
論文 参考訳(メタデータ) (2023-03-03T04:39:53Z) - Fallen Angel Bonds Investment and Bankruptcy Predictions Using Manual
Models and Automated Machine Learning [0.0]
私たちは、倒産を予測できる最適な機械学習モデルを作成しました。
モデルは、当初のデータセット上での破産をうまく予測しなかった。
しかし、過剰サンプリングされた機能選択データセットは、非常によく機能しました。
論文 参考訳(メタデータ) (2022-12-07T04:39:49Z) - Algorithms with Prediction Portfolios [23.703372221079306]
我々は、マッチング、ロードバランシング、非クレアボイラントスケジューリングなど、多くの基本的な問題に対する複数の予測器の使用について検討する。
これらの問題のそれぞれに対して、複数の予測器を利用する新しいアルゴリズムを導入し、その結果のパフォーマンスに限界を証明します。
論文 参考訳(メタデータ) (2022-10-22T12:58:07Z) - Heterogeneous Ensemble Learning for Enhanced Crash Forecasts -- A
Frequentest and Machine Learning based Stacking Framework [0.803552105641624]
本研究では,都市および郊外の5車線未分割セグメント(5T)の衝突頻度をモデル化するために,重要なHEM手法の1つ,スタックリングを適用した。
Stackingの予測性能は、パラメトリック統計モデル(Poissonと負二項法)と機械学習技術の3つの状態(決定木、ランダム森林、勾配上昇)と比較される。
論文 参考訳(メタデータ) (2022-07-21T19:15:53Z) - Non-Clairvoyant Scheduling with Predictions Revisited [77.86290991564829]
非論理的スケジューリングでは、優先度不明な処理条件でジョブをスケジューリングするためのオンライン戦略を見つけることが課題である。
我々はこのよく研究された問題を、アルゴリズム設計に(信頼できない)予測を統合する、最近人気の高い学習強化された設定で再検討する。
これらの予測には所望の特性があり, 高い性能保証を有するアルゴリズムと同様に, 自然な誤差測定が可能であることを示す。
論文 参考訳(メタデータ) (2022-02-21T13:18:11Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Robustification of Online Graph Exploration Methods [59.50307752165016]
我々は、古典的で有名なオンライングラフ探索問題の学習強化版について研究する。
本稿では,予測をよく知られたNearest Neighbor(NN)アルゴリズムに自然に統合するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-10T10:02:31Z) - Double Coverage with Machine-Learned Advice [100.23487145400833]
オンラインの基本的な$k$-serverの問題を学習強化環境で研究する。
我々のアルゴリズムは任意の k に対してほぼ最適の一貫性-破壊性トレードオフを達成することを示す。
論文 参考訳(メタデータ) (2021-03-02T11:04:33Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。