論文の概要: Handling Concept Drift for Predictions in Business Process Mining
- arxiv url: http://arxiv.org/abs/2005.05810v2
- Date: Mon, 18 May 2020 13:24:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 18:23:39.279924
- Title: Handling Concept Drift for Predictions in Business Process Mining
- Title(参考訳): ビジネスプロセスマイニングにおける予測のためのコンセプトドリフト処理
- Authors: Lucas Baier, Josua Reimold, Niklas K\"uhl
- Abstract要約: 機械学習モデルは、コンセプトドリフト(concept drift)と呼ばれるデータストリームを経時的に変更することで、課題となる。
現在の研究では、モデルの再トレーニングのために選択すべきデータが推奨されていない。
概念ドリフトハンドリングにより0.5400から0.7010に精度を向上できることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predictive services nowadays play an important role across all business
sectors. However, deployed machine learning models are challenged by changing
data streams over time which is described as concept drift. Prediction quality
of models can be largely influenced by this phenomenon. Therefore, concept
drift is usually handled by retraining of the model. However, current research
lacks a recommendation which data should be selected for the retraining of the
machine learning model. Therefore, we systematically analyze different data
selection strategies in this work. Subsequently, we instantiate our findings on
a use case in process mining which is strongly affected by concept drift. We
can show that we can improve accuracy from 0.5400 to 0.7010 with concept drift
handling. Furthermore, we depict the effects of the different data selection
strategies.
- Abstract(参考訳): 現在、予測サービスはすべてのビジネスセクターで重要な役割を果たす。
しかし、デプロイされた機械学習モデルは、概念ドリフトと呼ばれる時間とともにデータストリームを変更することで挑戦される。
モデルの予測品質は、この現象に大きく影響される。
したがって、コンセプトドリフトは通常モデルの再トレーニングによって処理される。
しかし、現在の研究では、機械学習モデルの再トレーニングのために選択すべきデータが推奨されていない。
そこで本研究では,異なるデータ選択戦略を体系的に分析する。
次に,概念ドリフトの影響を強く受けているプロセスマイニングのユースケースについて考察を行う。
コンセプトドリフトハンドリングにより,0.5400から0.7010までの精度向上が期待できる。
さらに,様々なデータ選択戦略の効果について述べる。
関連論文リスト
- Methods for Generating Drift in Text Streams [49.3179290313959]
コンセプトドリフトは、実世界のデータセットで頻繁に発生する現象であり、時間とともにデータ分布の変化に対応する。
本稿では,ラベル付きドリフトを用いたデータセット作成を容易にするための4つのテキストドリフト生成手法を提案する。
その結果、ドリフトの直後にすべてのメソッドのパフォーマンスが低下し、インクリメンタルなSVMは、以前のパフォーマンスレベルを実行し、回復するのに最も速いことを示している。
論文 参考訳(メタデータ) (2024-03-18T23:48:33Z) - Explaining Drift using Shapley Values [0.0]
機械学習モデルは、トレーニングされていないデータよりも結果を予測するために使用されると、パフォーマンスが劣化することが多い。
モデルパフォーマンスにおけるドリフトの背後にあるドライバを特定するためのフレームワークはありません。
ドリフトの主なコントリビュータを特定するために,原理化されたシェープ値を用いたDBShapを提案する。
論文 参考訳(メタデータ) (2024-01-18T07:07:42Z) - On the Change of Decision Boundaries and Loss in Learning with Concept
Drift [8.686667049158476]
概念ドリフト(concept drift)とは、観測データを生成する分布が時間とともに変化する現象を指す。
ドリフトで学習するための多くの技術は、モデル一般化誤差を近似する量としてインターリーブテストトレイン誤差(ITTE)に依存している。
論文 参考訳(メタデータ) (2022-12-02T14:58:13Z) - Unsupervised Unlearning of Concept Drift with Autoencoders [5.41354952642957]
コンセプトドリフトは、将来のサンプルのデータストリームに影響を与えるデータ分散の変化を指す。
本稿では,世界レベルでの教師なしおよびモデルに依存しないドリフト適応手法を提案する。
論文 参考訳(メタデータ) (2022-11-23T14:52:49Z) - Autoregressive based Drift Detection Method [0.0]
我々はADDMと呼ばれる自己回帰モデルに基づく新しい概念ドリフト検出手法を提案する。
以上の結果から,新しいドリフト検出法は最先端ドリフト検出法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-09T14:36:16Z) - How Well Do Sparse Imagenet Models Transfer? [75.98123173154605]
転送学習は、大規模な"上流"データセットで事前訓練されたモデルが、"下流"データセットで良い結果を得るために適応される古典的なパラダイムである。
本研究では、ImageNetデータセットでトレーニングされた畳み込みニューラルネットワーク(CNN)のコンテキストにおいて、この現象を詳細に調査する。
スパースモデルでは, 高空間であっても, 高密度モデルの転送性能にマッチしたり, 性能に優れることを示す。
論文 参考訳(メタデータ) (2021-11-26T11:58:51Z) - Machine Unlearning of Features and Labels [72.81914952849334]
機械学習モデルにおけるアンラーニングとラベルのファーストシナリオを提案する。
提案手法は,影響関数の概念に基づいて,モデルパラメータのクローズドフォーム更新によるアンラーニングを実現する。
論文 参考訳(メタデータ) (2021-08-26T04:42:24Z) - Beyond Trivial Counterfactual Explanations with Diverse Valuable
Explanations [64.85696493596821]
コンピュータビジョンの応用において、生成的対実法はモデルの入力を摂動させて予測を変更する方法を示す。
本稿では,多様性強化損失を用いて制約される不連続潜在空間における摂動を学習する反事実法を提案する。
このモデルは, 従来の最先端手法と比較して, 高品質な説明を生産する成功率を向上させる。
論文 参考訳(メタデータ) (2021-03-18T12:57:34Z) - Injecting Knowledge in Data-driven Vehicle Trajectory Predictors [82.91398970736391]
車両軌道予測タスクは、一般的に知識駆動とデータ駆動の2つの視点から取り組まれている。
本稿では,これら2つの視点を効果的に結合する「現実的残留ブロック」 (RRB) の学習を提案する。
提案手法は,残留範囲を限定し,その不確実性を考慮した現実的な予測を行う。
論文 参考訳(メタデータ) (2021-03-08T16:03:09Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z) - Switching Scheme: A Novel Approach for Handling Incremental Concept
Drift in Real-World Data Sets [0.0]
概念ドリフトは、機械学習システムの予測性能に深刻な影響を与える可能性がある。
本研究では,実世界のデータセットの文脈における概念ドリフトの効果を分析する。
本稿では,機械学習モデルの再学習と更新の2つの原則を組み合わせたスイッチング方式を提案する。
論文 参考訳(メタデータ) (2020-11-05T10:16:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。