論文の概要: Tailoring Machine Learning for Process Mining
- arxiv url: http://arxiv.org/abs/2306.10341v1
- Date: Sat, 17 Jun 2023 12:59:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 22:55:47.458227
- Title: Tailoring Machine Learning for Process Mining
- Title(参考訳): プロセスマイニングのための機械学習の調整
- Authors: Paolo Ceravolo and Sylvio Barbon Junior and Ernesto Damiani and Wil
van der Aalst
- Abstract要約: 我々は、プロセスマイニングと機械学習の健全な統合を構築する上で、機械学習モデルをプロセスデータでトレーニングすることで生じる問題に対する深い洞察が不可欠であると主張している。
本研究の目的は,機械学習とプロセスマイニングの要件を正しく整合させることを目的とした方法論の基礎を構築することである。
- 参考スコア(独自算出の注目度): 5.237999056930947
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Machine learning models are routinely integrated into process mining
pipelines to carry out tasks like data transformation, noise reduction, anomaly
detection, classification, and prediction. Often, the design of such models is
based on some ad-hoc assumptions about the corresponding data distributions,
which are not necessarily in accordance with the non-parametric distributions
typically observed with process data. Moreover, the learning procedure they
follow ignores the constraints concurrency imposes to process data. Data
encoding is a key element to smooth the mismatch between these assumptions but
its potential is poorly exploited. In this paper, we argue that a deeper
insight into the issues raised by training machine learning models with process
data is crucial to ground a sound integration of process mining and machine
learning. Our analysis of such issues is aimed at laying the foundation for a
methodology aimed at correctly aligning machine learning with process mining
requirements and stimulating the research to elaborate in this direction.
- Abstract(参考訳): 機械学習モデルは、プロセスマイニングパイプラインに日常的に統合され、データ変換、ノイズ低減、異常検出、分類、予測などのタスクを実行する。
多くの場合、これらのモデルの設計は対応するデータ分布に関するいくつかのアドホックな仮定に基づいているが、プロセスデータで通常観測される非パラメトリック分布に必ずしも従わない。
さらに、彼らが従う学習手順は、データ処理に課される制約を無視する。
データエンコーディングは、これらの仮定間のミスマッチを円滑にするための重要な要素であるが、そのポテンシャルは不十分である。
本稿では,プロセスマイニングと機械学習の健全な統合を構築する上で,プロセスデータを用いた機械学習モデルのトレーニングがもたらした問題に対する深い洞察が重要であることを論じる。
本研究の目的は,機械学習をプロセスマイニングの要件と正しく整合させる手法の基礎を築き,その方向性を解明することである。
関連論文リスト
- Unlearning Information Bottleneck: Machine Unlearning of Systematic Patterns and Biases [6.936871609178494]
本稿では,機械学習のプロセスを強化するための新しい情報理論フレームワークであるUnlearning Information Bottleneck(UIB)を紹介する。
変分上界を提案することにより,データ分布の変化を安価な計算コストと統合する動的事前計算により,モデルパラメータを再検討する。
さまざまなデータセット,モデル,未学習手法を対象とした実験により,本手法は学習後のモデルの性能を維持しながら,体系的なパターンやバイアスを効果的に除去することを示した。
論文 参考訳(メタデータ) (2024-05-22T21:54:05Z) - Stochastic Amortization: A Unified Approach to Accelerate Feature and Data Attribution [62.71425232332837]
雑音ラベル付きモデルを用いたトレーニングは安価で驚くほど効果的であることを示す。
このアプローチは、いくつかの特徴属性とデータ評価手法を著しく加速し、しばしば既存のアプローチよりも桁違いにスピードアップする。
論文 参考訳(メタデータ) (2024-01-29T03:42:37Z) - Robust Machine Learning by Transforming and Augmenting Imperfect
Training Data [6.928276018602774]
この論文は、現代の機械学習のいくつかのデータ感度を探求する。
まず、トレーニングデータで測定された事前の人間の識別をMLが符号化するのを防ぐ方法について論じる。
次に、トレーニング中に予測忠実度を提供するが、デプロイ時に信頼性が低い突発的特徴を含むデータから学習する問題について論じる。
論文 参考訳(メタデータ) (2023-12-19T20:49:28Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - Capturing and incorporating expert knowledge into machine learning
models for quality prediction in manufacturing [0.0]
本研究では,小規模データセットを用いた機械学習手法を用いて品質予測モデルを構築するための一般的な手法を提案する。
提案手法は,プロセススペシャリストが規定するすべての専門知識に厳密に準拠する予測モデルを生成する。
論文 参考訳(メタデータ) (2022-02-04T07:22:29Z) - MIRACLE: Causally-Aware Imputation via Learning Missing Data Mechanisms [82.90843777097606]
欠落データに対する因果認識型計算アルゴリズム(MIRACLE)を提案する。
MIRACLEは、欠落発生機構を同時にモデル化することにより、ベースラインの計算を反復的に洗練する。
我々は、MIRACLEが一貫してイミューテーションを改善することができることを示すために、合成および様々な公開データセットに関する広範な実験を行う。
論文 参考訳(メタデータ) (2021-11-04T22:38:18Z) - A Meta-learning Approach to Reservoir Computing: Time Series Prediction
with Limited Data [0.0]
本研究では,実験プロセスから適切なモデル構造を自動的に抽出するデータ駆動型手法を提案する。
簡単なベンチマーク問題に対して,我々のアプローチを実証する。
論文 参考訳(メタデータ) (2021-10-07T18:23:14Z) - Using Data Assimilation to Train a Hybrid Forecast System that Combines
Machine-Learning and Knowledge-Based Components [52.77024349608834]
利用可能なデータがノイズの多い部分測定の場合,カオスダイナミクスシステムのデータ支援予測の問題を検討する。
動的システムの状態の部分的測定を用いることで、不完全な知識ベースモデルによる予測を改善するために機械学習モデルを訓練できることを示す。
論文 参考訳(メタデータ) (2021-02-15T19:56:48Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z) - Machine Learning to Tackle the Challenges of Transient and Soft Errors
in Complex Circuits [0.16311150636417257]
機械学習モデルは、回路インスタンスの完全なリストに対して、インスタンスごとの正確な関数デレートデータを予測するために使用される。
提案手法を実例に適用し,各種機械学習モデルの評価と比較を行った。
論文 参考訳(メタデータ) (2020-02-18T18:38:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。