論文の概要: Generalization in Automated Process Discovery: A Framework based on
Event Log Patterns
- arxiv url: http://arxiv.org/abs/2203.14079v1
- Date: Sat, 26 Mar 2022 13:49:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 14:44:43.776997
- Title: Generalization in Automated Process Discovery: A Framework based on
Event Log Patterns
- Title(参考訳): プロセス発見自動化における一般化: イベントログパターンに基づくフレームワーク
- Authors: Daniel Rei{\ss}ner, Abel Armas-Cervantes, Marcello La Rosa
- Abstract要約: 既存の一般化対策は、実践上の適用性を著しく阻害するいくつかの欠点を示している。
本稿では、イベントログから検出されたパターンの集合を代表トレースで一般化するフレームワークを提案する。
ベースライン一般化測度が扱える最大データセットより2桁大きいデータセットに対して,我々の測度を効率的に計算できることが示される。
- 参考スコア(独自算出の注目度): 0.03222802562733786
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The importance of quality measures in process mining has increased. One of
the key quality aspects, generalization, is concerned with measuring the degree
of overfitting of a process model w.r.t. an event log, since the recorded
behavior is just an example of the true behavior of the underlying business
process. Existing generalization measures exhibit several shortcomings that
severely hinder their applicability in practice. For example, they assume the
event log fully fits the discovered process model, and cannot deal with large
real-life event logs and complex process models. More significantly, current
measures neglect generalizations for clear patterns that demand a certain
construct in the model. For example, a repeating sequence in an event log
should be generalized with a loop structure in the model. We address these
shortcomings by proposing a framework of measures that generalize a set of
patterns discovered from an event log with representative traces and check the
corresponding control-flow structures in the process model via their trace
alignment. We instantiate the framework with a generalization measure that uses
tandem repeats to identify repetitive patterns that are compared to the loop
structures and a concurrency oracle to identify concurrent patterns that are
compared to the parallel structures of the process model. In an extensive
qualitative and quantitative evaluation using 74 log-model pairs using against
two baseline generalization measures, we show that the proposed generalization
measure consistently ranks process models that fulfil the observed patterns
with generalizing control-flow structures higher than those which do not, while
the baseline measures disregard those patterns. Further, we show that our
measure can be efficiently computed for datasets two orders of magnitude larger
than the largest dataset the baseline generalization measures can handle.
- Abstract(参考訳): プロセスマイニングにおける品質対策の重要性が高まっている。
一般化という重要な品質面の1つは、記録された振る舞いは、基盤となるビジネスプロセスの真の振舞いの例であるので、イベントログのようなプロセスモデルの過適合度を測定することである。
既存の一般化措置はいくつかの欠点を示しており、実際の適用を著しく妨げている。
例えば、イベントログが発見されたプロセスモデルに完全に適合していると仮定し、大規模なリアルタイムイベントログや複雑なプロセスモデルを扱うことができない。
さらに、現在の測度は、モデルに特定の構造を必要とする明確なパターンの一般化を無視する。
例えば、イベントログの繰り返しシーケンスは、モデル内のループ構造で一般化されるべきである。
これらの欠点に対処するために、イベントログから検出されたパターンの集合を代表トレースで一般化する尺度の枠組みを提案し、そのトレースアライメントを通じてプロセスモデル内の対応する制御フロー構造をチェックする。
我々は、タンデム反復を用いた一般化尺度を用いてフレームワークをインスタンス化し、ループ構造と比較される反復パターンと、プロセスモデルの並列構造と比較される並行パターンを識別する並行オラクルを識別する。
2つのベースライン一般化対策に対して74対のlog-modelペアを用いた広範囲な質的・定量的評価において,提案手法は,制御フロー構造をそうでないものよりも一般化して観察されたパターンを包含するプロセスモデルを一貫してランク付けし,そのパターンを無視していることを示す。
さらに,本手法は,ベースライン一般化尺度が扱える最大データセットよりも2桁大きいデータセットに対して,効率的に計算可能であることを示す。
関連論文リスト
- Approximate learning of parsimonious Bayesian context trees [0.0]
提案するフレームワークは、合成および実世界のデータ例に基づいてテストされる。
これは、実際のタンパク質配列やハニーポットコンピュータターミナルセッションに適合すると、既存のシーケンスモデルより優れている。
論文 参考訳(メタデータ) (2024-07-27T11:50:40Z) - Mining Constraints from Reference Process Models for Detecting Best-Practice Violations in Event Log [1.389948527681755]
本稿では,参照モデルコレクションから宣言的ベストプラクティス制約をマイニングするためのフレームワークを提案する。
本稿では,実世界のプロセスモデルコレクションとイベントログに基づく評価により,ベストプラクティス違反を検出するフレームワークの能力を実証する。
論文 参考訳(メタデータ) (2024-07-02T15:05:37Z) - Mining a Minimal Set of Behavioral Patterns using Incremental Evaluation [3.16536213610547]
行動パターンマイニングへの既存のアプローチには2つの制限がある。
まず、インクリメンタルな計算がパターン候補の生成にのみ組み込まれるため、スケーラビリティが制限される。
第二に、マイニングされたパターンに基づくプロセス分析は、実用的なアプリケーションシナリオで得られるパターンが圧倒的に多いため、限られた効果しか示さない。
論文 参考訳(メタデータ) (2024-02-05T11:41:37Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Variable Importance Matching for Causal Inference [73.25504313552516]
これらの目標を達成するためのModel-to-Matchと呼ばれる一般的なフレームワークについて説明する。
Model-to-Matchは、距離メートル法を構築するために変数重要度測定を使用する。
LASSO を用いて Model-to-Match フレームワークを運用する。
論文 参考訳(メタデータ) (2023-02-23T00:43:03Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - Relational Action Bases: Formalization, Effective Safety Verification,
and Invariants (Extended Version) [67.99023219822564]
我々はリレーショナルアクションベース(RAB)の一般的な枠組みを紹介する。
RABは両方の制限を解除することで既存のモデルを一般化する。
データ対応ビジネスプロセスのベンチマークにおいて、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-08-12T17:03:50Z) - Complex Event Forecasting with Prediction Suffix Trees: Extended
Technical Report [70.7321040534471]
複合イベント認識(CER)システムは、イベントのリアルタイムストリーム上のパターンを"即時"検出する能力によって、過去20年間に人気が高まっている。
このような現象が実際にCERエンジンによって検出される前に、パターンがいつ発生するかを予測する方法が不足している。
複雑なイベント予測の問題に対処しようとする形式的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-01T09:52:31Z) - Bootstrapping Generalization of Process Models Discovered From Event
Data [10.574698833115589]
一般化は、発見されたモデルがシステムの将来の実行をいかにうまく記述するかを定量化しようとする。
サンプルに基づいて個体群の特性を推定するためにブートストラップ法を用いる。
実験は、産業環境でのアプローチの実現可能性を示す。
論文 参考訳(メタデータ) (2021-07-08T14:35:56Z) - CoCoMoT: Conformance Checking of Multi-Perspective Processes via SMT
(Extended Version) [62.96267257163426]
我々はCoCoMoT(Computing Conformance Modulo Theories)フレームワークを紹介する。
まず、純粋な制御フロー設定で研究したSATベースのエンコーディングを、データ認識ケースに持ち上げる方法を示す。
次に,プロパティ保存型クラスタリングの概念に基づく新しい前処理手法を提案する。
論文 参考訳(メタデータ) (2021-03-18T20:22:50Z) - An Entropic Relevance Measure for Stochastic Conformance Checking in
Process Mining [9.302180124254338]
本稿では,各ログのトレースを圧縮するために必要な平均ビット数として計算された適合性チェックのためのエントロピー関連尺度を提案する。
エントロピー関連性はログのサイズで線形に計算可能であることを示し、産業環境における新しい手法の適用可能性を示す評価結果を提供する。
論文 参考訳(メタデータ) (2020-07-18T02:25:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。