論文の概要: Efficient Online Computation of Business Process State From Trace Prefixes via N-Gram Indexing
- arxiv url: http://arxiv.org/abs/2409.05658v1
- Date: Mon, 9 Sep 2024 14:28:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 14:29:54.974839
- Title: Efficient Online Computation of Business Process State From Trace Prefixes via N-Gram Indexing
- Title(参考訳): N-Gramインデクシングによるトレーサプリフィックスによるビジネスプロセス状態の効率的なオンライン計算
- Authors: David Chapela-Campa, Marlon Dumas,
- Abstract要約: プロセスモデルとプロセスの進行中ケースのトレースプレフィックスを含むイベントログが与えられたら、各ケースをモデル内の対応する状態にマップする。
この状態計算問題に対するアプローチは、モデルに対して各トレースプレフィックスのトークンベースのリプレイを実行することである。
本稿では,現在進行中の事例のトレースプレフィックスが与えられた場合,n-gramとして状態を表わす指標を用いて,その状態を一定時間に計算する手法を提案する。
- 参考スコア(独自算出の注目度): 0.5141137421503899
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the following problem: Given a process model and an event log containing trace prefixes of ongoing cases of a process, map each case to its corresponding state (i.e., marking) in the model. This state computation operation is a building block of other process mining operations, such as log animation and short-term simulation. An approach to this state computation problem is to perform a token-based replay of each trace prefix against the model. However, when a trace prefix does not strictly follow the behavior of the process model, token replay may produce a state that is not reachable from the initial state of the process. An alternative approach is to first compute an alignment between the trace prefix of each ongoing case and the model, and then replay the aligned trace prefix. However, (prefix-)alignment is computationally expensive. This paper proposes a method that, given a trace prefix of an ongoing case, computes its state in constant time using an index that represents states as n-grams. An empirical evaluation shows that the proposed approach has an accuracy comparable to that of the prefix-alignment approach, while achieving a throughput of hundreds of thousands of traces per second.
- Abstract(参考訳): プロセスモデルとプロセスの進行中ケースのトレースプレフィックスを含むイベントログが与えられた場合、各ケースをモデル内の対応する状態(マーキング)にマップする。
この状態計算操作は、ログアニメーションや短期シミュレーションのような他のプロセスマイニング操作の構成要素である。
この状態計算問題に対するアプローチは、モデルに対して各トレースプレフィックスのトークンベースのリプレイを実行することである。
しかし、トレースプレフィックスがプロセスモデルの振舞いに厳密に従わない場合、トークンの再生はプロセスの初期状態から到達できない状態を生成する可能性がある。
もう一つのアプローチは、まず各実行中のケースのトレースプレフィックスとモデルの間のアライメントを計算し、次にアライメントされたトレースプレフィックスを再生する。
しかし、(prefix-)アライメントは計算コストが高い。
本稿では,現在進行中の事例のトレースプレフィックスが与えられた場合,n-gramとして状態を表わす指標を用いて,その状態を一定時間に計算する手法を提案する。
実験により,提案手法の精度はプレフィックスアライメント手法に匹敵するが,スループットは毎秒数十万トレースであることがわかった。
関連論文リスト
- Bisimulation Learning [55.859538562698496]
我々は、大きな、潜在的に無限の状態空間を持つ状態遷移系の有限バイシミュレートを計算する。
提案手法は,実際に行われている他の最先端ツールよりも高速な検証結果が得られる。
論文 参考訳(メタデータ) (2024-05-24T17:11:27Z) - How Good is the Model in Model-in-the-loop Event Coreference Resolution
Annotation? [3.712417884848568]
本稿では、イベントコア参照解決のためのモデル-in-the-loopアノテーションアプローチを提案する。
まずアノテーションプロセスのシミュレートを行い,新しいアノテータ中心のリコール・ワーク・トレードオフ・メトリックを用いて,基礎となるモデルとデータセットの結果を比較することにより,このアプローチの有効性を評価する。
論文 参考訳(メタデータ) (2023-06-06T18:06:24Z) - OpenPI-C: A Better Benchmark and Stronger Baseline for Open-Vocabulary
State Tracking [55.62705574507595]
OpenPIは、オープン語彙状態トラッキング用に注釈付けされた唯一のデータセットである。
手順レベル,ステップレベル,状態変化レベルの3つの問題を分類する。
評価指標として,クラスタベースの計量法を提案する。
論文 参考訳(メタデータ) (2023-06-01T16:48:20Z) - Value-Consistent Representation Learning for Data-Efficient
Reinforcement Learning [105.70602423944148]
本稿では,意思決定に直接関連のある表現を学習するための,VCR(Value-Consistent Expression Learning)という新しい手法を提案する。
この想像された状態と環境によって返される実状態とを一致させる代わりに、VCRは両方の状態に$Q$-valueヘッドを適用し、2つのアクション値の分布を得る。
検索不要なRLアルゴリズムに対して,提案手法が新たな最先端性能を実現することが実証された。
論文 参考訳(メタデータ) (2022-06-25T03:02:25Z) - Conformance Checking Over Stochastically Known Logs [7.882975068446842]
データログは、例えば、センサ読み取りの不正確さや、処理プログラムによる読み取りの誤った解釈によって不確実になる可能性がある。
この作業では、プロセスモデルとイベントログを比較するコンフォーマンスチェックに重点を置いています。
我々は,ログ内の事象の不確実性を反映したトレースモデル,同期生成物,コスト関数を数学的に定義する。
論文 参考訳(メタデータ) (2022-03-14T21:33:06Z) - CoCoMoT: Conformance Checking of Multi-Perspective Processes via SMT
(Extended Version) [62.96267257163426]
我々はCoCoMoT(Computing Conformance Modulo Theories)フレームワークを紹介する。
まず、純粋な制御フロー設定で研究したSATベースのエンコーディングを、データ認識ケースに持ち上げる方法を示す。
次に,プロパティ保存型クラスタリングの概念に基づく新しい前処理手法を提案する。
論文 参考訳(メタデータ) (2021-03-18T20:22:50Z) - Predictive Process Model Monitoring using Recurrent Neural Networks [2.4029798593292706]
本稿では,予測モニタリングの中間地点となるプロセス・アズ・ムーブズ(PAM)について紹介する。
プロセス実行トレースのさまざまなウィンドウにおけるアクティビティ間の宣言的なプロセス制約をキャプチャすることで実現します。
高次元入力に適した様々なリカレントニューラルネットワークトポロジを使用して、ウィンドウをタイムステップとしてプロセスモデルの進化をモデル化する。
論文 参考訳(メタデータ) (2020-11-05T13:57:33Z) - Process Discovery for Structured Program Synthesis [70.29027202357385]
プロセスマイニングにおける中核的なタスクは、イベントログデータから正確なプロセスモデルを学ぶことを目的としたプロセス発見である。
本稿では,ターゲットプロセスモデルとして(ブロック-)構造化プログラムを直接使用することを提案する。
我々は,このような構造化プログラムプロセスモデルの発見に対して,新たなボトムアップ・アグリメティブ・アプローチを開発する。
論文 参考訳(メタデータ) (2020-08-13T10:33:10Z) - An Entropic Relevance Measure for Stochastic Conformance Checking in
Process Mining [9.302180124254338]
本稿では,各ログのトレースを圧縮するために必要な平均ビット数として計算された適合性チェックのためのエントロピー関連尺度を提案する。
エントロピー関連性はログのサイズで線形に計算可能であることを示し、産業環境における新しい手法の適用可能性を示す評価結果を提供する。
論文 参考訳(メタデータ) (2020-07-18T02:25:33Z) - Efficient Conformance Checking using Approximate Alignment Computation
with Tandem Repeats [0.03222802562733786]
コンフォーマンスチェックは、期待されるプロセスの振る舞いをキャプチャするプロセスモデルと、観測された振る舞いを記録する対応するイベントログの違いを発見し、記述することを目的としている。
アライメントは、イベントログ内のトレースと、対応するプロセスモデルの最も近い実行トレースの間の距離を計算するための確立されたテクニックである。
本稿では,前処理と後処理を併用してトレースの長さを圧縮し,アライメントコストを再計算する手法を提案する。
論文 参考訳(メタデータ) (2020-04-02T03:50:32Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。