論文の概要: Trace Encoding in Process Mining: a survey and benchmarking
- arxiv url: http://arxiv.org/abs/2301.02167v1
- Date: Thu, 5 Jan 2023 17:25:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 14:45:00.681000
- Title: Trace Encoding in Process Mining: a survey and benchmarking
- Title(参考訳): プロセスマイニングにおけるトレースエンコーディング:調査とベンチマーク
- Authors: Sylvio Barbon Jr., Paolo Ceravolo, Rafael S. Oyamada, Gabriel M.
Tavares
- Abstract要約: メソッドは、予測プロセス監視、異常なケース検出、クラスタリングトレースなど、いくつかのプロセスマイニングタスクで使用される。
ほとんどの論文では、既存の符号化手法を任意に選択するか、特定の専門家知識ドメインに基づいた戦略を採用する。
この研究は、27のメソッドを比較することで、イベントログエンコーディングに関する包括的な調査を提供することを目的としている。
- 参考スコア(独自算出の注目度): 0.34410212782758054
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Encoding methods are employed across several process mining tasks, including
predictive process monitoring, anomalous case detection, trace clustering, etc.
These methods are usually performed as preprocessing steps and are responsible
for transforming complex information into a numerical feature space. Most
papers choose existing encoding methods arbitrarily or employ a strategy based
on a specific expert knowledge domain. Moreover, existing methods are employed
by using their default hyperparameters without evaluating other options. This
practice can lead to several drawbacks, such as suboptimal performance and
unfair comparisons with the state-of-the-art. Therefore, this work aims at
providing a comprehensive survey on event log encoding by comparing 27 methods,
from different natures, in terms of expressivity, scalability, correlation, and
domain agnosticism. To the best of our knowledge, this is the most
comprehensive study so far focusing on trace encoding in process mining. It
contributes to maturing awareness about the role of trace encoding in process
mining pipelines and sheds light on issues, concerns, and future research
directions regarding the use of encoding methods to bridge the gap between
machine learning models and process mining.
- Abstract(参考訳): エンコーディング手法は、予測プロセス監視、異常ケース検出、トレースクラスタリングなど、いくつかのプロセスマイニングタスクで採用されている。
これらの方法は、通常、前処理ステップとして実行され、複雑な情報を数値的特徴空間に変換する責任がある。
ほとんどの論文は、既存の符号化手法を任意に選択するか、特定の専門家知識ドメインに基づいて戦略を採用する。
さらに、既存のメソッドは、他のオプションを評価することなく、デフォルトのハイパーパラメータを使用する。
この慣行は、準最適性能や最先端との不公平な比較など、いくつかの欠点をもたらす可能性がある。
そこで本研究では,表現性,拡張性,相関性,ドメインに依存しない27の手法を比較し,イベントログエンコーディングに関する包括的な調査を行うことを目的とする。
私たちの知る限りでは、プロセスマイニングにおけるトレースエンコーディングに焦点を当てた、これまでで最も包括的な研究です。
プロセスマイニングパイプラインにおけるトレースエンコーディングの役割に対する意識の成熟に寄与し、機械学習モデルとプロセスマイニングのギャップを埋めるためのエンコーディング手法の使用に関する問題や懸念、今後の研究方向性に光を当てる。
関連論文リスト
- Boosting CNN-based Handwriting Recognition Systems with Learnable Relaxation Labeling [48.78361527873024]
本稿では,2つの異なる手法の強みを組み込んだ手書き文字認識手法を提案する。
本稿では,アルゴリズムの収束を加速し,システム全体の性能を向上させるスペーシフィケーション手法を提案する。
論文 参考訳(メタデータ) (2024-09-09T15:12:28Z) - A Scalable and Near-Optimal Conformance Checking Approach for Long Traces [3.3170150440851485]
プロセスマイニングにおける重要なタスクであるコンフォーマルティチェックは、最適なアライメントを見つけるという指数関数的な複雑さのため、計算不能になる可能性がある。
本稿では,これらの拡張性に対処する新しいスライディングウインドウ手法を提案する。
トレースを管理可能なサブトレースに分割し,プロセスモデルと反復的に整列することにより,検索空間を大幅に削減する。
論文 参考訳(メタデータ) (2024-06-08T11:04:42Z) - Process Variant Analysis Across Continuous Features: A Novel Framework [0.0]
本研究は, 業務プロセスにおけるケースの効果的セグメンテーションの課題に対処する。
本研究では,スライディングウインドウ手法と地球移動器の距離を併用して制御流の挙動変化を検出する手法を提案する。
オランダの保険会社UWVと共同で実生活事例研究を行い,その方法論を検証した。
論文 参考訳(メタデータ) (2024-05-06T16:10:13Z) - A Thorough Examination of Decoding Methods in the Era of LLMs [72.65956436513241]
復号法は、次世代の予測器から実用的なタスク解決器に言語モデルを変換する上で、必須の役割を果たす。
本稿では,大規模言語モデルの文脈における様々な復号法を包括的かつ多面的に分析する。
その結果,復号法の性能は特にタスク依存的であり,アライメント,モデルサイズ,量子化などの要因に影響されていることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-10T11:14:53Z) - Discovering Hierarchical Process Models: an Approach Based on Events
Clustering [0.0]
本稿では,2段階のワークフローネットとして表現される階層的プロセスモデルを発見するアルゴリズムを提案する。
既存のソリューションとは異なり、我々のアルゴリズムはプロセス制御フローに制限を課さず、反復を可能にする。
論文 参考訳(メタデータ) (2023-03-12T11:05:40Z) - Feature Recommendation for Structural Equation Model Discovery in
Process Mining [0.0]
本稿では,問題に影響を及ぼす可能性のある(集約された)特徴の集合を見つける方法を提案する。
提案手法をProMのプラグインとして実装し、2つの実・合成イベントログを用いて評価した。
論文 参考訳(メタデータ) (2021-08-13T12:23:01Z) - CoCoMoT: Conformance Checking of Multi-Perspective Processes via SMT
(Extended Version) [62.96267257163426]
我々はCoCoMoT(Computing Conformance Modulo Theories)フレームワークを紹介する。
まず、純粋な制御フロー設定で研究したSATベースのエンコーディングを、データ認識ケースに持ち上げる方法を示す。
次に,プロパティ保存型クラスタリングの概念に基づく新しい前処理手法を提案する。
論文 参考訳(メタデータ) (2021-03-18T20:22:50Z) - Process Comparison Using Object-Centric Process Cubes [69.68068088508505]
実生活のビジネスプロセスでは、プロセス全体を複雑に解釈しがちな振る舞いが存在します。
プロセス比較は、プロセスキューブを使用して、プロセスの異なる動作を互いに分離するプロセスマイニングのブランチです。
オブジェクト中心のイベントログのスライスやダイスなどのプロセスキューブ操作をサポートするプロセスキューブフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T10:08:28Z) - Process Discovery for Structured Program Synthesis [70.29027202357385]
プロセスマイニングにおける中核的なタスクは、イベントログデータから正確なプロセスモデルを学ぶことを目的としたプロセス発見である。
本稿では,ターゲットプロセスモデルとして(ブロック-)構造化プログラムを直接使用することを提案する。
我々は,このような構造化プログラムプロセスモデルの発見に対して,新たなボトムアップ・アグリメティブ・アプローチを開発する。
論文 参考訳(メタデータ) (2020-08-13T10:33:10Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。