論文の概要: Trace Encoding in Process Mining: a survey and benchmarking
- arxiv url: http://arxiv.org/abs/2301.02167v1
- Date: Thu, 5 Jan 2023 17:25:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 14:45:00.681000
- Title: Trace Encoding in Process Mining: a survey and benchmarking
- Title(参考訳): プロセスマイニングにおけるトレースエンコーディング:調査とベンチマーク
- Authors: Sylvio Barbon Jr., Paolo Ceravolo, Rafael S. Oyamada, Gabriel M.
Tavares
- Abstract要約: メソッドは、予測プロセス監視、異常なケース検出、クラスタリングトレースなど、いくつかのプロセスマイニングタスクで使用される。
ほとんどの論文では、既存の符号化手法を任意に選択するか、特定の専門家知識ドメインに基づいた戦略を採用する。
この研究は、27のメソッドを比較することで、イベントログエンコーディングに関する包括的な調査を提供することを目的としている。
- 参考スコア(独自算出の注目度): 0.34410212782758054
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Encoding methods are employed across several process mining tasks, including
predictive process monitoring, anomalous case detection, trace clustering, etc.
These methods are usually performed as preprocessing steps and are responsible
for transforming complex information into a numerical feature space. Most
papers choose existing encoding methods arbitrarily or employ a strategy based
on a specific expert knowledge domain. Moreover, existing methods are employed
by using their default hyperparameters without evaluating other options. This
practice can lead to several drawbacks, such as suboptimal performance and
unfair comparisons with the state-of-the-art. Therefore, this work aims at
providing a comprehensive survey on event log encoding by comparing 27 methods,
from different natures, in terms of expressivity, scalability, correlation, and
domain agnosticism. To the best of our knowledge, this is the most
comprehensive study so far focusing on trace encoding in process mining. It
contributes to maturing awareness about the role of trace encoding in process
mining pipelines and sheds light on issues, concerns, and future research
directions regarding the use of encoding methods to bridge the gap between
machine learning models and process mining.
- Abstract(参考訳): エンコーディング手法は、予測プロセス監視、異常ケース検出、トレースクラスタリングなど、いくつかのプロセスマイニングタスクで採用されている。
これらの方法は、通常、前処理ステップとして実行され、複雑な情報を数値的特徴空間に変換する責任がある。
ほとんどの論文は、既存の符号化手法を任意に選択するか、特定の専門家知識ドメインに基づいて戦略を採用する。
さらに、既存のメソッドは、他のオプションを評価することなく、デフォルトのハイパーパラメータを使用する。
この慣行は、準最適性能や最先端との不公平な比較など、いくつかの欠点をもたらす可能性がある。
そこで本研究では,表現性,拡張性,相関性,ドメインに依存しない27の手法を比較し,イベントログエンコーディングに関する包括的な調査を行うことを目的とする。
私たちの知る限りでは、プロセスマイニングにおけるトレースエンコーディングに焦点を当てた、これまでで最も包括的な研究です。
プロセスマイニングパイプラインにおけるトレースエンコーディングの役割に対する意識の成熟に寄与し、機械学習モデルとプロセスマイニングのギャップを埋めるためのエンコーディング手法の使用に関する問題や懸念、今後の研究方向性に光を当てる。
関連論文リスト
- A Thorough Examination of Decoding Methods in the Era of LLMs [76.30313058201182]
復号法は、次世代の予測器から実用的なタスク解決器に言語モデルを変換する上で、必須の役割を果たす。
本稿では,大規模言語モデルの文脈における様々な復号法を包括的かつ多面的に分析する。
その結果,復号法の性能は特にタスク依存的であり,アライメント,モデルサイズ,量子化などの要因に影響されていることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-10T11:14:53Z) - Mining a Minimal Set of Behavioral Patterns using Incremental Evaluation [3.16536213610547]
行動パターンマイニングへの既存のアプローチには2つの制限がある。
まず、インクリメンタルな計算がパターン候補の生成にのみ組み込まれるため、スケーラビリティが制限される。
第二に、マイニングされたパターンに基づくプロセス分析は、実用的なアプリケーションシナリオで得られるパターンが圧倒的に多いため、限られた効果しか示さない。
論文 参考訳(メタデータ) (2024-02-05T11:41:37Z) - Discovering Hierarchical Process Models: an Approach Based on Events
Clustering [0.0]
本稿では,2段階のワークフローネットとして表現される階層的プロセスモデルを発見するアルゴリズムを提案する。
既存のソリューションとは異なり、我々のアルゴリズムはプロセス制御フローに制限を課さず、反復を可能にする。
論文 参考訳(メタデータ) (2023-03-12T11:05:40Z) - Chain of Thought Imitation with Procedure Cloning [129.62135987416164]
本稿では,一連の専門家計算を模倣するために,教師付きシーケンス予測を適用したプロシージャクローニングを提案する。
本研究では、専門家の行動の中間計算を模倣することで、プロシージャのクローン化により、未知の環境構成に顕著な一般化を示すポリシーを学習できることを示す。
論文 参考訳(メタデータ) (2022-05-22T13:14:09Z) - Feature Recommendation for Structural Equation Model Discovery in
Process Mining [0.0]
本稿では,問題に影響を及ぼす可能性のある(集約された)特徴の集合を見つける方法を提案する。
提案手法をProMのプラグインとして実装し、2つの実・合成イベントログを用いて評価した。
論文 参考訳(メタデータ) (2021-08-13T12:23:01Z) - CoCoMoT: Conformance Checking of Multi-Perspective Processes via SMT
(Extended Version) [62.96267257163426]
我々はCoCoMoT(Computing Conformance Modulo Theories)フレームワークを紹介する。
まず、純粋な制御フロー設定で研究したSATベースのエンコーディングを、データ認識ケースに持ち上げる方法を示す。
次に,プロパティ保存型クラスタリングの概念に基づく新しい前処理手法を提案する。
論文 参考訳(メタデータ) (2021-03-18T20:22:50Z) - Process Comparison Using Object-Centric Process Cubes [69.68068088508505]
実生活のビジネスプロセスでは、プロセス全体を複雑に解釈しがちな振る舞いが存在します。
プロセス比較は、プロセスキューブを使用して、プロセスの異なる動作を互いに分離するプロセスマイニングのブランチです。
オブジェクト中心のイベントログのスライスやダイスなどのプロセスキューブ操作をサポートするプロセスキューブフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T10:08:28Z) - Using Sampling Strategy to Assist Consensus Sequence Analysis [3.983901161231557]
本稿では,代表的コンセンサスシーケンスを生成するために必要なトレース数を決定するための新しいサンプリング手法を提案する。
事前に定義されたエキスパートモデルと実際のプロセスとの差を推定する方法を示す。
論文 参考訳(メタデータ) (2020-08-19T07:12:09Z) - Process Discovery for Structured Program Synthesis [70.29027202357385]
プロセスマイニングにおける中核的なタスクは、イベントログデータから正確なプロセスモデルを学ぶことを目的としたプロセス発見である。
本稿では,ターゲットプロセスモデルとして(ブロック-)構造化プログラムを直接使用することを提案する。
我々は,このような構造化プログラムプロセスモデルの発見に対して,新たなボトムアップ・アグリメティブ・アプローチを開発する。
論文 参考訳(メタデータ) (2020-08-13T10:33:10Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。