論文の概要: Generating the Traces You Need: A Conditional Generative Model for Process Mining Data
- arxiv url: http://arxiv.org/abs/2411.02131v1
- Date: Mon, 04 Nov 2024 14:44:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:48:59.950016
- Title: Generating the Traces You Need: A Conditional Generative Model for Process Mining Data
- Title(参考訳): 必要なトレースを生成する: プロセスマイニングデータの条件付き生成モデル
- Authors: Riccardo Graziosi, Massimiliano Ronzani, Andrei Buliga, Chiara Di Francescomarino, Francesco Folino, Chiara Ghidini, Francesca Meneghello, Luigi Pontieri,
- Abstract要約: 条件付き変分オートエンコーダ(CVAE)に基づくプロセスデータ生成のための条件付きモデルを提案する。
プロセスマイニングのためのCVAEは、データの多面的性質と制御フロールールに従う必要性のために、特定の課題に直面している。
- 参考スコア(独自算出の注目度): 10.914597458295248
- License:
- Abstract: In recent years, trace generation has emerged as a significant challenge within the Process Mining community. Deep Learning (DL) models have demonstrated accuracy in reproducing the features of the selected processes. However, current DL generative models are limited in their ability to adapt the learned distributions to generate data samples based on specific conditions or attributes. This limitation is particularly significant because the ability to control the type of generated data can be beneficial in various contexts, enabling a focus on specific behaviours, exploration of infrequent patterns, or simulation of alternative 'what-if' scenarios. In this work, we address this challenge by introducing a conditional model for process data generation based on a conditional variational autoencoder (CVAE). Conditional models offer control over the generation process by tuning input conditional variables, enabling more targeted and controlled data generation. Unlike other domains, CVAE for process mining faces specific challenges due to the multiperspective nature of the data and the need to adhere to control-flow rules while ensuring data variability. Specifically, we focus on generating process executions conditioned on control flow and temporal features of the trace, allowing us to produce traces for specific, identified sub-processes. The generated traces are then evaluated using common metrics for generative model assessment, along with additional metrics to evaluate the quality of the conditional generation
- Abstract(参考訳): 近年、プロセスマイニングコミュニティにおいて、トレース生成が重要な課題として浮上している。
ディープラーニング(DL)モデルは、選択したプロセスの特徴を再現する精度を実証している。
しかし、現在のDL生成モデルは、学習した分布に適応して特定の条件や属性に基づいてデータサンプルを生成する能力に制限されている。
この制限は、生成したデータのタイプを制御する能力が、特定の振る舞い、頻繁なパターンの探索、代替の"What-if"シナリオのシミュレーションを可能にする、さまざまな状況において有益なものであるため、特に重要である。
本研究では,条件付き変分オートエンコーダ(CVAE)に基づくプロセスデータ生成のための条件モデルを導入することで,この問題に対処する。
条件付きモデルは入力条件変数をチューニングすることで生成プロセスの制御を提供し、よりターゲットと制御されたデータ生成を可能にする。
他のドメインとは異なり、プロセスマイニングのためのCVAEは、データの多面的な性質と、データのばらつきを確保しながら制御フロールールに従う必要があるため、特定の課題に直面している。
具体的には、制御フローとトレースの時間的特徴に基づいてプロセスの実行を生成することに集中し、特定されたサブプロセスのトレースを生成する。
生成したトレースは、生成モデル評価のための共通指標と、条件生成の品質を評価するための追加指標を用いて評価される。
関連論文リスト
- A Dataset for Evaluating Online Anomaly Detection Approaches for Discrete Multivariate Time Series [0.01874930567916036]
現在の公開データセットは小さすぎるため、多様ではない。
我々は、最先端のシミュレーションツールによって生成される多種多様な、広範囲で、非自明なデータセットという解決策を提案する。
トレーニングとテストサブセットが汚染された、クリーンなバージョンで提供されるように、データセットのさまざまなバージョンを利用可能にしています。
予想通り、ベースライン実験では、データセットの半教師付きバージョンでトレーニングされたアプローチが、教師なしバージョンよりも優れていた。
論文 参考訳(メタデータ) (2024-11-21T09:03:12Z) - Plug-and-Play Controllable Generation for Discrete Masked Models [27.416952690340903]
本稿では、離散データ制御可能な生成モデリングのための離散マスクモデルについて述べる。
本稿では,条件付きスコアのトレーニングを回避した重要サンプリングに基づく新しいプラグアンドプレイフレームワークを提案する。
本フレームワークは,制御基準の選択に非依存であり,勾配情報を必要としないため,後方サンプリングやベイズ逆問題,制約生成などのタスクに適している。
論文 参考訳(メタデータ) (2024-10-03T02:00:40Z) - Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.02070962797794]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。
本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Heat Death of Generative Models in Closed-Loop Learning [63.83608300361159]
本研究では、独自の学習データセットに加えて、生成したコンテンツをフィードバックする生成モデルの学習ダイナミクスについて検討する。
各イテレーションで十分な量の外部データが導入されない限り、非自明な温度がモデルを退化させることを示す。
論文 参考訳(メタデータ) (2024-04-02T21:51:39Z) - Controllable Data Generation Via Iterative Data-Property Mutual Mappings [13.282793266390316]
本稿では,VAEベースのデータジェネレータを特性制御性で拡張し,乱れを確実にするフレームワークを提案する。
提案フレームワークは, 特性誤差, ゆがみ, 生成品質, トレーニング時間に関する性能評価を行うために, VAEベースの4つの制御可能ジェネレータ上に実装されている。
論文 参考訳(メタデータ) (2023-10-11T17:34:56Z) - TimeVAE: A Variational Auto-Encoder for Multivariate Time Series
Generation [6.824692201913679]
可変オートエンコーダ(VAE)を用いて時系列データを合成生成する新しいアーキテクチャを提案する。
提案されたアーキテクチャには、解釈可能性、ドメイン知識をエンコードする能力、トレーニング時間の短縮など、いくつかの異なる特性がある。
論文 参考訳(メタデータ) (2021-11-15T21:42:14Z) - Validation Methods for Energy Time Series Scenarios from Deep Generative
Models [55.41644538483948]
一般的なシナリオ生成アプローチでは、データ分散に関する前提なしにシナリオを生成するディープ生成モデル(DGM)を使用する。
エネルギーシナリオ生成文献における現在使われている検証手法の批判的評価を行う。
過去のデータと生成されたデータの両方に4つの検証手法を適用し、検証結果の解釈と、一般的な誤り、落とし穴、検証方法の限界について議論する。
論文 参考訳(メタデータ) (2021-10-27T14:14:25Z) - Generating Multivariate Load States Using a Conditional Variational
Autoencoder [11.557259513691239]
本稿では,条件付き可変オートエンコーダ(CVAE)ニューラルネットワークを提案する。
このモデルは与えられた潜在ベクトルの下での出力サンプルの潜時変化を含み、この出力変数のパラメータを共最適化する。
実験により、提案したジェネレータは、他のデータ生成メカニズムより優れていることが示された。
論文 参考訳(メタデータ) (2021-10-21T19:07:04Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Conditional Hybrid GAN for Sequence Generation [56.67961004064029]
本稿では,この問題を解決するための条件付きハイブリッドGAN(C-Hybrid-GAN)を提案する。
我々はGumbel-Softmax法を利用して離散値列の分布を近似する。
提案したC-Hybrid-GANは、文脈条件付き離散値シーケンス生成において既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-18T03:52:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。