論文の概要: What Averages Do Not Tell -- Predicting Real Life Processes with
Sequential Deep Learning
- arxiv url: http://arxiv.org/abs/2110.10225v1
- Date: Tue, 19 Oct 2021 19:45:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-22 17:38:09.629221
- Title: What Averages Do Not Tell -- Predicting Real Life Processes with
Sequential Deep Learning
- Title(参考訳): 平均が教えてくれないもの - シークエンシャルディープラーニングによる実生活のプロセス予測
- Authors: Istv\'an Ketyk\'o, Felix Mannhardt, Marwan Hassani, Boudewijn van
Dongen
- Abstract要約: プロセスマイニング(Process Mining)は、システムによってログされた実行データからビジネスプロセスに関する洞察を発見すること。
多くのディープラーニング技術が、プロセス結果の予測を目的とした予測プロセスマイニングに成功している。
プロセスマイニングのトレースはマルチモーダルシーケンスであり、自然言語の文や画像とは全く異なる構造である。
- 参考スコア(独自算出の注目度): 0.1376408511310322
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep Learning is proven to be an effective tool for modeling sequential data
as shown by the success in Natural Language, Computer Vision and Signal
Processing. Process Mining concerns discovering insights on business processes
from their execution data that are logged by supporting information systems.
The logged data (event log) is formed of event sequences (traces) that
correspond to executions of a process. Many Deep Learning techniques have been
successfully adapted for predictive Process Mining that aims to predict process
outcomes, remaining time, the next event, or even the suffix of running traces.
Traces in Process Mining are multimodal sequences and very differently
structured than natural language sentences or images. This may require a
different approach to processing. So far, there has been little focus on these
differences and the challenges introduced. Looking at suffix prediction as the
most challenging of these tasks, the performance of Deep Learning models was
evaluated only on average measures and for a small number of real-life event
logs. Comparing the results between papers is difficult due to different
pre-processing and evaluation strategies. Challenges that may be relevant are
the skewness of trace-length distribution and the skewness of the activity
distribution in real-life event logs. We provide an end-to-end framework which
enables to compare the performance of seven state-of-the-art sequential
architectures in common settings. Results show that sequence modeling still has
a lot of room for improvement for majority of the more complex datasets.
Further research and insights are required to get consistent performance not
just in average measures but additionally over all the prefixes.
- Abstract(参考訳): ディープラーニングは、自然言語、コンピュータビジョン、信号処理の成功によって示されているように、シーケンシャルデータのモデリングに有効なツールであることが証明されている。
プロセスマイニング(Process Mining)は、情報システムのサポートによってログされる実行データからビジネスプロセスに関する洞察を発見すること。
ログ化されたデータ(イベントログ)は、プロセスの実行に対応するイベントシーケンス(トレース)で構成されています。
多くのディープラーニング技術が、プロセスの結果、残り時間、次のイベント、さらには実行中のトレースのサフィックスを予測することを目的とした予測プロセスマイニングにうまく適応している。
プロセスマイニングの痕跡はマルチモーダルシーケンスであり、自然言語文や画像とは全く異なる構造である。
これは処理に異なるアプローチを必要とするかもしれない。
これまでのところ、これらの違いと導入される課題にはほとんど焦点が当てられていない。
suffix予測をこれらのタスクの最も難しい課題として捉えると、ディープラーニングモデルのパフォーマンスは、平均的な測定値と少数の実際のイベントログでのみ評価された。
論文間の比較は,前処理と評価戦略の違いから困難である。
関連する課題は、トレース長分布の歪度と実際のイベントログにおけるアクティビティ分布の歪度である。
7つの最先端シーケンシャルアーキテクチャのパフォーマンスを共通設定で比較可能なエンドツーエンドフレームワークを提供する。
結果から、より複雑なデータセットの大部分に対して、シーケンスモデリングには改善の余地がまだたくさんあることが分かる。
平均的な測定値だけでなく、すべてのプレフィックスに対して一貫したパフォーマンスを得るには、さらなる研究と洞察が必要です。
関連論文リスト
- EBES: Easy Benchmarking for Event Sequences [17.277513178760348]
イベントシーケンスは、ヘルスケア、ファイナンス、ユーザインタラクションログなど、さまざまな現実世界のドメインにおける一般的なデータ構造である。
時間データモデリング技術の進歩にもかかわらず、イベントシーケンスのパフォーマンスを評価するための標準ベンチマークは存在しない。
標準化された評価シナリオとプロトコルを備えた総合的なベンチマークツールであるEBESを紹介する。
論文 参考訳(メタデータ) (2024-10-04T13:03:43Z) - Denoising Pre-Training and Customized Prompt Learning for Efficient Multi-Behavior Sequential Recommendation [69.60321475454843]
マルチビヘイビアシークエンシャルレコメンデーションに適した,最初の事前学習および迅速な学習パラダイムであるDPCPLを提案する。
事前学習段階において,複数の時間スケールでノイズを除去する新しい行動マイナ (EBM) を提案する。
次に,提案するCustomized Prompt Learning (CPL)モジュールを用いて,事前学習したモデルを高効率にチューニングすることを提案する。
論文 参考訳(メタデータ) (2024-08-21T06:48:38Z) - Avoiding Post-Processing with Event-Based Detection in Biomedical
Signals [69.34035527763916]
学習対象としてイベントを直接扱うイベントベースのモデリングフレームワークを提案する。
イベントベースのモデリング(後処理なし)は、広範囲な後処理を伴うエポックベースのモデリングと同等以上のパフォーマンスを示す。
論文 参考訳(メタデータ) (2022-09-22T13:44:13Z) - Process-BERT: A Framework for Representation Learning on Educational
Process Data [68.8204255655161]
本稿では,教育プロセスデータの表現を学習するためのフレームワークを提案する。
我々のフレームワークは、BERT型の目的を用いて、シーケンシャルなプロセスデータから表現を学習する事前学習ステップで構成されています。
当社のフレームワークは,2019年国のレポートカードデータマイニングコンペティションデータセットに適用しています。
論文 参考訳(メタデータ) (2022-04-28T16:07:28Z) - ProcessTransformer: Predictive Business Process Monitoring with
Transformer Network [0.06445605125467573]
本稿では,イベントログから高レベル表現を注目ネットワークで学習するプロセストランスフォーマーを提案する。
本モデルでは,複数イベントシーケンスと対応する出力の依存関係を確立するための自己保持機構を,長期記憶に取り入れた。
論文 参考訳(メタデータ) (2021-04-01T18:58:46Z) - Subtask Analysis of Process Data Through a Predictive Model [5.7668512557707166]
本稿では,そのようなプロセスデータの探索的解析のための計算効率の良い手法を開発した。
新しいアプローチでは、長い個々のプロセスを短いサブプロセスのシーケンスに分割することで、複雑性の低減を実現している。
PIAAC 2012のプロセスデータを用いて、新しいアプローチでプロセスデータの探索分析がどのように行えるかを示す。
論文 参考訳(メタデータ) (2020-08-29T21:11:01Z) - Process Discovery for Structured Program Synthesis [70.29027202357385]
プロセスマイニングにおける中核的なタスクは、イベントログデータから正確なプロセスモデルを学ぶことを目的としたプロセス発見である。
本稿では,ターゲットプロセスモデルとして(ブロック-)構造化プログラムを直接使用することを提案する。
我々は,このような構造化プログラムプロセスモデルの発見に対して,新たなボトムアップ・アグリメティブ・アプローチを開発する。
論文 参考訳(メタデータ) (2020-08-13T10:33:10Z) - Temporally Correlated Task Scheduling for Sequence Learning [143.70523777803723]
多くのアプリケーションにおいて、シーケンス学習タスクは通常、複数の時間的に相関した補助タスクと関連付けられている。
シーケンス学習に学習可能なスケジューラを導入し、トレーニングのための補助的なタスクを適応的に選択できる。
本手法は,同時翻訳とストックトレンド予測の性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-07-10T10:28:54Z) - Multi-Task Learning for Dense Prediction Tasks: A Survey [87.66280582034838]
マルチタスク学習(MTL)技術は、性能、計算、メモリフットプリントに関する有望な結果を示している。
我々は、コンピュータビジョンにおけるMLLのための最先端のディープラーニングアプローチについて、よく理解された視点を提供する。
論文 参考訳(メタデータ) (2020-04-28T09:15:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。