論文の概要: Model-driven Stochastic Trace Clustering
- arxiv url: http://arxiv.org/abs/2506.23776v1
- Date: Mon, 30 Jun 2025 12:18:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:54.047874
- Title: Model-driven Stochastic Trace Clustering
- Title(参考訳): モデル駆動確率的トレースクラスタリング
- Authors: Jari Peeperkorn, Johannes De Smedt, Jochen De Weerdt,
- Abstract要約: プロセス発見アルゴリズムは、イベントログからプロセスモデルを自動的に抽出する。
高い可変性は、しばしば複雑で理解しにくいモデルをもたらす。
モデル駆動のトレースクラスタリングは、クラスタ固有のプロセスモデルへの適合性に基づいて、トレースをクラスタに割り当てることで、これを改善する。
- 参考スコア(独自算出の注目度): 5.373182035720355
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Process discovery algorithms automatically extract process models from event logs, but high variability often results in complex and hard-to-understand models. To mitigate this issue, trace clustering techniques group process executions into clusters, each represented by a simpler and more understandable process model. Model-driven trace clustering improves on this by assigning traces to clusters based on their conformity to cluster-specific process models. However, most existing clustering techniques rely on either no process model discovery, or non-stochastic models, neglecting the frequency or probability of activities and transitions, thereby limiting their capability to capture real-world execution dynamics. We propose a novel model-driven trace clustering method that optimizes stochastic process models within each cluster. Our approach uses entropic relevance, a stochastic conformance metric based on directly-follows probabilities, to guide trace assignment. This allows clustering decisions to consider both structural alignment with a cluster's process model and the likelihood that a trace originates from a given stochastic process model. The method is computationally efficient, scales linearly with input size, and improves model interpretability by producing clusters with clearer control-flow patterns. Extensive experiments on public real-life datasets show that our method outperforms existing alternatives in representing process behavior and reveals how clustering performance rankings can shift when stochasticity is considered.
- Abstract(参考訳): プロセス発見アルゴリズムは、イベントログからプロセスモデルを自動的に抽出するが、高い可変性はしばしば複雑で理解しにくいモデルをもたらす。
この問題を軽減するため、トレースクラスタリング技術はクラスタにプロセスをグループ化し、それぞれがよりシンプルで理解しやすいプロセスモデルによって表現される。
モデル駆動のトレースクラスタリングは、クラスタ固有のプロセスモデルへの適合性に基づいて、トレースをクラスタに割り当てることで、これを改善する。
しかし、既存のクラスタリング技術のほとんどはプロセスモデル発見や非確率モデルに頼らず、アクティビティやトランジションの頻度や確率を無視して、実際の実行ダイナミクスをキャプチャする能力を制限する。
本稿では,各クラスタ内の確率的プロセスモデルを最適化する,新しいモデル駆動トレースクラスタリング手法を提案する。
提案手法では, 直接追従確率に基づく確率的適合度尺度であるエントロピック関連度を用いて, トレース割り当てを導出する。
これによりクラスタ化の決定は、クラスタのプロセスモデルと構造的なアライメントと、トレースが所定の確率的プロセスモデルに由来する可能性の両方を考慮することができる。
計算効率が高く、入力サイズと線形にスケールし、より明確な制御フローパターンのクラスタを生成することにより、モデルの解釈性を向上させる。
パブリックな実生活データセットに対する大規模な実験により、我々の手法はプロセスの振る舞いを表現する既存の方法よりも優れており、クラスタリング性能ランキングが確率性を考慮したときにどのようにシフトするかを明らかにしている。
関連論文リスト
- A system identification approach to clustering vector autoregressive time series [50.66782357329375]
基礎となる力学に基づく時系列のクラスタ化は、複雑なシステムモデリングを支援するために研究者を惹きつけている。
現在の時系列クラスタリング手法のほとんどは、スカラー時系列のみを処理し、ホワイトノイズとして扱うか、高品質な特徴構築のためにドメイン知識に依存している。
システム識別アプローチは、機能/測定構造に頼るのではなく、基礎となる自己回帰力学を明示的に考慮することで、ベクトル時系列クラスタリングを処理できる。
論文 参考訳(メタデータ) (2025-05-20T14:31:44Z) - Merging Models on the Fly Without Retraining: A Sequential Approach to Scalable Continual Model Merging [75.93960998357812]
ディープモデルマージ(Deep Modelmerging)は、複数の微調整モデルを組み合わせて、さまざまなタスクやドメインにまたがる能力を活用する、新たな研究方向を示すものだ。
現在のモデルマージ技術は、全ての利用可能なモデルを同時にマージすることに集中しており、重量行列に基づく手法が主要なアプローチである。
本稿では,モデルを逐次処理するトレーニングフリーなプロジェクションベース連続マージ手法を提案する。
論文 参考訳(メタデータ) (2025-01-16T13:17:24Z) - GCC: Generative Calibration Clustering [55.44944397168619]
本稿では,特徴学習と拡張をクラスタリングに組み込む新しいGCC法を提案する。
まず,実検体と実検体間の固有関係を識別する識別的特徴アライメント機構を開発する。
第二に、より信頼性の高いクラスタ割り当てを生成するための自己教師付きメトリック学習を設計する。
論文 参考訳(メタデータ) (2024-04-14T01:51:11Z) - Time series clustering based on prediction accuracy of global
forecasting models [0.0]
本稿では,時系列のモデルに基づくクラスタリング手法を提案する。
文献で提案されているほとんどの手法とは異なり、この手法はクラスタリング分割を構成する主要な要素として予測精度を考慮している。
シミュレーション実験により,クラスタリングの有効性と予測精度の両面で,本手法はいくつかの代替手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-04-30T13:12:19Z) - A parallelizable model-based approach for marginal and multivariate
clustering [0.0]
本稿では,モデルに基づくクラスタリングの頑健さを生かしたクラスタリング手法を提案する。
我々は、各マージンごとに異なる数のクラスタを持つことができる有限混合モデルを指定することで、この問題に対処する。
提案手法は、完全な(結合した)モデルベースのクラスタリング手法よりも、中程度から高次元の処理に適するだけでなく、計算的にも魅力的である。
論文 参考訳(メタデータ) (2022-12-07T23:54:41Z) - Unified Multi-View Orthonormal Non-Negative Graph Based Clustering
Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。
また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文 参考訳(メタデータ) (2022-11-03T08:18:27Z) - clusterBMA: Bayesian model averaging for clustering [1.2021605201770345]
本稿では、教師なしクラスタリングアルゴリズムの結果の重み付きモデル平均化を可能にするクラスタBMAを提案する。
クラスタリング内部検証基準を用いて、各モデルの結果の重み付けに使用される後続モデル確率の近似を開発する。
シミュレーションデータ上での他のアンサンブルクラスタリングメソッドのパフォーマンスに加えて、クラスタBMAは平均クラスタへの確率的アロケーションを含むユニークな機能を提供する。
論文 参考訳(メタデータ) (2022-09-09T04:55:20Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z) - Active and sparse methods in smoothed model checking [2.28438857884398]
スパース変分法とアクティブラーニングに基づくモデルチェックの平滑化の拡張について検討する。
スパース変分ガウス過程推論アルゴリズムのオンライン拡張は、スムーズなモデル検査のための能動的学習手法を実装するためのスケーラブルな方法を提供する。
論文 参考訳(メタデータ) (2021-04-20T13:03:25Z) - Unsupervised clustering of series using dynamic programming and neural
processes [0.0]
各クラスタに存在するブロックが、事前に定義されたモデル構造に対して一貫性があるように、シリーズをセグメント化してクラスタ化したい。
実行可能なモデルの統合を可能にし、クラスタリングタスクを支援するためにデータ駆動アプローチを1つの近似モデルに適応する一般的なフレームワークを確立することが有用である。
本研究では、arXiv:2101.09512で示されるアルゴリズムで求められる仮定を導出しながら、近似モデルを構築するためのニューラルネットワークプロセスの使用を検討する。
論文 参考訳(メタデータ) (2021-01-26T18:17:10Z) - Progressive Cluster Purification for Unsupervised Feature Learning [48.87365358296371]
教師なしの特徴学習では、サンプル特異性に基づく手法はクラス間の情報を無視する。
本稿では,プログレッシブクラスタ形成時にクラス不整合サンプルを除外するクラスタリングに基づく新しい手法を提案する。
我々の手法は、プログレッシブ・クラスタ・パーフィケーション(PCP)と呼ばれ、訓練中に徐々にクラスタ数を減らし、プログレッシブ・クラスタリングを実装している。
論文 参考訳(メタデータ) (2020-07-06T08:11:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。