論文の概要: Case ID detection based on time series data -- the mining use case
- arxiv url: http://arxiv.org/abs/2410.23846v1
- Date: Thu, 31 Oct 2024 11:55:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-01 16:59:49.994779
- Title: Case ID detection based on time series data -- the mining use case
- Title(参考訳): 時系列データに基づくケースID検出 -鉱業事例-
- Authors: Edyta Brzychczy, Tomasz Pełech-Pilichowski, Ziemowit Dworakowski,
- Abstract要約: 本稿では,選択変数の短期平均値の有意な変化を識別し,ケースIDを検出することに基づく,新しいルールに基づく識別パターンのアルゴリズムを提案する。
実験の結果、ほとんどのケースで開発されたアルゴリズムは、アウトリーチのないデータセットのIDを正しく検出し、それぞれ96.8%と97%のスコアに達した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Process mining gains increasing popularity in business process analysis, also in heavy industry. It requires a specific data format called an event log, with the basic structure including a case identifier (case ID), activity (event) name, and timestamp. In the case of industrial processes, data is very often provided by a monitoring system as time series of low level sensor readings. This data cannot be directly used for process mining since there is no explicit marking of activities in the event log, and sometimes, case ID is not provided. We propose a novel rule-based algorithm for identification patterns, based on the identification of significant changes in short-term mean values of selected variable to detect case ID. We present our solution on the mining use case. We compare computed results (identified patterns) with expert labels of the same dataset. Experiments show that the developed algorithm in the most of the cases correctly detects IDs in datasets with and without outliers reaching F1 score values: 96.8% and 97% respectively. We also evaluate our algorithm on dataset from manufacturing domain reaching value 92.6% for F1 score.
- Abstract(参考訳): プロセスマイニングは、ビジネス・プロセス・アナリティクスや重工業でも人気が高まっている。
ケース識別子(ケースID)、アクティビティ(イベント)名、タイムスタンプを含む基本的な構造を持つ、イベントログと呼ばれる特定のデータフォーマットが必要です。
産業プロセスの場合、データは低レベルのセンサー読み取りの時系列として監視システムによって提供されることが多い。
このデータは、イベントログにアクティビティの明示的なマーキングがなく、ケースIDが提供されないため、直接プロセスマイニングには使用できない。
本稿では,選択変数の短期平均値の有意な変化を識別し,ケースIDを検出することに基づく,新しいルールに基づく識別パターンのアルゴリズムを提案する。
我々は鉱業のユースケースに解決策を提示する。
計算結果(同定されたパターン)を、同じデータセットのエキスパートラベルと比較する。
実験の結果、ほとんどのケースで開発されたアルゴリズムは、アウトリーチのないデータセットのIDを正しく検出し、それぞれ96.8%と97%のスコアに達した。
また、F1スコアの92.6%に到達した製造領域のデータセットについて、本アルゴリズムの評価を行った。
関連論文リスト
- Event Detection via Probability Density Function Regression [0.0]
本研究では、時間間隔定義イベント検出問題を再編成する一般化回帰に基づく手法を提案する。
コンピュータビジョンからの熱マップ回帰技術にインスパイアされた本手法は,事象発生時の確率密度を予測することを目的としている。
回帰に基づくアプローチは,様々な最先端のベースラインネットワークやデータセットのセグメンテーションに基づく手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-08-23T01:58:56Z) - Detecting Anomalous Events in Object-centric Business Processes via
Graph Neural Networks [55.583478485027]
本研究では,ビジネスプロセスにおける異常検出のための新しいフレームワークを提案する。
まず、属性グラフとしてオブジェクト中心のイベントログのプロセス依存性を再構築する。
次に、異常事象を検出するために、グラフ畳み込みオートエンコーダアーキテクチャを用いる。
論文 参考訳(メタデータ) (2024-02-14T14:17:56Z) - A Machine Learning-based Algorithm for Automated Detection of
Frequency-based Events in Recorded Time Series of Sensor Data [0.0]
本研究では,時系列データ中の周波数に基づく事象を識別する新しい事象検出手法を提案する。
時系列データを解析するためには、訓練対象検出モデルを用いて頭蓋骨内にイベントを検出することができる。
このアルゴリズムは未知のデータセットに基づいて評価され、イベント検出の精度は0.97である。
論文 参考訳(メタデータ) (2023-10-16T21:35:23Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Applications of Signature Methods to Market Anomaly Detection [1.911678487931003]
本稿では,特徴抽出器としてのシグネチャやランダム化シグネチャの異常検出アルゴリズムへの応用について述べる。
暗号通貨市場からの取引データを用いて実生活のアプリケーションを示す。
この場合、F1スコアが最大88%のソーシャルネットワーク上で組織されたポンプとダンプの試行を特定できる。
論文 参考訳(メタデータ) (2022-01-07T13:05:43Z) - Robust Event Classification Using Imperfect Real-world PMU Data [58.26737360525643]
本研究では,不完全な実世界のファサー計測単位(PMU)データを用いて,ロバストな事象分類について検討する。
我々は、堅牢なイベント分類器を訓練するための新しい機械学習フレームワークを開発する。
論文 参考訳(メタデータ) (2021-10-19T17:41:43Z) - Detecting Handwritten Mathematical Terms with Sensor Based Data [71.84852429039881]
本稿では,手書きの数学的用語を自動分類する,スタビロによるUbiComp 2021チャレンジの解を提案する。
入力データセットには異なるライターのデータが含まれており、ラベル文字列は合計15の異なる文字から構成されている。
論文 参考訳(メタデータ) (2021-09-12T19:33:34Z) - Self-Attentive Classification-Based Anomaly Detection in Unstructured
Logs [59.04636530383049]
ログ表現を学習するための分類法であるLogsyを提案する。
従来の方法と比較して,F1スコアの平均0.25の改善を示す。
論文 参考訳(メタデータ) (2020-08-21T07:26:55Z) - Privacy-Preserving Distributed Learning in the Analog Domain [23.67685616088422]
計算サーバからデータをプライベートに保ちながら、データよりも分散学習の問題を考察する。
本稿では,アナログ領域にデータが存在する場合の問題を解くための新しいアルゴリズムを提案する。
本研究では,浮動小数点数を用いてデータを表す場合の計算処理に,提案フレームワークをどのように適用できるかを示す。
論文 参考訳(メタデータ) (2020-07-17T07:56:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。