論文の概要: Selecting Optimal Trace Clustering Pipelines with AutoML
- arxiv url: http://arxiv.org/abs/2109.00635v1
- Date: Wed, 1 Sep 2021 22:10:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-04 03:29:06.888281
- Title: Selecting Optimal Trace Clustering Pipelines with AutoML
- Title(参考訳): AutoMLによる最適トレースクラスタリングパイプラインの選択
- Authors: Sylvio Barbon Jr, Paolo Ceravolo, Ernesto Damiani, Gabriel Marques
Tavares
- Abstract要約: イベントログからトレースクラスタリングに最も適したパイプラインを推奨する自動機械学習フレームワークを提案する。
当社のフレームワークは,トレースクラスタリングの問題に光を当て,シナリオを考慮した最適なパイプライン選択を支援する。
- 参考スコア(独自算出の注目度): 5.210689364246218
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Trace clustering has been extensively used to preprocess event logs. By
grouping similar behavior, these techniques guide the identification of
sub-logs, producing more understandable models and conformance analytics.
Nevertheless, little attention has been posed to the relationship between event
log properties and clustering quality. In this work, we propose an Automatic
Machine Learning (AutoML) framework to recommend the most suitable pipeline for
trace clustering given an event log, which encompasses the encoding method,
clustering algorithm, and its hyperparameters. Our experiments were conducted
using a thousand event logs, four encoding techniques, and three clustering
methods. Results indicate that our framework sheds light on the trace
clustering problem and can assist users in choosing the best pipeline
considering their scenario.
- Abstract(参考訳): トレースクラスタリングはイベントログの前処理に広く使われている。
類似した振る舞いをグループ化することにより、これらのテクニックはサブログの識別を導き、より理解しやすいモデルと適合分析を生成する。
それにもかかわらず、イベントログ特性とクラスタ品質の関係にはほとんど注意が払われていない。
本研究では,イベントログに符号化手法,クラスタリングアルゴリズム,ハイパーパラメータを含むトレースクラスタリングに最適なパイプラインを推奨する,自動機械学習(Automatic Machine Learning, AutoML)フレームワークを提案する。
実験は,1000のイベントログ,4つのエンコーディング技術,3つのクラスタリング手法を用いて行った。
その結果,我々のフレームワークはトレースクラスタリングの問題に光を当て,シナリオを考慮した最適なパイプライン選択を支援することができた。
関連論文リスト
- CLAMS: A System for Zero-Shot Model Selection for Clustering [3.7127285734321194]
本稿では,最適なトランスポートベースデータセットの類似性を利用して,クラスタリング問題に対するモデル選択を可能にするAutoMLシステムを提案する。
その結果、クラスタリングアプリケーションを解決するための類似性に基づく自動モデル選択の有用性が実証された。
論文 参考訳(メタデータ) (2024-07-15T23:50:07Z) - TraceMesh: Scalable and Streaming Sampling for Distributed Traces [51.08892669409318]
TraceMeshは、分散トレースのためのスケーラブルでストリーミングなサンプリングツールである。
以前は見つからなかったトレース機能を、統一的で合理化された方法で扱える。
TraceMeshは、サンプリング精度と効率の両方において、最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2024-06-11T06:13:58Z) - LogFormer: A Pre-train and Tuning Pipeline for Log Anomaly Detection [73.69399219776315]
本稿では,ログ異常検出(LogFormer)のためのTransformerベースの統合フレームワークを提案する。
具体的には、ログデータの共有セマンティック知識を得るために、まず、ソースドメイン上で事前学習を行う。
そして、そのような知識を共有パラメータを介して対象領域に転送する。
論文 参考訳(メタデータ) (2024-01-09T12:55:21Z) - Discovering Hierarchical Process Models: an Approach Based on Events
Clustering [0.0]
本稿では,2段階のワークフローネットとして表現される階層的プロセスモデルを発見するアルゴリズムを提案する。
既存のソリューションとは異なり、我々のアルゴリズムはプロセス制御フローに制限を課さず、反復を可能にする。
論文 参考訳(メタデータ) (2023-03-12T11:05:40Z) - Towards Personalized Preprocessing Pipeline Search [52.59156206880384]
ClusterP3Sは、Clusteringを介してパイプライン検索をパーソナライズする新しいフレームワークである。
本稿では,クラスタを協調的に学習し,最適なパイプラインを探索するための階層的探索手法を提案する。
ベンチマーク分類データセットの実験では、機能的に前処理可能なパイプライン探索の有効性が示されている。
論文 参考訳(メタデータ) (2023-02-28T05:45:05Z) - Trajectory Clustering Performance Evaluation: If we know the answer,
it's not clustering [0.6472434306724609]
軌道クラスタリングは教師なしのタスクである。
7つの交差点の軌跡データを用いて,類似度,クラスタリングアルゴリズム,評価尺度の総合的な比較を行う。
論文 参考訳(メタデータ) (2021-12-02T19:25:38Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Channel DropBlock: An Improved Regularization Method for Fine-Grained
Visual Classification [58.07257910065007]
既存のアプローチは主に、識別的部分を見つけるための注意機構や、高度にパラメータ化された特徴を弱教師付きで抽出する特徴符号化アプローチを導入することでこの問題に対処している。
本研究では,CDB(Channel DropBlock)と呼ばれる軽量で効果的な正規化手法を提案する。
論文 参考訳(メタデータ) (2021-06-07T09:03:02Z) - Incremental Search Space Construction for Machine Learning Pipeline
Synthesis [4.060731229044571]
automated machine learning(automl)は、マシンラーニング(ml)パイプラインの自動構築を目的とする。
パイプライン構築のためのメタ機能に基づくデータ中心アプローチを提案する。
確立されたAutoMLベンチマークで使用した28データセットに対して,アプローチの有効性と競争性を実証する。
論文 参考訳(メタデータ) (2021-01-26T17:17:49Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Improving Problem Identification via Automated Log Clustering using
Dimensionality Reduction [0.8122270502556374]
我々は、同じ理由で失敗したランニングログを自動的にグループ化することで、より効果的に扱えるようにする。
システムログの問題を特定するために開発されたアプローチは、継続的デプロイメントログの問題を特定するために一般化されますか?
クラスタリングアルゴリズムでクラスタをマージするための基準は、品質にどのように影響しますか?
論文 参考訳(メタデータ) (2020-09-07T17:26:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。