論文の概要: COHORTNEY: Deep Clustering for Heterogeneous Event Sequences
- arxiv url: http://arxiv.org/abs/2104.01440v1
- Date: Sat, 3 Apr 2021 16:12:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 14:51:16.311578
- Title: COHORTNEY: Deep Clustering for Heterogeneous Event Sequences
- Title(参考訳): cohortney: 不均一なイベントシーケンスに対する深いクラスタリング
- Authors: Vladislav Zhuzhel, Rodrigo Rivera-Castro, Nina Kaploukhaya, Liliya
Mironova, Alexey Zaytsev, Evgeny Burnaev
- Abstract要約: イベントシーケンスのクラスタリングは、ヘルスケア、マーケティング、金融などの分野で広く適用されます。
異種事象列をクラスタリングするための新しい深層学習手法としてCOHORTNEYを提案する。
その結果,cohortneyは,イベントシーケンスをクラスタリングする最先端アルゴリズムの速度とクラスタ品質を大きく上回っていることがわかった。
- 参考スコア(独自算出の注目度): 9.811178291117496
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is emerging attention towards working with event sequences. In
particular, clustering of event sequences is widely applicable in domains such
as healthcare, marketing, and finance. Use cases include analysis of visitors
to websites, hospitals, or bank transactions. Unlike traditional time series,
event sequences tend to be sparse and not equally spaced in time. As a result,
they exhibit different properties, which are essential to account for when
developing state-of-the-art methods.
The community has paid little attention to the specifics of heterogeneous
event sequences. Existing research in clustering primarily focuses on classic
times series data. It is unclear if proposed methods in the literature
generalize well to event sequences.
Here we propose COHORTNEY as a novel deep learning method for clustering
heterogeneous event sequences. Our contributions include (i) a novel method
using a combination of LSTM and the EM algorithm and code implementation; (ii)
a comparison of this method to previous research on time series and event
sequence clustering; (iii) a performance benchmark of different approaches on a
new dataset from the finance industry and fourteen additional datasets. Our
results show that COHORTNEY vastly outperforms in speed and cluster quality the
state-of-the-art algorithm for clustering event sequences.
- Abstract(参考訳): イベントシーケンスを扱うことに注目が集まっている。
特に、イベントシーケンスのクラスタリングは、医療、マーケティング、金融といった分野に広く適用されています。
利用例としては、ウェブサイト、病院、銀行取引への訪問者の分析がある。
従来の時系列とは異なり、イベントシーケンスはスパースであり、時間的間隔が等しくない傾向がある。
その結果、それらは異なる性質を示し、最先端の手法を開発する際に考慮する必要がある。
コミュニティは異種イベントシーケンスの特異性にはほとんど注意を払っていない。
クラスタリングにおける既存の研究は主に古典的な時系列データに焦点を当てている。
文献中の提案手法がイベントシーケンスにうまく一般化するかどうかは明らかでない。
本稿では,異種事象列をクラスタリングするための新しい深層学習手法としてCOHORTNEYを提案する。
i) lstmとemアルゴリズムとコード実装の組み合わせを用いた新しい手法、(ii)時系列とイベントシーケンスクラスタリングに関する以前の研究との比較、(iii)金融業界からの新たなデータセットに対する異なるアプローチのパフォーマンスベンチマーク、および14の追加データセットを含む。
その結果,cohortneyは,イベントシーケンスをクラスタリングする最先端アルゴリズムの速度とクラスタ品質を大きく上回っていることがわかった。
関連論文リスト
- Dying Clusters Is All You Need -- Deep Clustering With an Unknown Number of Clusters [5.507296054825372]
高次元データで有意義なグループを見つけることは、データマイニングにおいて重要な課題である。
深層クラスタリング手法はこれらの課題において顕著な成果を上げている。
これらのメソッドの多くは、事前にクラスタの数を指定する必要がある。
これは、ラベル付きデータが利用できない場合、クラスタの数は通常不明であるため、大きな制限となる。
これらのアプローチのほとんどは、クラスタリングプロセスから分離されたクラスタの数を見積もっています。
論文 参考訳(メタデータ) (2024-10-12T11:04:10Z) - Clustering of timed sequences -- Application to the analysis of care pathways [0.0]
典型的なケアパスの発見は、クラスタリングによって達成できる。
タイムスタンプされたイベントのシーケンスで表されるクラスタリングケアパスの難しさは、意味的に適切なメトリックとクラスタリングアルゴリズムを定義することである。
論文 参考訳(メタデータ) (2024-04-23T07:16:13Z) - Time Series Clustering With Random Convolutional Kernels [0.0]
時系列データ(気候学から金融学、医療まで)は、データマイニングにおいて大きな課題を提示している。
ひとつは時系列クラスタリングで、これはラベルなしの時系列データの大量処理に不可欠である。
R-Clusteringは、ランダムに選択されたパラメータを持つ畳み込みアーキテクチャを利用する新しい手法である。
論文 参考訳(メタデータ) (2023-05-17T06:25:22Z) - Robust Detection of Lead-Lag Relationships in Lagged Multi-Factor Models [61.10851158749843]
データ固有のリード-ラグ関係を発見することで、重要な洞察を得ることができる。
階層化多要素モデルにおけるリードラグ関係のロバスト検出のためのクラスタリング駆動手法を開発した。
論文 参考訳(メタデータ) (2023-05-11T10:30:35Z) - Fuzzy clustering of ordinal time series based on two novel distances
with economic applications [0.12891210250935145]
順序時間列間の2つの新しい距離を導入し、ファジィクラスタリング手順を構築するために使用した。
結果のクラスタリングアルゴリズムは計算効率が良く、類似のプロセスから生成されるシリーズをグループ化することができる。
経済時系列に関する2つの具体的な応用は、提案手法の有用性を示している。
論文 参考訳(メタデータ) (2023-04-24T16:39:22Z) - Towards Out-of-Distribution Sequential Event Prediction: A Causal
Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。
実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。
文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T07:54:13Z) - Summary Markov Models for Event Sequences [23.777457032885813]
我々は,意味のあるタイムスタンプを使わずに,異なる種類のイベントのシーケンスのモデル群を提案する。
イベントタイプを観測する確率は、そのイベントタイプの影響するセットの歴史的発生の要約にのみ依存する。
興味のあるイベントの種類や要約関数の選択には、一意に最小限の影響セットが存在することを示す。
論文 参考訳(メタデータ) (2022-05-06T17:16:24Z) - Semi-supervised New Event Type Induction and Description via Contrastive
Loss-Enforced Batch Attention [56.46649994444616]
マスク付きコントラスト損失を用いた半教師付き新しいイベント型誘導手法を提案する。
私たちは、発見したクラスタの型名を予測し、FrameNetフレームにリンクするという、2つの新しいタスクにアプローチを拡張しました。
論文 参考訳(メタデータ) (2022-02-12T00:32:22Z) - Cluster-and-Conquer: A Framework For Time-Series Forecasting [94.63501563413725]
本稿では,高次元時系列データを予測するための3段階フレームワークを提案する。
当社のフレームワークは非常に汎用的で,各ステップで時系列予測やクラスタリングが利用可能です。
単純な線形自己回帰モデルでインスタンス化されると、いくつかのベンチマークデータセットで最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-10-26T20:41:19Z) - Multi-Scale One-Class Recurrent Neural Networks for Discrete Event
Sequence Anomaly Detection [63.825781848587376]
本稿では,離散イベントシーケンス中の異常を検出する1クラスリカレントニューラルネットワークOC4Seqを提案する。
具体的には、OC4Seqは離散イベントシーケンスを遅延空間に埋め込み、異常を容易に検出することができる。
論文 参考訳(メタデータ) (2020-08-31T04:48:22Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。