論文の概要: SOMTimeS: Self Organizing Maps for Time Series Clustering and its
Application to Serious Illness Conversations
- arxiv url: http://arxiv.org/abs/2108.11523v1
- Date: Thu, 26 Aug 2021 00:18:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-28 01:55:03.715987
- Title: SOMTimeS: Self Organizing Maps for Time Series Clustering and its
Application to Serious Illness Conversations
- Title(参考訳): SOMTimeS:時系列クラスタリングのための自己組織化マップとその重度会話への応用
- Authors: Ali Javed, Donna M. Rizzo, Byung Suk Lee, Robert Gramling
- Abstract要約: 我々はSOMTimeS(TIMEシリーズの自己組織化マップ)と呼ばれるDTWに基づく新しいクラスタリング手法を提案する。
他のDTWベースのクラスタリングアルゴリズムよりも高速で、パフォーマンスも同等です。
我々は,大規模医療コホート研究の一環として収集した自然言語会話データにSOMtimeSを適用した。
- 参考スコア(独自算出の注目度): 3.2689702143620147
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There is an increasing demand for scalable algorithms capable of clustering
and analyzing large time series datasets. The Kohonen self-organizing map (SOM)
is a type of unsupervised artificial neural network for visualizing and
clustering complex data, reducing the dimensionality of data, and selecting
influential features. Like all clustering methods, the SOM requires a measure
of similarity between input data (in this work time series). Dynamic time
warping (DTW) is one such measure, and a top performer given that it
accommodates the distortions when aligning time series. Despite its use in
clustering, DTW is limited in practice because it is quadratic in runtime
complexity with the length of the time series data. To address this, we present
a new DTW-based clustering method, called SOMTimeS (a Self-Organizing Map for
TIME Series), that scales better and runs faster than other DTW-based
clustering algorithms, and has similar performance accuracy. The computational
performance of SOMTimeS stems from its ability to prune unnecessary DTW
computations during the SOM's training phase. We also implemented a similar
pruning strategy for K-means for comparison with one of the top performing
clustering algorithms. We evaluated the pruning effectiveness, accuracy,
execution time and scalability on 112 benchmark time series datasets from the
University of California, Riverside classification archive. We showed that for
similar accuracy, the speed-up achieved for SOMTimeS and K-means was 1.8x on
average; however, rates varied between 1x and 18x depending on the dataset.
SOMTimeS and K-means pruned 43% and 50% of the total DTW computations,
respectively. We applied SOMtimeS to natural language conversation data
collected as part of a large healthcare cohort study of patient-clinician
serious illness conversations to demonstrate the algorithm's utility with
complex, temporally sequenced phenomena.
- Abstract(参考訳): 大規模時系列データセットのクラスタリングと分析が可能なスケーラブルアルゴリズムの需要が高まっている。
コホーネン自己組織化マップ(Kohonen Self-organizing map、SOM)は、複雑なデータの可視化とクラスタ化、データの次元の低減、影響力のある特徴の選択を行う、教師なしのニューラルネットワークの一種である。
他のクラスタリング方法と同様に、SOMは入力データ間の類似性の尺度を必要とする(この作業時系列では)。
ダイナミック・タイム・ワープ(DTW)はそのような尺度の一つであり、時系列を整列する際の歪みを考慮に入れている。
クラスタリングでの使用にもかかわらず、dtwは実行時の複雑さが時系列データの長さと2倍になるため、実際には制限されている。
そこで本研究では,DTWをベースとしたクラスタリング手法であるSOMTimeS(Self-Organizing Map for TIME Series)を提案する。
SOMTimeSの計算性能は、不必要なDTW計算をSOMのトレーニングフェーズで実行できることに由来する。
また,K-meansに対して,クラスタリングアルゴリズムの上位性能と比較し,同様のプルーニング戦略を実装した。
カリフォルニア大学リバーサイド分類アーカイブのベンチマーク時系列データセット112件について, プルーニングの有効性, 精度, 実行時間, スケーラビリティを評価した。
同様の精度で,SOMTimeSとK平均の速度は平均1.8倍であったが,データセットによって1倍から18倍に変化した。
SOMTimeS と K-means はそれぞれ 43% と 50% の DTW 計算を行った。
我々は,SOMtimeSを言語会話データに適用し,患者・クリニックの重篤な病的会話の大規模コホート研究の一環として,複雑な時間的シーケンスの現象を用いたアルゴリズムの有用性を実証した。
関連論文リスト
- Concrete Dense Network for Long-Sequence Time Series Clustering [4.307648859471193]
時系列クラスタリングは、時間的パターンを発見するためのデータ分析において基本である。
深部時間クラスタリング手法は、ニューラルネットワークのエンドツーエンドトレーニングに標準k平均を組み込もうとしている。
LoSTerは、時系列クラスタリング問題に対する新しい密集型オートエンコーダアーキテクチャである。
論文 参考訳(メタデータ) (2024-05-08T12:31:35Z) - Clustering of timed sequences -- Application to the analysis of care pathways [0.0]
ケアパスの均質なグループを探索することは、クラスタリングによって達成できる。
タイムスタンプされたイベントのシーケンスで表されるクラスタリングケアパスの難しさは、意味的に適切なメトリックとクラスタリングアルゴリズムを定義することである。
本稿では,Drop-DTW メトリックと DBA アプローチという,時系列から時系列へ展開する2つの手法を,平均時間列の構築に適用する。
論文 参考訳(メタデータ) (2024-04-23T07:16:13Z) - Fast dynamic time warping and clustering in C++ [0.0]
本稿では,計算効率のよい動的時間ワープ(DTW)と時系列データのクラスタリングについて述べる。
この手法は、動的プログラミングを用いて解く最適化問題として、時系列データセットの動的ワープを行う。
k-medoidsクラスタリングは,グローバルな最適性の証明書が必須ではない場合に,速度向上のために使用するオプションもある。
論文 参考訳(メタデータ) (2023-07-10T21:08:27Z) - OTW: Optimal Transport Warping for Time Series [75.69837166816501]
動的時間温暖化(DTW)は時系列間の距離を測定するための実用的な選択肢となっている。
最適アライメント行列を正確に計算する必要がある場合、それは避けられない二次時間複雑性に悩まされる。
我々は、OTW(Optimal Transport Warping)と呼ばれる、最適輸送フレームワークに基づく時系列データのための新しいメトリクスを導入する。
論文 参考訳(メタデータ) (2023-06-01T12:45:00Z) - Clustering Method for Time-Series Images Using Quantum-Inspired
Computing Technology [0.0]
時系列クラスタリングは、クラスタに関する事前の知識がなければ、時系列データの強力なデータマイニング技術として機能する。
本研究では,アニーリングマシンを利用した新しい時系列クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2023-05-26T05:58:14Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Adaptively-weighted Integral Space for Fast Multiview Clustering [54.177846260063966]
線形複雑度に近い高速マルチビュークラスタリングのための適応重み付き積分空間(AIMC)を提案する。
特に、ビュー生成モデルは、潜在積分空間からのビュー観測を再構成するために設計されている。
いくつかの実世界のデータセットで実施された実験は、提案したAIMC法の優位性を確認した。
論文 参考訳(メタデータ) (2022-08-25T05:47:39Z) - Towards Similarity-Aware Time-Series Classification [51.2400839966489]
時系列データマイニングの基本課題である時系列分類(TSC)について検討する。
グラフニューラルネットワーク(GNN)を用いて類似情報をモデル化するフレームワークであるSimTSCを提案する。
論文 参考訳(メタデータ) (2022-01-05T02:14:57Z) - Cluster-and-Conquer: A Framework For Time-Series Forecasting [94.63501563413725]
本稿では,高次元時系列データを予測するための3段階フレームワークを提案する。
当社のフレームワークは非常に汎用的で,各ステップで時系列予測やクラスタリングが利用可能です。
単純な線形自己回帰モデルでインスタンス化されると、いくつかのベンチマークデータセットで最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-10-26T20:41:19Z) - Hierarchical Clustering using Auto-encoded Compact Representation for
Time-series Analysis [8.660029077292346]
本稿では,学習した時系列のコンパクト表現,オートエンコードコンパクトシーケンス(AECS),階層クラスタリングアプローチを組み合わせたクラスタの識別機構を提案する。
Sequence to Sequence(seq2seq)オートエンコーダと集約型階層クラスタリングに基づくRecurrent Neural Network(RNN)を利用するアルゴリズムです。
論文 参考訳(メタデータ) (2021-01-11T08:03:57Z) - (k, l)-Medians Clustering of Trajectories Using Continuous Dynamic Time
Warping [57.316437798033974]
本研究では,トラジェクトリの集中型クラスタリングの問題について考察する。
我々はDTWの連続バージョンを距離測定として使用することを提案し、これをCDTW(Continuous dynamic time warping)と呼ぶ。
一連の軌道から中心を計算し、その後反復的に改善する実践的な方法を示す。
論文 参考訳(メタデータ) (2020-12-01T13:17:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。