論文の概要: A Self-Supervised Learning-based Approach to Clustering Multivariate
Time-Series Data with Missing Values (SLAC-Time): An Application to Traumatic
Brain Injury Phenotyping
- arxiv url: http://arxiv.org/abs/2302.13457v1
- Date: Mon, 27 Feb 2023 01:05:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 16:58:32.145163
- Title: A Self-Supervised Learning-based Approach to Clustering Multivariate
Time-Series Data with Missing Values (SLAC-Time): An Application to Traumatic
Brain Injury Phenotyping
- Title(参考訳): 多変量時系列データと欠落値(SLAC-Time)をクラスタリングするための自己教師付き学習に基づくアプローチ : 外傷性脳損傷診断への応用
- Authors: Hamid Ghaderi, Brandon Foreman, Amin Nayebi, Sindhu Tipirneni, Chandan
K. Reddy, Vignesh Subbian
- Abstract要約: 自己教師型学習に基づく多変量時系列データのクラスタリング手法を提案する(SLAC-Time)。
SLAC-TimeはTransformerベースのクラスタリング手法で、ラベルのないデータを活用するためのプロキシタスクとして時系列予測を使用する。
実験により、SLAC-Timeは、シルエット係数、カリンスキー・ハラバスツ指数、ダン指数、デイビース・ボルディン指数の点で、ベースラインのK平均クラスタリングアルゴリズムより優れていることが示された。
- 参考スコア(独自算出の注目度): 8.487912181381404
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Self-supervised learning approaches provide a promising direction for
clustering multivariate time-series data. However, real-world time-series data
often include missing values, and the existing approaches require imputing
missing values before clustering, which may cause extensive computations and
noise and result in invalid interpretations. To address these challenges, we
present a Self-supervised Learning-based Approach to Clustering multivariate
Time-series data with missing values (SLAC-Time). SLAC-Time is a
Transformer-based clustering method that uses time-series forecasting as a
proxy task for leveraging unlabeled data and learning more robust time-series
representations. This method jointly learns the neural network parameters and
the cluster assignments of the learned representations. It iteratively clusters
the learned representations with the K-means method and then utilizes the
subsequent cluster assignments as pseudo-labels to update the model parameters.
To evaluate our proposed approach, we applied it to clustering and phenotyping
Traumatic Brain Injury (TBI) patients in the TRACK-TBI dataset. Our experiments
demonstrate that SLAC-Time outperforms the baseline K-means clustering
algorithm in terms of silhouette coefficient, Calinski Harabasz index, Dunn
index, and Davies Bouldin index. We identified three TBI phenotypes that are
distinct from one another in terms of clinically significant variables as well
as clinical outcomes, including the Extended Glasgow Outcome Scale (GOSE)
score, Intensive Care Unit (ICU) length of stay, and mortality rate. The
experiments show that the TBI phenotypes identified by SLAC-Time can be
potentially used for developing targeted clinical trials and therapeutic
strategies.
- Abstract(参考訳): 自己教師付き学習アプローチは、多変量時系列データをクラスタリングするための有望な方向を提供する。
しかし、実世界の時系列データは、しばしば欠落した値を含み、既存のアプローチでは、クラスタリングの前に欠落した値を暗示する必要がある。
これらの課題に対処するため,各時系列データをSLAC-Timeでクラスタリングするための自己教師付き学習ベースアプローチを提案する。
SLAC-TimeはTransformerベースのクラスタリング手法で、ラベルのないデータを活用し、より堅牢な時系列表現を学ぶためのプロキシタスクとして時系列予測を使用する。
この方法はニューラルネットワークパラメータと学習した表現のクラスタ割り当てを共同で学習する。
学習した表現をK-meansメソッドで反復的にクラスタリングし、その後、クラスタ割り当てを擬似ラベルとして利用してモデルのパラメータを更新する。
提案手法を評価するため,TRACK-TBIデータセットを用いた外傷性脳損傷(TBI)患者のクラスタリングと表現に応用した。
実験により, SLAC-Timeは, シルエット係数, Calinski Harabasz 指数, Dunn 指数, Davies Bouldin 指数において, K-means クラスタリングアルゴリズムよりも優れていることが示された。
臨床的に有意な変数と臨床成績で異なる3つのTBI表現型を同定し,拡張グラスゴーアウトカム尺度(GOSE)スコア,集中治療単位(ICU)スタンス,死亡率の3つを検討した。
この実験は、SLAC-Timeによって同定されたTBI表現型が、標的となる臨床試験や治療戦略の開発に有用であることを示す。
関連論文リスト
- Concrete Dense Network for Long-Sequence Time Series Clustering [4.307648859471193]
時系列クラスタリングは、時間的パターンを発見するためのデータ分析において基本である。
深部時間クラスタリング手法は、ニューラルネットワークのエンドツーエンドトレーニングに標準k平均を組み込もうとしている。
LoSTerは、時系列クラスタリング問題に対する新しい密集型オートエンコーダアーキテクチャである。
論文 参考訳(メタデータ) (2024-05-08T12:31:35Z) - Identifying TBI Physiological States by Clustering Multivariate Clinical
Time-Series Data [8.487912181381404]
SLAC-Timeは、イミューテーションやアグリゲーションを回避してデータの整合性を維持する革新的なセルフスーパービジョンベースのアプローチである。
大規模な研究データセットにSLAC-Timeを用いてデータをクラスタリングすることにより,3つの異なるTBI生理状態が同定された。
論文 参考訳(メタデータ) (2023-03-23T04:16:00Z) - Time Associated Meta Learning for Clinical Prediction [78.99422473394029]
本稿では,時間関連メタラーニング(TAML)手法を提案する。
タスク分割後のスパーシリティ問題に対処するため、TAMLは時間情報共有戦略を採用し、正のサンプル数を増やす。
複数の臨床データセットに対するTAMLの有効性を示す。
論文 参考訳(メタデータ) (2023-03-05T03:54:54Z) - T-Phenotype: Discovering Phenotypes of Predictive Temporal Patterns in
Disease Progression [82.85825388788567]
我々は、ラベル付き時系列データから予測時相パターンの表現型を発見するために、新しい時間的クラスタリング手法T-Phenotypeを開発した。
T-フェノタイプは, 評価ベースラインのすべてに対して, 最良の表現型発見性能を示す。
論文 参考訳(メタデータ) (2023-02-24T13:30:35Z) - Deep Temporal Contrastive Clustering [21.660509622172274]
本稿では,時間差の深いクラスタリング手法を提案する。
対照的な学習パラダイムを、ディープ時系列クラスタリング研究に取り入れている。
様々な時系列データセットの実験は、最先端技術に対する我々のアプローチの優位性を実証している。
論文 参考訳(メタデータ) (2022-12-29T16:43:34Z) - Clustering individuals based on multivariate EMA time-series data [2.0824228840987447]
エコロジー・モメンタリー・アセスメント(EMA)の方法論は、時間集約的、反復的、個人内測定の新たな機会を提供する。
高度な機械学習(ML)手法は、データ特性を理解し、基礎となる複雑な心理的プロセスに関する意味のある関係を明らかにするために必要である。
論文 参考訳(メタデータ) (2022-12-02T13:33:36Z) - Using Representation Expressiveness and Learnability to Evaluate
Self-Supervised Learning Methods [61.49061000562676]
本稿では,学習可能性を評価するためにCluster Learnability (CL)を導入する。
CLは、K-meansで表現をクラスタリングすることによって得られたラベルを予測するために訓練されたKNNのパフォーマンスで測定される。
CLは、他の競合する評価手法よりも分布内モデルの性能と相関することがわかった。
論文 参考訳(メタデータ) (2022-06-02T19:05:13Z) - LifeLonger: A Benchmark for Continual Disease Classification [59.13735398630546]
MedMNISTコレクションの連続的な疾患分類のためのベンチマークであるLifeLongerを紹介する。
タスクとクラスでの病気の漸進的な学習は、モデルをスクラッチから再トレーニングすることなく、新しいサンプルを分類する問題に対処する。
クロスドメインインクリメンタル学習は、これまで得られた知識を維持しながら、異なる機関から派生したデータセットを扱う問題に対処する。
論文 参考訳(メタデータ) (2022-04-12T12:25:05Z) - Topology-based Clusterwise Regression for User Segmentation and Demand
Forecasting [63.78344280962136]
本研究は,パブリックおよび新規な商用データ集合を用いて,アナリストがユーザベースをクラスタリングし,詳細なレベルで需要を計画できることを示す。
本研究は,TDAに基づく時系列クラスタリングと行列因数分解法によるクラスタ回帰を実践者にとって実行可能なツールとして導入することを目的とする。
論文 参考訳(メタデータ) (2020-09-08T12:10:10Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。