論文の概要: CSTS: A Benchmark for the Discovery of Correlation Structures in Time Series Clustering
- arxiv url: http://arxiv.org/abs/2505.14596v1
- Date: Tue, 20 May 2025 16:48:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:53.589924
- Title: CSTS: A Benchmark for the Discovery of Correlation Structures in Time Series Clustering
- Title(参考訳): CSTS: 時系列クラスタリングにおける相関構造の発見のためのベンチマーク
- Authors: Isabella Degen, Zahraa S Abdallah, Henry W J Reeve, Kate Robson Brown,
- Abstract要約: CSTS(Correlation Structures in Time Series)は時系列データ中の相関構造の発見を評価するためのベンチマークである。
CSTSは、研究者がクラスタリング障害の特定の原因を分離し、特定できるクリーンなベンチマークを提供する。
コントリビューションは,(1) 異なる相関構造, 体系的に変化するデータ条件, 確立された性能閾値, 推奨評価プロトコルによる相関構造発見のための総合的ベンチマーク, (2) ダウンサンプリングから適度な歪みを示す相関構造保存の実証的検証, および(3) 構造第一クラスタリング評価が可能なデータ生成フレームワークである。
- 参考スコア(独自算出の注目度): 3.224880576815583
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Time series clustering promises to uncover hidden structural patterns in data with applications across healthcare, finance, industrial systems, and other critical domains. However, without validated ground truth information, researchers cannot objectively assess clustering quality or determine whether poor results stem from absent structures in the data, algorithmic limitations, or inappropriate validation methods, raising the question whether clustering is "more art than science" (Guyon et al., 2009). To address these challenges, we introduce CSTS (Correlation Structures in Time Series), a synthetic benchmark for evaluating the discovery of correlation structures in multivariate time series data. CSTS provides a clean benchmark that enables researchers to isolate and identify specific causes of clustering failures by differentiating between correlation structure deterioration and limitations of clustering algorithms and validation methods. Our contributions are: (1) a comprehensive benchmark for correlation structure discovery with distinct correlation structures, systematically varied data conditions, established performance thresholds, and recommended evaluation protocols; (2) empirical validation of correlation structure preservation showing moderate distortion from downsampling and minimal effects from distribution shifts and sparsification; and (3) an extensible data generation framework enabling structure-first clustering evaluation. A case study demonstrates CSTS's practical utility by identifying an algorithm's previously undocumented sensitivity to non-normal distributions, illustrating how the benchmark enables precise diagnosis of methodological limitations. CSTS advances rigorous evaluation standards for correlation-based time series clustering.
- Abstract(参考訳): 時系列クラスタリングは、医療、金融、産業システム、その他の重要なドメインにわたるアプリケーションによって、データに隠された構造パターンを明らかにすることを約束する。
しかし、検証済みの真理情報がなければ、研究者はクラスタリングの品質を客観的に評価したり、データの欠如、アルゴリズム上の制限、不適切な検証方法から悪い結果が生じるかどうかを判断することはできず、クラスタリングが「科学よりも芸術である」という疑問を提起する(Guyon et al , 2009)。
これらの課題に対処するために,多変量時系列データにおける相関構造の発見を評価するための総合ベンチマークであるCSTS(Correlation Structures in Time Series)を導入する。
CSTSは、相関構造劣化とクラスタリングアルゴリズムの制限とバリデーションメソッドを区別することで、クラスタリング障害の特定と特定を可能にするクリーンなベンチマークを提供する。
コントリビューションは,(1)異なる相関構造,体系的に変化するデータ条件,確立された性能しきい値,および推奨評価プロトコルによる相関構造発見のための総合的なベンチマーク,(2)ダウンサンプリングから適度な歪みを示す相関構造保存の実証的検証,および(3)構造第一クラスタリング評価が可能な拡張可能なデータ生成フレームワークである。
ケーススタディでは、アルゴリズムの非正規分布に対する未文書の感度を同定することで、CSTSの実用性を実証し、ベンチマークが方法論的限界の正確な診断を可能にしていることを示す。
CSTSは相関に基づく時系列クラスタリングの厳格な評価基準を推進している。
関連論文リスト
- Anomalous Agreement: How to find the Ideal Number of Anomaly Classes in Correlated, Multivariate Time Series Data [42.48512312730543]
本稿では,時系列間の異常の同期を利用してクラスタ品質を評価するSynchronized Anomaly Agreement Index (SAAI)を紹介する。
本研究では,SAAI の最大化により,相関時系列における乱数 K の真数を求めるタスクの精度が SSC と比較して 0.23 向上し,X-Means に比べて 0.32 向上したことを示す。
論文 参考訳(メタデータ) (2025-01-13T10:04:55Z) - Hierarchical and Density-based Causal Clustering [6.082022112101251]
本稿では,既成のアルゴリズムを用いて簡易かつ容易に実装可能なプラグイン推定器を提案する。
さらに,それらの収束率について検討し,因果クラスタリングの付加コストが基本的に結果回帰関数の推定誤差であることを示す。
論文 参考訳(メタデータ) (2024-11-02T14:01:04Z) - Interpretable Clustering with the Distinguishability Criterion [0.4419843514606336]
本稿では,特定クラスタの分離可能性の定量化と推定クラスタ構成の検証を行うために,分散可能性基準と呼ばれるグローバルな基準を提案する。
本稿では、分散可能性基準と多くの一般的なクラスタリング手順を統合した損失関数に基づく計算フレームワークを提案する。
シミュレーション研究および実データアプリケーションに基づく包括的データ解析の結果とともに,これらの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-24T16:38:15Z) - DAGnosis: Localized Identification of Data Inconsistencies using
Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。
我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。
我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文 参考訳(メタデータ) (2024-02-26T11:29:16Z) - DCSI -- An improved measure of cluster separability based on separation and connectedness [0.0]
あるデータセットのクラスラベルが意味のあるクラスタに対応するかどうかは、実世界のデータセットを用いたクラスタリングアルゴリズムの評価に不可欠である。
密度に基づくクラスタリングにおける分離性の中心的な側面は、クラス間の分離とクラス内の連結性である。
新たに開発された尺度 (density cluster separability index, DCSI) は、これらの2つの特性を定量化することを目的としており、CVIとしても使用できる。
論文 参考訳(メタデータ) (2023-10-19T15:01:57Z) - Using Representation Expressiveness and Learnability to Evaluate
Self-Supervised Learning Methods [61.49061000562676]
本稿では,学習可能性を評価するためにCluster Learnability (CL)を導入する。
CLは、K-meansで表現をクラスタリングすることによって得られたラベルを予測するために訓練されたKNNのパフォーマンスで測定される。
CLは、他の競合する評価手法よりも分布内モデルの性能と相関することがわかった。
論文 参考訳(メタデータ) (2022-06-02T19:05:13Z) - Effect Identification in Cluster Causal Diagrams [51.42809552422494]
クラスタ因果図(略してC-DAG)と呼ばれる新しいタイプのグラフィカルモデルを導入する。
C-DAGは、限定された事前知識に基づいて変数間の関係を部分的に定義することができる。
我々はC-DAGに対する因果推論のための基礎と機械を開発する。
論文 参考訳(メタデータ) (2022-02-22T21:27:31Z) - HAWKS: Evolving Challenging Benchmark Sets for Cluster Analysis [2.5329716878122404]
クラスタリングアルゴリズムの包括的なベンチマークは難しい。
厳格なベンチマークのベストプラクティスに関する合意はありません。
このようなベンチマークのフレキシブルな生成を支援するために,進化的アルゴリズムが果たす重要な役割を実証する。
論文 参考訳(メタデータ) (2021-02-13T15:01:34Z) - Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain
Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。
本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。
提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-12-08T08:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。