論文の概要: Line Space Clustering (LSC): Feature-Based Clustering using K-medians and Dynamic Time Warping for Versatility
- arxiv url: http://arxiv.org/abs/2503.15777v1
- Date: Thu, 20 Mar 2025 01:27:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-21 19:01:13.453258
- Title: Line Space Clustering (LSC): Feature-Based Clustering using K-medians and Dynamic Time Warping for Versatility
- Title(参考訳): ラインスペースクラスタリング(LSC):Kメディアンを用いた特徴量クラスタリングと動的時間ワープ
- Authors: Joanikij Chulev, Angela Mladenovska,
- Abstract要約: 行空間クラスタリング(Line Space Clustering、LSC)は、データポイントを新たに定義された特徴空間内の行に変換する表現である。
LSCはEuclideanとDynamic Time Warping(DTW)距離をパラメータαで重み付けした組み合わせ距離メートル法を採用している。
実験は、合成および実世界のデータセットに対するLCCの有効性を実証する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Clustering high-dimensional data is a critical challenge in machine learning due to the curse of dimensionality and the presence of noise. Traditional clustering algorithms often fail to capture the intrinsic structures in such data. This paper explores a combination of clustering methods, which we called Line Space Clustering (LSC), a representation that transforms data points into lines in a newly defined feature space, enabling clustering based on the similarity of feature value patterns, essentially treating features as sequences. LSC employs a combined distance metric that uses Euclidean and Dynamic Time Warping (DTW) distances, weighted by a parameter {\alpha}, allowing flexibility in emphasizing shape or magnitude similarities. We delve deeply into the mechanics of DTW and the Savitzky Golay filter, explaining their roles in the algorithm. Extensive experiments demonstrate the efficacy of LSC on synthetic and real-world datasets, showing that randomly experimenting with time-series optimized methods sometimes might surprisingly work on a complex dataset, particularly in noisy environments. Source code and experiments are available at: https://github.com/JoanikijChulev/LSC.
- Abstract(参考訳): 高次元データのクラスタリングは、次元の呪いとノイズの存在による機械学習における重要な課題である。
従来のクラスタリングアルゴリズムは、そのようなデータの中で固有の構造をキャプチャできないことが多い。
本稿では,新たに定義された特徴空間におけるデータポイントを行に変換する表現であるLine Space Clustering (LSC) というクラスタリング手法を組み合わせて,特徴値パターンの類似性に基づいたクラスタリングを実現する。
LSCはユークリッドとダイナミック・タイム・ウォーピング(DTW)距離を使い、パラメータ {\alpha} で重み付けすることで、形状や大きさの類似性を強調できる。
我々はDTWとSavitzky Golayフィルタの力学を深く掘り下げ、アルゴリズムにおけるそれらの役割を説明した。
大規模な実験は、合成データセットと実世界のデータセットに対するLCCの有効性を実証し、時系列最適化手法をランダムに実験することは、複雑なデータセット、特にノイズの多い環境で驚くほど機能する可能性があることを示した。
ソースコードと実験は、https://github.com/JoanikijChulev/LSC.comで公開されている。
関連論文リスト
- CoHiRF: A Scalable and Interpretable Clustering Framework for High-Dimensional Data [0.30723404270319693]
課題を効果的に解決する新しいクラスタリング手法であるCoHiRF(Consensus Hierarchical Random Feature)を提案する。
CoHiRFは、ランダムな特徴選択を利用してノイズと次元効果を緩和し、縮小された特徴空間にK平均クラスタリングを繰り返し適用し、全一致のコンセンサス基準で結果を組み合わせる。
CoHiRFはK-Meansに匹敵する実行時間で計算効率が高く、大規模データセットにスケーラブルで、SC-SRGF、HDBSCAN、OPTICSといった最先端の手法に対して堅牢な性能を示す。
論文 参考訳(メタデータ) (2025-02-01T09:38:44Z) - Concrete Dense Network for Long-Sequence Time Series Clustering [4.307648859471193]
時系列クラスタリングは、時間的パターンを発見するためのデータ分析において基本である。
深部時間クラスタリング手法は、ニューラルネットワークのエンドツーエンドトレーニングに標準k平均を組み込もうとしている。
LoSTerは、時系列クラスタリング問題に対する新しい密集型オートエンコーダアーキテクチャである。
論文 参考訳(メタデータ) (2024-05-08T12:31:35Z) - Contrastive Continual Multi-view Clustering with Filtered Structural
Fusion [57.193645780552565]
ビューが事前に収集されるアプリケーションでは、マルチビュークラスタリングが成功します。
データビューがシーケンシャルに収集されるシナリオ、すなわちリアルタイムデータを見落としている。
いくつかの方法が提案されているが、安定塑性ジレンマに閉じ込められている。
フィルタ構造融合を用いたコントラスト連続多視点クラスタリングを提案する。
論文 参考訳(メタデータ) (2023-09-26T14:18:29Z) - Deep Spatiotemporal Clustering: A Temporal Clustering Approach for
Multi-dimensional Climate Data [0.353122873734926]
教師なし深層学習法を用いて,データの高次元時間表現のための新しいアルゴリズムを提案する。
U-netアーキテクチャにインスパイアされたアルゴリズムでは,CNN-RNN層を統合したオートエンコーダを用いて潜在表現を学習する。
実験の結果,従来のクラスタリングアルゴリズムと深層学習に基づくクラスタリングアルゴリズムのどちらよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-27T21:45:21Z) - Adaptively-weighted Integral Space for Fast Multiview Clustering [54.177846260063966]
線形複雑度に近い高速マルチビュークラスタリングのための適応重み付き積分空間(AIMC)を提案する。
特に、ビュー生成モデルは、潜在積分空間からのビュー観測を再構成するために設計されている。
いくつかの実世界のデータセットで実施された実験は、提案したAIMC法の優位性を確認した。
論文 参考訳(メタデータ) (2022-08-25T05:47:39Z) - SOMTimeS: Self Organizing Maps for Time Series Clustering and its
Application to Serious Illness Conversations [3.2689702143620147]
我々はSOMTimeS(TIMEシリーズの自己組織化マップ)と呼ばれるDTWに基づく新しいクラスタリング手法を提案する。
他のDTWベースのクラスタリングアルゴリズムよりも高速で、パフォーマンスも同等です。
我々は,大規模医療コホート研究の一環として収集した自然言語会話データにSOMtimeSを適用した。
論文 参考訳(メタデータ) (2021-08-26T00:18:25Z) - Stable and consistent density-based clustering via multiparameter
persistence [77.34726150561087]
トポロジカルデータ解析による次数-リップス構成について考察する。
我々は,入力データの摂動に対する安定性を,通信間距離を用いて解析する。
私たちはこれらのメソッドを、Persistableと呼ばれる密度ベースのクラスタリングのためのパイプラインに統合します。
論文 参考訳(メタデータ) (2020-05-18T19:45:04Z) - Learnable Subspace Clustering [76.2352740039615]
本研究では,大規模サブスペースクラスタリング問題を効率的に解くために,学習可能なサブスペースクラスタリングパラダイムを開発する。
鍵となる考え方は、高次元部分空間を下層の低次元部分空間に分割するパラメトリック関数を学ぶことである。
我々の知る限り、本論文は、サブスペースクラスタリング手法の中で、数百万のデータポイントを効率的にクラスタ化する最初の試みである。
論文 参考訳(メタデータ) (2020-04-09T12:53:28Z) - ClusterVO: Clustering Moving Instances and Estimating Visual Odometry
for Self and Surroundings [54.33327082243022]
ClusterVOはステレオビジュアルオドメトリーで、エゴと周囲の固いクラスタ/オブジェクトの両方の動きを同時にクラスタし、推定する。
以前のソリューションでは、バッチ入力やシーン構造や動的オブジェクトモデルへの事前の指示に頼っていたが、ClusterVOは一般的にオンラインであり、屋内のシーン理解や自律運転など、さまざまなシナリオで使用することができる。
論文 参考訳(メタデータ) (2020-03-29T09:06:28Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z) - Autoencoder-based time series clustering with energy applications [0.0]
時系列クラスタリングは、データの特定の性質のため、難しい作業である。
本稿では,畳み込み型オートエンコーダとk-メノイドアルゴリズムの組み合わせによる時系列クラスタリングについて検討する。
論文 参考訳(メタデータ) (2020-02-10T10:04:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。