論文の概要: Comparison of Clustering Algorithms for Statistical Features of
Vibration Data Sets
- arxiv url: http://arxiv.org/abs/2305.06753v1
- Date: Thu, 11 May 2023 12:19:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-12 15:01:40.637390
- Title: Comparison of Clustering Algorithms for Statistical Features of
Vibration Data Sets
- Title(参考訳): 振動データセットの統計的特徴に対するクラスタリングアルゴリズムの比較
- Authors: Philipp Sepin, Jana Kemnitz, Safoura Rezapour Lakani and Daniel Schall
- Abstract要約: 振動データセットの時間と周波数領域から抽出した統計的特徴に対して,クラスタリングアルゴリズムK平均クラスタリング,OPTICS,およびガウス混合モデルクラスタリング(GMM)を広範囲に比較した。
本研究は, 平均的特徴(平均, 中間値), 分散的特徴(標準偏差, 原子間距離)が, 形状的特徴(骨格性, クルトーシス)よりも有意に優れていたことを示した。
クラスタ数の増加に伴い、クラスタリングアルゴリズムは、いくつかの特定のアルゴリズム制限があるにも関わらず、パフォーマンスが向上した。
- 参考スコア(独自算出の注目度): 0.4806505912512235
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vibration-based condition monitoring systems are receiving increasing
attention due to their ability to accurately identify different conditions by
capturing dynamic features over a broad frequency range. However, there is
little research on clustering approaches in vibration data and the resulting
solutions are often optimized for a single data set. In this work, we present
an extensive comparison of the clustering algorithms K-means clustering,
OPTICS, and Gaussian mixture model clustering (GMM) applied to statistical
features extracted from the time and frequency domains of vibration data sets.
Furthermore, we investigate the influence of feature combinations, feature
selection using principal component analysis (PCA), and the specified number of
clusters on the performance of the clustering algorithms. We conducted this
comparison in terms of a grid search using three different benchmark data sets.
Our work showed that averaging (Mean, Median) and variance-based features
(Standard Deviation, Interquartile Range) performed significantly better than
shape-based features (Skewness, Kurtosis). In addition, K-means outperformed
GMM slightly for these data sets, whereas OPTICS performed significantly worse.
We were also able to show that feature combinations as well as PCA feature
selection did not result in any significant performance improvements. With an
increase in the specified number of clusters, clustering algorithms performed
better, although there were some specific algorithmic restrictions.
- Abstract(参考訳): 広帯域の動的特徴を捉えることで、異なる条件を正確に識別する能力から、振動ベースの状態監視システムが注目を集めている。
しかしながら、振動データのクラスタリングアプローチに関する研究はほとんどなく、結果として得られるソリューションは単一のデータセットに最適化されることが多い。
本研究では,振動データセットの時間領域と周波数領域から抽出した統計的特徴に対して,クラスタリングアルゴリズムK平均クラスタリング,OPTICS,ガウス混合モデルクラスタリング(GMM)を広範囲に比較した。
さらに,特徴の組み合わせ,主成分分析(pca)を用いた特徴選択,クラスタ数がクラスタリングアルゴリズムの性能に与える影響について検討した。
この比較は3つの異なるベンチマークデータセットを用いてグリッド検索を行った。
以上の結果から,平均的機能(平均,中等度)と分散的特徴(標準偏差,等量範囲)は,形状的特徴(スキーネス,クルトーシス)よりも有意に優れていた。
さらに,これらのデータセットではK平均がGMMをわずかに上回り,OPTICSは有意に低下した。
また、PCAの機能選択と機能の組み合わせが大きなパフォーマンス改善をもたらすことはないことも示しました。
特定のクラスタ数の増加に伴い、クラスタリングアルゴリズムの性能は向上したが、アルゴリズム上の制限はいくつかあった。
関連論文リスト
- The ParClusterers Benchmark Suite (PCBS): A Fine-Grained Analysis of Scalable Graph Clustering [15.047567897051376]
ParClusterers Benchmark Suite (PCBS)は、高度にスケーラブルな並列グラフクラスタリングアルゴリズムとベンチマークツールのコレクションである。
PCBSは、スケーラブルなグラフクラスタリングアルゴリズムのアクティブな研究領域の品質とパフォーマンスのトレードオフを評価し、判断する標準化された方法を提供する。
論文 参考訳(メタデータ) (2024-11-15T15:47:32Z) - A3S: A General Active Clustering Method with Pairwise Constraints [66.74627463101837]
A3Sは、適応クラスタリングアルゴリズムによって得られる初期クラスタ結果に対して、戦略的にアクティブクラスタリングを調整する。
さまざまな実世界のデータセットにわたる広範な実験において、A3Sは、人間のクエリを著しく少なくして、望ましい結果を達成する。
論文 参考訳(メタデータ) (2024-07-14T13:37:03Z) - Superclustering by finding statistically significant separable groups of
optimal gaussian clusters [0.0]
本稿では,BIC基準の観点から,最適なデータセットをグループ化することで,データセットをクラスタリングするアルゴリズムを提案する。
このアルゴリズムの重要な利点は、既に訓練済みのクラスタに基づいて、新しいデータの正しいスーパークラスタを予測する能力である。
論文 参考訳(メタデータ) (2023-09-05T23:49:46Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Performance evaluation results of evolutionary clustering algorithm star
for clustering heterogeneous datasets [15.154538450706474]
本稿では,進化的クラスタリングアルゴリズムstar(eca*)の性能評価のためのデータを提案する。
従来の5つのクラスタリングアルゴリズムに対するeca*の性能を調べるために、2つの実験手法が用いられた。
論文 参考訳(メタデータ) (2021-04-30T08:17:19Z) - A Multi-disciplinary Ensemble Algorithm for Clustering Heterogeneous
Datasets [0.76146285961466]
本稿では,社会階級ランキングとメタヒューリスティックアルゴリズムに基づく進化的クラスタリングアルゴリズム(ECAStar)を提案する。
ECAStarは、再共生進化演算子、レヴィ飛行最適化、いくつかの統計技術と統合されている。
従来の5つのアプローチに対してECAStarを評価する実験を行った。
論文 参考訳(メタデータ) (2021-01-01T07:20:50Z) - Decorrelated Clustering with Data Selection Bias [55.91842043124102]
本稿では,データ選択バイアスを伴うクラスタリングのためのデコリレーション正規化K-Meansアルゴリズム(DCKM)を提案する。
DCKMアルゴリズムは,選択バイアスによって生じる予期せぬ特徴相関を除去する必要があることを示す。
論文 参考訳(メタデータ) (2020-06-29T08:55:50Z) - CAST: A Correlation-based Adaptive Spectral Clustering Algorithm on
Multi-scale Data [34.89460002735166]
マルチスケールクラスタデータにスペクトルクラスタリングを適用する際の問題点について検討する。
マルチスケールデータの場合、スパースクラスタのオブジェクトが遠く離れているため、距離ベースの類似性は有効ではない。
係数行列を正規化するためにトレースラッソを適用するアルゴリズムCASTを提案する。
論文 参考訳(メタデータ) (2020-06-08T09:46:35Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。