論文の概要: Soft-ECM: An extension of Evidential C-Means for complex data
- arxiv url: http://arxiv.org/abs/2507.13417v1
- Date: Thu, 17 Jul 2025 13:00:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 20:43:26.093444
- Title: Soft-ECM: An extension of Evidential C-Means for complex data
- Title(参考訳): ソフトECM:複雑なデータに対する証拠C値の拡張
- Authors: Armel Soubeiga, Thomas Guyet, Violaine Antoine,
- Abstract要約: 信念関数に基づくクラスタリングは、機械学習コミュニティで注目を集めている。
既存のアルゴリズムは、混合データ(数値と分類)や時系列のような非語彙データなど、複雑なデータには適用できない。
我々は,不正確なクラスタのセントロイドを一定に位置決めする新しいアルゴリズム,Soft-ECMを提案する。
- 参考スコア(独自算出の注目度): 0.5530212768657544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clustering based on belief functions has been gaining increasing attention in the machine learning community due to its ability to effectively represent uncertainty and/or imprecision. However, none of the existing algorithms can be applied to complex data, such as mixed data (numerical and categorical) or non-tabular data like time series. Indeed, these types of data are, in general, not represented in a Euclidean space and the aforementioned algorithms make use of the properties of such spaces, in particular for the construction of barycenters. In this paper, we reformulate the Evidential C-Means (ECM) problem for clustering complex data. We propose a new algorithm, Soft-ECM, which consistently positions the centroids of imprecise clusters requiring only a semi-metric. Our experiments show that Soft-ECM present results comparable to conventional fuzzy clustering approaches on numerical data, and we demonstrate its ability to handle mixed data and its benefits when combining fuzzy clustering with semi-metrics such as DTW for time series data.
- Abstract(参考訳): 信念関数に基づくクラスタリングは、不確実性と/または不正確性を効果的に表現する能力によって、機械学習コミュニティで注目を集めている。
しかし、既存のアルゴリズムは、混合データ(数値と分類)や時系列のような非語彙データなど、複雑なデータに適用することはできない。
実際、これらのタイプのデータは一般にユークリッド空間に表現されず、前述のアルゴリズムはそのような空間の性質、特にバリセンターの構築に利用している。
本稿では,複雑なデータをクラスタリングするためのECM(Evidential C-Means)問題を再構成する。
我々は,不正確なクラスタのセントロイドを一定に位置決めする新しいアルゴリズム,Soft-ECMを提案する。
実験により, 従来のファジィクラスタリング手法に匹敵するソフトECMの結果が得られた。また, 時系列データに対してDTWなどの半測定値とファジィクラスタリングを組み合わせた場合の, 混合データ処理とその利点を示す。
関連論文リスト
- Line Space Clustering (LSC): Feature-Based Clustering using K-medians and Dynamic Time Warping for Versatility [0.0]
行空間クラスタリング(Line Space Clustering、LSC)は、データポイントを新たに定義された特徴空間内の行に変換する表現である。
LSCはEuclideanとDynamic Time Warping(DTW)距離をパラメータαで重み付けした組み合わせ距離メートル法を採用している。
実験は、合成および実世界のデータセットに対するLCCの有効性を実証する。
論文 参考訳(メタデータ) (2025-03-20T01:27:10Z) - K-Means Clustering With Incomplete Data with the Use of Mahalanobis Distances [0.0]
我々は従来のユークリッド距離の代わりにマハラノビス距離を組み込む統一K平均アルゴリズムを開発した。
我々のアルゴリズムはスタンドアローンの計算法と不完全データを用いたK平均とK平均の両方を一貫して上回っている。
論文 参考訳(メタデータ) (2024-10-31T00:05:09Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Fuzzy K-Means Clustering without Cluster Centroids [21.256564324236333]
ファジィK平均クラスタリングは教師なしデータ分析において重要な手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィテクストK-Meansクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-07T12:25:03Z) - CDC: A Simple Framework for Complex Data Clustering [6.907065647386687]
複雑なデータクラスタリング(CDC)のためのフレームワークを提案する。
まず、グラフフィルタリングを用いて幾何学構造と属性情報を融合する。
そして、新しい類似性保存正規化器によって適応的に学習される高品質なアンカーの複雑さを低減する。
論文 参考訳(メタデータ) (2024-03-06T12:47:14Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Differentially-Private Clustering of Easy Instances [67.04951703461657]
異なるプライベートクラスタリングでは、個々のデータポイントに関する情報を公開せずに、$k$のクラスタセンターを特定することが目標だ。
我々は、データが"簡単"である場合にユーティリティを提供する実装可能な差分プライベートクラスタリングアルゴリズムを提供する。
我々は、非プライベートクラスタリングアルゴリズムを簡単なインスタンスに適用し、結果をプライベートに組み合わせることのできるフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-29T08:13:56Z) - Robust Trimmed k-means [70.88503833248159]
本稿では,外乱点とクラスタポイントを同時に識別するRobust Trimmed k-means (RTKM)を提案する。
RTKMは他の方法と競合することを示す。
論文 参考訳(メタデータ) (2021-08-16T15:49:40Z) - Decorrelated Clustering with Data Selection Bias [55.91842043124102]
本稿では,データ選択バイアスを伴うクラスタリングのためのデコリレーション正規化K-Meansアルゴリズム(DCKM)を提案する。
DCKMアルゴリズムは,選択バイアスによって生じる予期せぬ特徴相関を除去する必要があることを示す。
論文 参考訳(メタデータ) (2020-06-29T08:55:50Z) - Simple and Scalable Sparse k-means Clustering via Feature Ranking [14.839931533868176]
直感的で実装が簡単で,最先端のアルゴリズムと競合する,スパースk平均クラスタリングのための新しいフレームワークを提案する。
本手法は,属性のサブセットのクラスタリングや部分的に観測されたデータ設定など,タスク固有のアルゴリズムに容易に一般化できる。
論文 参考訳(メタデータ) (2020-02-20T02:41:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。