論文の概要: DECWA : Density-Based Clustering using Wasserstein Distance
- arxiv url: http://arxiv.org/abs/2310.16552v1
- Date: Wed, 25 Oct 2023 11:10:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-26 15:13:57.583317
- Title: DECWA : Density-Based Clustering using Wasserstein Distance
- Title(参考訳): DECWA : Wasserstein 距離を用いた密度クラスタリング
- Authors: Nabil El Malki, Robin Cugny, Olivier Teste, Franck Ravat
- Abstract要約: 空間密度と確率的アプローチに基づく新しいクラスタリングアルゴリズムを提案する。
提案手法は, 様々なデータセットにおいて, 最先端の密度に基づくクラスタリング手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 1.4132765964347058
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Clustering is a data analysis method for extracting knowledge by discovering
groups of data called clusters. Among these methods, state-of-the-art
density-based clustering methods have proven to be effective for
arbitrary-shaped clusters. Despite their encouraging results, they suffer to
find low-density clusters, near clusters with similar densities, and
high-dimensional data. Our proposals are a new characterization of clusters and
a new clustering algorithm based on spatial density and probabilistic approach.
First of all, sub-clusters are built using spatial density represented as
probability density function ($p.d.f$) of pairwise distances between points. A
method is then proposed to agglomerate similar sub-clusters by using both their
density ($p.d.f$) and their spatial distance. The key idea we propose is to use
the Wasserstein metric, a powerful tool to measure the distance between $p.d.f$
of sub-clusters. We show that our approach outperforms other state-of-the-art
density-based clustering methods on a wide variety of datasets.
- Abstract(参考訳): クラスタリングは、クラスタと呼ばれるデータのグループを発見して知識を抽出するデータ分析手法である。
これらの手法のうち、最先端密度に基づくクラスタリング法は任意の形のクラスタに有効であることが証明されている。
奨励的な結果にもかかわらず、彼らは低密度のクラスター、同様の密度のクラスター、高次元のデータを見つけるのに苦しむ。
提案手法は,空間密度と確率的アプローチに基づくクラスタの新たな特徴付けと新しいクラスタリングアルゴリズムである。
まず、部分クラスタは、点間の対距離の確率密度関数(p.d.f$)として表される空間密度を用いて構築される。
次に、その密度(p.d.f$)と空間距離の両方を用いて、類似のサブクラスタを凝集する手法を提案する。
私たちが提案する重要なアイデアは、サブクラスタの$p.d.f$間の距離を測定する強力なツールであるwassersteinメトリックを使用することです。
提案手法は,様々なデータセット上で,最先端の密度に基づくクラスタリング手法よりも優れていることを示す。
関連論文リスト
- Clustering Based on Density Propagation and Subcluster Merging [92.15924057172195]
本稿では,クラスタ数を自動的に決定し,データ空間とグラフ空間の両方に適用可能な密度に基づくノードクラスタリング手法を提案する。
二つのノード間の距離を計算する従来の密度クラスタリング法とは異なり,提案手法は伝播過程を通じて密度を決定する。
論文 参考訳(メタデータ) (2024-11-04T04:09:36Z) - SHADE: Deep Density-based Clustering [13.629470968274]
SHADEは密度接続性を損失関数に組み込む最初のディープクラスタリングアルゴリズムである。
ディープオートエンコーダの表現力で高次元および大規模データセットをサポートする。
これはクラスタリングの品質、特に非ガウスクラスタを含むデータにおいて、既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2024-10-08T18:03:35Z) - GFDC: A Granule Fusion Density-Based Clustering with Evidential
Reasoning [22.526274021556755]
密度に基づくクラスタリングアルゴリズムは任意の形状のクラスタを検出できるため、広く適用されている。
本稿では,GFDCを用いた粒界融合密度クラスタリングを提案する。
サンプルの局所密度と大域密度は、まずスパース度測定によって測定される。
次に、情報グラニュラーを高密度および低密度領域に生成し、大きな密度差を持つクラスタの処理を支援する。
論文 参考訳(メタデータ) (2023-05-20T06:27:31Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - VDPC: Variational Density Peak Clustering Algorithm [16.20037014662979]
本稿では,変分密度のクラスタを識別するための変分密度ピーククラスタリング(VDPC)アルゴリズムを提案する。
VDPCは2つの古典的アルゴリズム(DPCとDBSCAN)と4つの最先端拡張DPCアルゴリズムより優れている。
論文 参考訳(メタデータ) (2021-12-29T12:50:09Z) - Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly
Types [60.45942774425782]
我々は異常クラスタリングを導入し、その目標はデータを異常型の一貫性のあるクラスタにまとめることである。
これは異常検出とは違い、その目標は異常を通常のデータから分割することである。
パッチベースの事前訓練されたディープ埋め込みとオフザシェルフクラスタリング手法を用いた,単純で効果的なクラスタリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-21T23:11:33Z) - Density-Based Clustering with Kernel Diffusion [59.4179549482505]
単位$d$次元ユークリッド球のインジケータ関数に対応するナイーブ密度は、密度に基づくクラスタリングアルゴリズムで一般的に使用される。
局所分布特性と滑らかさの異なるデータに適応する新しいカーネル拡散密度関数を提案する。
論文 参考訳(メタデータ) (2021-10-11T09:00:33Z) - Skeleton Clustering: Dimension-Free Density-based Clustering [0.2538209532048866]
本稿では,スケルトンクラスタリングという密度に基づくクラスタリング手法を提案する。
次元の呪いを回避すべく,次元に依存しないが直感的な幾何学的解釈を持つ代理密度測度を提案する。
論文 参考訳(メタデータ) (2021-04-21T21:25:02Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。