論文の概要: Spectral Clustering for Discrete Distributions
- arxiv url: http://arxiv.org/abs/2401.13913v1
- Date: Thu, 25 Jan 2024 03:17:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-26 16:01:05.196439
- Title: Spectral Clustering for Discrete Distributions
- Title(参考訳): 離散分布のためのスペクトルクラスタリング
- Authors: Zixiao Wang, Dong Qiao, Jicong Fan
- Abstract要約: 離散分布クラスタリング(D2C)は、ワッサーシュタイン・バリセンタ法によってしばしば解決された。
本稿では,スペクトルクラスタリングと分布親和性測定に基づく簡易かつ効果的なフレームワークを提案する。
本稿では,クラスタリング分布における提案手法の成功を理論的に保証する。
- 参考スコア(独自算出の注目度): 25.232132445240243
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Discrete distribution clustering (D2C) was often solved by Wasserstein
barycenter methods. These methods are under a common assumption that clusters
can be well represented by barycenters, which may not hold in many real
applications. In this work, we propose a simple yet effective framework based
on spectral clustering and distribution affinity measures (e.g., maximum mean
discrepancy and Wasserstein distance) for D2C. To improve the scalability, we
propose to use linear optimal transport to construct affinity matrices
efficiently on large datasets. We provide theoretical guarantees for the
success of the proposed methods in clustering distributions. Experiments on
synthetic and real data show that our methods outperform the baselines largely
in terms of both clustering accuracy and computational efficiency.
- Abstract(参考訳): 離散分布クラスタリング(d2c)はwasserstein barycenter法によってしばしば解かれた。
これらの方法は、クラスタがbarycentersによってうまく表現できるという共通の仮定の下に置かれている。
本研究では,d2cに対するスペクトルクラスタリングと分布親和性尺度(例えば,最大平均偏差とワッサースタイン距離)に基づく,単純かつ効果的な枠組みを提案する。
拡張性を向上させるため,大規模データセット上での親和性行列を効率的に構築するために線形最適輸送法を提案する。
本稿では,クラスタリング分布における提案手法の成功を理論的に保証する。
合成データおよび実データを用いた実験により,本手法はクラスタリング精度と計算効率の両面で,ベースラインよりも優れていることがわかった。
関連論文リスト
- Synergistic eigenanalysis of covariance and Hessian matrices for
enhanced binary classification [75.90957645766676]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
我々のアプローチは、クラス間の平均距離を最大化し、クラス内の分散を最小化する能力を確立する形式的な証明によって裏付けられている。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - Estimating Barycenters of Distributions with Neural Optimal Transport [96.79562439021494]
本稿では,Wasserstein Barycenter問題を解くための新しいスケーラブルなアプローチを提案する。
我々の手法は最近のNeural OTソルバをベースとしている。
また,提案手法の理論的誤差境界も確立する。
論文 参考訳(メタデータ) (2024-02-06T09:17:07Z) - Distributed Markov Chain Monte Carlo Sampling based on the Alternating
Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。
我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。
シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文 参考訳(メタデータ) (2024-01-29T02:08:40Z) - A general theory for robust clustering via trimmed mean [7.650319416775203]
提案手法は,新しいトリミング平均型セントロイド推定器を用いたハイブリッドクラスタリング手法を導入し,誤ラベル保証を実現する。
その結果, 誤差がガウス以下の分布に従えば, ガウス以下のケースに還元されることがわかった。
これらの初期セントロイド推定値は,その後のクラスタリングアルゴリズムにおいて,最適な誤ラベル率を達成するのに十分であることを示す。
論文 参考訳(メタデータ) (2024-01-10T22:56:44Z) - DECWA : Density-Based Clustering using Wasserstein Distance [1.4132765964347058]
空間密度と確率的アプローチに基づく新しいクラスタリングアルゴリズムを提案する。
提案手法は, 様々なデータセットにおいて, 最先端の密度に基づくクラスタリング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-25T11:10:08Z) - Density Ratio Estimation via Infinitesimal Classification [85.08255198145304]
そこで我々は, DRE-inftyを提案する。 DRE-inftyは, 密度比推定(DRE)を, より簡単なサブプロブレムに還元する手法である。
モンテカルロ法にインスパイアされ、中間ブリッジ分布の無限連続体を介して2つの分布の間を滑らかに補間する。
提案手法は,複雑な高次元データセット上での相互情報推定やエネルギーベースモデリングなどの下流タスクにおいて良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-22T06:26:29Z) - Density-Based Clustering with Kernel Diffusion [59.4179549482505]
単位$d$次元ユークリッド球のインジケータ関数に対応するナイーブ密度は、密度に基づくクラスタリングアルゴリズムで一般的に使用される。
局所分布特性と滑らかさの異なるデータに適応する新しいカーネル拡散密度関数を提案する。
論文 参考訳(メタデータ) (2021-10-11T09:00:33Z) - Clustering Large Data Sets with Incremental Estimation of Low-density
Separating Hyperplanes [16.3460693863947]
教師なし文脈における低密度超平面分離器の効率的な取得法を提案する。
提案手法による実験により、関連するベンチマークと比較した場合、速度と精度の両面で非常に競争力があることが示された。
論文 参考訳(メタデータ) (2021-08-07T12:45:05Z) - Divide-and-conquer based Large-Scale Spectral Clustering [8.545202841051582]
そこで本研究では,分散・分散型大規模スペクトルクラスタリング手法を提案し,効率と効率のバランスを良くする。
提案手法は,既存の大規模スペクトルクラスタリングよりも計算量が少ない。
論文 参考訳(メタデータ) (2021-04-30T15:09:45Z) - Continuous Regularized Wasserstein Barycenters [51.620781112674024]
正規化ワッサーシュタイン・バリセンタ問題に対する新しい双対定式化を導入する。
我々は、強い双対性を確立し、対応する主対関係を用いて、正規化された輸送問題の双対ポテンシャルを用いて暗黙的にバリセンターをパラメトリゼーションする。
論文 参考訳(メタデータ) (2020-08-28T08:28:06Z) - Hyperspectral Image Clustering with Spatially-Regularized Ultrametrics [7.487718119544157]
超距離の空間正規化スペクトルクラスタリングに基づくハイパースペクトル画像の教師なしクラスタリング法を提案する。
提案手法は,データ密度とジオメトリを効率的に組み合わせて,ラベルのトレーニングを必要とせず,データの材料クラスを識別する。
論文 参考訳(メタデータ) (2020-04-10T14:27:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。