論文の概要: Wasserstein k-means with sparse simplex projection
- arxiv url: http://arxiv.org/abs/2011.12542v1
- Date: Wed, 25 Nov 2020 06:37:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 02:03:15.319293
- Title: Wasserstein k-means with sparse simplex projection
- Title(参考訳): スパース単純射影を持つwaserstein k-means
- Authors: Takumi Fukunaga, Hiroyuki Kasai
- Abstract要約: 本稿では,ヒストグラムデータに対するより高速なワッサースタイン$k$-meansアルゴリズムを提案する。
我々はデータサンプル、セントロイド、地価行列を縮小する。
クラスタリング品質の劣化を低く保ちながら,スパース・シンプルックス・プロジェクションを利用する。
- 参考スコア(独自算出の注目度): 20.661025590877774
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a proposal of a faster Wasserstein $k$-means algorithm
for histogram data by reducing Wasserstein distance computations and exploiting
sparse simplex projection. We shrink data samples, centroids, and the ground
cost matrix, which leads to considerable reduction of the computations used to
solve optimal transport problems without loss of clustering quality.
Furthermore, we dynamically reduced the computational complexity by removing
lower-valued data samples and harnessing sparse simplex projection while
keeping the degradation of clustering quality lower. We designate this proposed
algorithm as sparse simplex projection based Wasserstein $k$-means, or SSPW
$k$-means. Numerical evaluations conducted with comparison to results obtained
using Wasserstein $k$-means algorithm demonstrate the effectiveness of the
proposed SSPW $k$-means for real-world datasets
- Abstract(参考訳): 本稿では、ワッサーシュタイン距離計算を削減し、スパース単純射影を利用することにより、ヒストグラムデータに対するより高速なワッサーシュタイン$k$-meansアルゴリズムを提案する。
我々は、データサンプル、セントロイド、地価行列を縮小し、クラスタリング品質を損なうことなく最適な輸送問題を解決するために使用される計算をかなり削減する。
さらに, クラスタリング品質の劣化を低く抑えつつ, 低値データサンプルを除去し, スパース・シンプレックス・プロジェクションを活用し, 計算複雑性を動的に低減した。
提案アルゴリズムは,wasserstein $k$-means または sspw $k$-means を用いた sparse simplex projection として設計した。
wasserstein $k$-meansアルゴリズムによる実世界のデータセットに対するsspw $k$-meansの有効性を比較検討した数値評価
関連論文リスト
- Linearized Wasserstein dimensionality reduction with approximation
guarantees [65.16758672591365]
LOT Wassmap は、ワーッサーシュタイン空間の低次元構造を明らかにするための計算可能なアルゴリズムである。
我々は,LOT Wassmapが正しい埋め込みを実現し,サンプルサイズの増加とともに品質が向上することを示す。
また、LOT Wassmapがペア距離計算に依存するアルゴリズムと比較して計算コストを大幅に削減することを示す。
論文 参考訳(メタデータ) (2023-02-14T22:12:16Z) - Subspace clustering in high-dimensions: Phase transitions \&
Statistical-to-Computational gap [24.073221004661427]
部分空間クラスタリングを研究するための単純なモデルは、高次元の$k$-ガウス混合モデルである。
広帯域な高次元状態における統計的に最適な再構成誤差を正確に評価する。
論文 参考訳(メタデータ) (2022-05-26T17:47:35Z) - Sketch-and-Lift: Scalable Subsampled Semidefinite Program for $K$-means
Clustering [16.153709556346417]
セミデフィニティプログラミング(SDP)はクラスタリングなどの幅広い計算困難問題に対処するための強力なツールである。
本稿では,SDP緩和した$K$-meansクラスタリングを近似する線形時間複雑性アルゴリズムを提案する。
シミュレーション実験により,提案手法の統計的精度は最先端の高速クラスタリングアルゴリズムより優れていることが示された。
論文 参考訳(メタデータ) (2022-01-20T15:31:28Z) - Clustering Mixture Models in Almost-Linear Time via List-Decodable Mean
Estimation [58.24280149662003]
本稿では,データセットの大部分を敵が破壊できるリストデコタブル平均推定の問題について検討する。
我々は、ほぼ最適な統計的保証を達成するために、リストデコダブル平均推定のための新しいアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-06-16T03:34:14Z) - Partial Wasserstein Covering [10.52782170493037]
我々は、大規模なデータセットをエミュレートする目的で、部分的なWassersteinと呼ばれる一般的なタスクについて検討する。
この問題をワッサーシュタイン偏微分を目的関数とする離散最適化問題としてモデル化する。
我々は、シーンデータセットの駆動を含む部分的なワッサースタインの発散の観点から、2つのデータセットを効率的に作成できることを示します。
論文 参考訳(メタデータ) (2021-06-02T01:48:41Z) - Projection Robust Wasserstein Barycenter [36.97843660480747]
ワッサースタイン・バリセンターの 近似は 次元の呪いのため 数値的に困難です
本稿では,次元の呪いを緩和するプロジェクションロバストなワッサーシュタインバリセンタ(PRWB)を提案する。
論文 参考訳(メタデータ) (2021-02-05T19:23:35Z) - Learning High Dimensional Wasserstein Geodesics [55.086626708837635]
高次元の2つの確率分布の間のワッサーシュタイン測地線を計算するための新しい定式化と学習戦略を提案する。
ラグランジュ乗算器の手法を最適輸送(OT)問題の動的定式化に適用することにより、サドル点がワッサーシュタイン測地線であるミニマックス問題を導出する。
次に、深層ニューラルネットワークによる関数のパラメータ化を行い、トレーニングのためのサンプルベースの双方向学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2021-02-05T04:25:28Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - List-Decodable Mean Estimation in Nearly-PCA Time [50.79691056481693]
高次元におけるリストデコタブル平均推定の基本的な課題について検討する。
我々のアルゴリズムは、すべての$k = O(sqrtd) cup Omega(d)$に対して$widetildeO(ndk)$で実行されます。
我々のアルゴリズムの変種は、すべての$k$に対してランタイム$widetildeO(ndk)$を持ち、リカバリ保証の$O(sqrtlog k)$ Factorを犠牲にしている。
論文 参考訳(メタデータ) (2020-11-19T17:21:37Z) - Computationally efficient sparse clustering [67.95910835079825]
我々はPCAに基づく新しいクラスタリングアルゴリズムの有限サンプル解析を行う。
ここでは,ミニマックス最適誤クラスタ化率を,体制$|theta infty$で達成することを示す。
論文 参考訳(メタデータ) (2020-05-21T17:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。