論文の概要: Spatial Transformer K-Means
- arxiv url: http://arxiv.org/abs/2202.07829v1
- Date: Wed, 16 Feb 2022 02:25:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-17 14:25:36.782821
- Title: Spatial Transformer K-Means
- Title(参考訳): 空間変圧器k-means
- Authors: Romain Cosentino, Randall Balestriero, Yanis Bahroun, Anirvan
Sengupta, Richard Baraniuk, Behnaam Aazhang
- Abstract要約: 複雑なデータ埋め込みは、$K$-meansのパフォーマンスをプッシュするように設計されている。
非剛体変換に不変な類似度尺度で固有データ空間の保存とK平均の増大を提案する。
- 参考スコア(独自算出の注目度): 16.775789494555017
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: K-means defines one of the most employed centroid-based clustering algorithms
with performances tied to the data's embedding. Intricate data embeddings have
been designed to push $K$-means performances at the cost of reduced theoretical
guarantees and interpretability of the results. Instead, we propose preserving
the intrinsic data space and augment K-means with a similarity measure
invariant to non-rigid transformations. This enables (i) the reduction of
intrinsic nuisances associated with the data, reducing the complexity of the
clustering task and increasing performances and producing state-of-the-art
results, (ii) clustering in the input space of the data, leading to a fully
interpretable clustering algorithm, and (iii) the benefit of convergence
guarantees.
- Abstract(参考訳): k-meansは、データ埋め込みに関連付けられたパフォーマンスを持つ、最も使われているcentroidベースのクラスタリングアルゴリズムの1つを定義している。
複雑なデータ埋め込みは、理論的な保証と結果の解釈可能性を減らすコストで、k$-meansのパフォーマンスをプッシュするように設計されている。
代わりに、本質的なデータ空間を保存し、K平均を非剛体変換に不変な類似度尺度で拡張することを提案する。
これにより
(i)データに関連する内在的迷惑の低減、クラスタリングタスクの複雑さの低減、パフォーマンスの向上、最先端の成果の創出。
(ii)データの入力空間におけるクラスタリングにより、完全に解釈可能なクラスタリングアルゴリズムが実現し、
三 収束保証の利益
関連論文リスト
- Distributional Reduction: Unifying Dimensionality Reduction and
Clustering with Gromov-Wasserstein Projection [50.51460159104604]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
伝統的に、これは次元還元法を用いて解釈可能な空間にデータを投影したり、意味のあるクラスタにポイントを整理する。
私たちは新しい視点 – 流通の視点 – を提供しています。
我々はクラスタリングと次元還元を分散還元と呼ばれる単一のフレームワークに統合する。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Federated K-means Clustering [0.0]
フェデレートラーニング(Federated Learning)は、データをプールすることなく、機械学習目的で分散データセットを使用することを可能にする技術である。
この研究は、K平均クラスタリングを連合的に実装するアルゴリズムを導入する。
論文 参考訳(メタデータ) (2023-10-02T13:32:00Z) - Wireless Federated $k$-Means Clustering with Non-coherent Over-the-Air
Computation [14.087062902871212]
OACスキームは、バランスの取れた数系における数値の表現を利用するエンコーダに依存している。
非効率なセンチロイドの再初期化法を提案し、不均一なデータ分散のための提案手法の性能を向上させる。
論文 参考訳(メタデータ) (2023-08-11T20:12:26Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Differentially Private Federated Clustering over Non-IID Data [59.611244450530315]
クラスタリングクラスタ(FedC)問題は、巨大なクライアント上に分散されたラベルなしデータサンプルを、サーバのオーケストレーションの下で有限のクライアントに正確に分割することを目的としている。
本稿では,DP-Fedと呼ばれる差分プライバシー収束手法を用いた新しいFedCアルゴリズムを提案する。
提案するDP-Fedの様々な属性は、プライバシー保護の理論的解析、特に非識別的かつ独立に分散された(非i.d.)データの場合において得られる。
論文 参考訳(メタデータ) (2023-01-03T05:38:43Z) - Fast and Interpretable Consensus Clustering via Minipatch Learning [0.0]
IMPACC: Interpretable MiniPatch Adaptive Consensus Clustering を開発した。
我々は、信頼性と計算コストの両面で改善された観測のための適応型サンプリング手法を開発した。
その結果,より正確で解釈可能なクラスタソリューションが得られた。
論文 参考訳(メタデータ) (2021-10-05T22:39:28Z) - Automated Clustering of High-dimensional Data with a Feature Weighted
Mean Shift Algorithm [16.0817847880416]
平均シフトは、データポイントを領域内のデータポイントの最高密度を表すモードにシフトする単純なインタラクティブな手順です。
特徴の重要性を効率的に学ぶために、シンプルでエレガントな特徴重み付き平均シフト型を提案します。
その結果得られたアルゴリズムは、従来の平均シフトクラスタリング手順を上回るだけでなく、計算の単純さを保っている。
論文 参考訳(メタデータ) (2020-12-20T14:00:40Z) - Effective Data-aware Covariance Estimator from Compressed Data [63.16042585506435]
本研究では,データ対応重み付きサンプリングベース共分散行列推定器,すなわち DACE を提案し,非バイアス共分散行列推定を行う。
我々は、DACEの優れた性能を示すために、合成データセットと実世界のデータセットの両方で広範な実験を行う。
論文 参考訳(メタデータ) (2020-10-10T10:10:28Z) - Decorrelated Clustering with Data Selection Bias [55.91842043124102]
本稿では,データ選択バイアスを伴うクラスタリングのためのデコリレーション正規化K-Meansアルゴリズム(DCKM)を提案する。
DCKMアルゴリズムは,選択バイアスによって生じる予期せぬ特徴相関を除去する必要があることを示す。
論文 参考訳(メタデータ) (2020-06-29T08:55:50Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z) - Simple and Scalable Sparse k-means Clustering via Feature Ranking [14.839931533868176]
直感的で実装が簡単で,最先端のアルゴリズムと競合する,スパースk平均クラスタリングのための新しいフレームワークを提案する。
本手法は,属性のサブセットのクラスタリングや部分的に観測されたデータ設定など,タスク固有のアルゴリズムに容易に一般化できる。
論文 参考訳(メタデータ) (2020-02-20T02:41:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。