論文の概要: Rectified Euler k-means and Beyond
- arxiv url: http://arxiv.org/abs/2108.03081v1
- Date: Fri, 6 Aug 2021 12:35:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-09 18:22:41.017775
- Title: Rectified Euler k-means and Beyond
- Title(参考訳): ユーラーk-平均と超越
- Authors: Yunxia Lin, Songcan chen
- Abstract要約: Euler k-means (EulerK) は、まずデータを複素写像を通じて等次元空間の単位超球面にマッピングする。
EulerKはノイズや外れ値にも頑丈である。
データ構造をよりよく特徴付けるために、地図上の実際の遠心点を取得しながら、EulerKの利点を保ちながらRectified Euler k-means法、すなわちREK1とREK2を提案する。
- 参考スコア(独自算出の注目度): 27.471041765364884
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Euler k-means (EulerK) first maps data onto the unit hyper-sphere surface of
equi-dimensional space via a complex mapping which induces the robust Euler
kernel and next employs the popular $k$-means. Consequently, besides enjoying
the virtues of k-means such as simplicity and scalability to large data sets,
EulerK is also robust to noises and outliers. Although so, the centroids
captured by EulerK deviate from the unit hyper-sphere surface and thus in
strict distributional sense, actually are outliers. This weird phenomenon also
occurs in some generic kernel clustering methods. Intuitively, using such
outlier-like centroids should not be quite reasonable but it is still seldom
attended. To eliminate the deviation, we propose two Rectified Euler k-means
methods, i.e., REK1 and REK2, which retain the merits of EulerK while acquire
real centroids residing on the mapped space to better characterize the data
structures. Specifically, REK1 rectifies EulerK by imposing the constraint on
the centroids while REK2 views each centroid as the mapped image from a
pre-image in the original space and optimizes these pre-images in Euler kernel
induced space. Undoubtedly, our proposed REKs can methodologically be extended
to solve problems of such a category. Finally, the experiments validate the
effectiveness of REK1 and REK2.
- Abstract(参考訳): オイラー k-平均 (Euler k-means, EulerK) は、まずデータを等次元空間の単位超球面に、ロバストなオイラー核を誘導する複素写像によってマッピングし、次に人気のある$k$-means を用いる。
したがって、大規模データセットに対する単純さやスケーラビリティといったk-meansの特質を享受するだけでなく、EulerKはノイズや外れ値にも頑丈である。
しかし、オイラーKによって捕獲された中心体は単位超球面から逸脱し、したがって厳密な分布感覚で、実際は外れ値である。
この奇妙な現象は、いくつかのジェネリックカーネルクラスタリング手法でも起こります。
直感的には、このような外れたセントロイドを使うのはあまり合理的ではないが、ほとんど参加しない。
偏差をなくすために,データ構造をよりよく特徴付けるために,地図上に存在する実遠心域を取得しながら,オイラーKの利点を保ちながら,REK1とREK2の2つの定形オイラーk平均法を提案する。
具体的には、REK1は中心体に制約を課すことでオイラーKを修正し、REK2は各中心体を元の空間における前像から写像された像とみなし、これらの前像をオイラー核誘導空間で最適化する。
提案したREKは方法論的に拡張して,そのようなカテゴリの問題を解決することができる。
最後に、実験はREK1とREK2の有効性を検証する。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - KPZ scaling from the Krylov space [83.88591755871734]
近年,Cardar-Parisi-Zhangスケーリングをリアルタイムの相関器や自動相関器に示す超拡散が報告されている。
これらの結果から着想を得て,Krylov演算子に基づく相関関数のKPZスケーリングについて検討する。
論文 参考訳(メタデータ) (2024-06-04T20:57:59Z) - Parametric entropy based Cluster Centriod Initialization for k-means
clustering of various Image datasets [0.0]
k-meansはクラスタ分析に最もよく使われているが、最も単純なアルゴリズムの1つである。
本稿では,パラメトリックエントロピーを用いた画像データ上でのk-meansの性能解析を行う。
一般画像データセットに対する最適適合エントロピー尺度を提案する。
論文 参考訳(メタデータ) (2023-08-15T11:28:02Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - No More Than 6ft Apart: Robust K-Means via Radius Upper Bounds [17.226362076527764]
k-means、k-medoids、k-centersといったCentroidベースのクラスタリング手法は、探索データ解析においてゴーツーツールとして強く応用されている。
多くの場合、これらの手法はデータセットの視覚化や要約のためにデータ多様体の代表的なセントロイドを得るのに使用される。
本研究では, 遠心円周波によって形成されるクラスターに最大半径制約$r$を導入することにより, このようなシナリオを緩和することを提案する。
論文 参考訳(メタデータ) (2022-03-04T18:59:02Z) - Accelerating Spherical k-Means [1.7188280334580197]
球k平均(Spherical k-means)は、文書ベクトルのようなスパースおよび高次元データのためのクラスタリングアルゴリズムである。
エルカンとハマーリーのアルゴリズムのような多くの加速技術はユークリッド距離の三角形の不等式に依存している。
本稿では,エルカンとハメリーの加速度をユークリッド距離の代わりにコサインと直接連携する球k平均アルゴリズムに組み込む。
論文 参考訳(メタデータ) (2021-07-08T19:24:09Z) - Adaptive Explicit Kernel Minkowski Weighted K-means [1.3535770763481905]
カーネル K-平均は、K-平均をカーネル空間に拡張し、非線形構造を捉えることができ、任意の形状のクラスターを識別することができる。
本稿では, 線形および非線形アプローチの利点を, 駆動された対応する有限次元特徴写像を用いて組み合わせる手法を提案する。
論文 参考訳(メタデータ) (2020-12-04T19:14:09Z) - (k, l)-Medians Clustering of Trajectories Using Continuous Dynamic Time
Warping [57.316437798033974]
本研究では,トラジェクトリの集中型クラスタリングの問題について考察する。
我々はDTWの連続バージョンを距離測定として使用することを提案し、これをCDTW(Continuous dynamic time warping)と呼ぶ。
一連の軌道から中心を計算し、その後反復的に改善する実践的な方法を示す。
論文 参考訳(メタデータ) (2020-12-01T13:17:27Z) - Debiased Sinkhorn barycenters [110.79706180350507]
最適輸送(OT)におけるエントロピー正則化(Entropy regularization)は、機械学習におけるWassersteinメトリクスやバリセンタに対する近年の関心の原動力となっている。
このバイアスがエントロピー正則化器を定義する基準測度とどのように密接に関連しているかを示す。
両世界の長所を保ち、エントロピーを滑らかにしないシンクホーン様の高速な反復をデバイアスド・ワッサースタインのバリセンタとして提案する。
論文 参考訳(メタデータ) (2020-06-03T23:06:02Z) - Ball k-means [53.89505717006118]
Ball k-meansアルゴリズムは、ポイントセントロイド距離計算の削減に集中して、クラスタを記述するためにボールを使用する。
高速、余分なパラメータなし、単純設計のボールk平均アルゴリズムは、素早いk平均アルゴリズムを全面的に置き換える。
論文 参考訳(メタデータ) (2020-05-02T10:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。