論文の概要: Estimation of the number of clusters on d-dimensional sphere
- arxiv url: http://arxiv.org/abs/2011.07530v2
- Date: Thu, 13 May 2021 15:24:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 06:54:44.810433
- Title: Estimation of the number of clusters on d-dimensional sphere
- Title(参考訳): d次元球面上のクラスター数の推定
- Authors: Kazuhisa Fujita
- Abstract要約: 球面X平均(SX平均)と呼ばれる新しい手法を提案し,D次元球面上のクラスター数を推定する。
SX-平均は、データがフォン・ミセス=フィッシャー分布の混合から生成されると仮定するモデルに基づく方法である。
本稿では,提案手法を概説し,クラスタ数の推定性能を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spherical data is distributed on the sphere. The data appears in various
fields such as meteorology, biology, and natural language processing. However,
a method for analysis of spherical data does not develop enough yet. One of the
important issues is an estimation of the number of clusters in spherical data.
To address the issue, I propose a new method called the Spherical X-means
(SX-means) that can estimate the number of clusters on d-dimensional sphere.
The SX-means is the model-based method assuming that the data is generated from
a mixture of von Mises-Fisher distributions. The present paper explains the
proposed method and shows its performance of estimation of the number of
clusters.
- Abstract(参考訳): 球面データは球面上に分散される。
データは気象学、生物学、自然言語処理などの様々な分野に現れる。
しかし,球面データの解析方法はまだ十分に発達していない。
重要な問題の1つは、球面データにおけるクラスタ数の推定である。
そこで本稿では,d-次元球面上のクラスター数を推定できる球面x-means (sx-means) という新しい手法を提案する。
SX平均は、データがフォン・ミセス=フィッシャー分布の混合から生成されると仮定するモデルに基づく手法である。
本稿では,提案手法を説明し,クラスタ数の推定性能を示す。
関連論文リスト
- Spatio-Temporal Surrogates for Interaction of a Jet with High
Explosives: Part II -- Clustering Extremely High-Dimensional Grid-Based Data [0.0]
本稿では,高爆薬と相互作用するジェット機のシミュレーションから得られた出力データについて考察する。
ランダムなプロジェクションのランダム性と,k平均クラスタリングにおける初期セントロイドの選択を併用して,データセット内のクラスタ数を決定する方法を示す。
論文 参考訳(メタデータ) (2023-07-03T23:36:43Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Research on Efficient Fuzzy Clustering Method Based on Local Fuzzy
Granular balls [67.33923111887933]
本稿では,データをグラニュラーボールを用いてファジィにイテレーションし,その位置にある2つのグラニュラーボールのみをデータのメンバーシップ度として検討する。
ファジィグラニュラーボールセットは、異なるデータシナリオに直面して、より多くの処理方法を使用することができる。
論文 参考訳(メタデータ) (2023-03-07T01:52:55Z) - Wasserstein $K$-means for clustering probability distributions [16.153709556346417]
ユークリッド空間では、セントロイドと距離に基づくK$平均の定式化は同値である。
現代の機械学習アプリケーションでは、データは確率分布として発生し、測度値のデータを扱う自然な一般化は最適な輸送距離を使用する。
SDP緩和ワッサースタイン$K$-平均は、クラスターが2ドルワッサースタイン計量の下で十分に分離されているため、正確な回復を達成することができることを示す。
論文 参考訳(メタデータ) (2022-09-14T23:43:16Z) - An adaptive granularity clustering method based on hyper-ball [11.35322380857363]
本手法は, 類似した分布を持つデータがハイパーボールとなり, 隣接するハイパーボールがクラスタとなるという考え方に基づいている。
この手法は「大規模ファースト」の認知法則に基づき、単純で非パラメトリックな方法で形状を考慮せずにクラスターを識別することができる。
論文 参考訳(メタデータ) (2022-05-29T07:44:09Z) - Time-inhomogeneous diffusion geometry and topology [69.55228523791897]
拡散凝縮(英: Diffusion condensation)は、各ステップが最初に計算し、そのデータに拡散演算子を適用する時間不均質な過程である。
我々はこの過程の収束と進化を幾何学的、スペクトル的、位相的観点から理論的に分析する。
我々の研究は拡散凝縮の収束に関する理論的洞察を与え、トポロジカルデータ解析と幾何学的データ解析のリンクを提供することを示している。
論文 参考訳(メタデータ) (2022-03-28T16:06:17Z) - Local versions of sum-of-norms clustering [77.34726150561087]
本手法はボールモデルにおいて任意に閉じた球を分離できることを示す。
我々は、不連結連結集合のクラスタリングで発生する誤差に定量的な有界性を証明した。
論文 参考訳(メタデータ) (2021-09-20T14:45:29Z) - Manifold Hypothesis in Data Analysis: Double Geometrically-Probabilistic
Approach to Manifold Dimension Estimation [92.81218653234669]
本稿では, 多様体仮説の検証と基礎となる多様体次元推定に対する新しいアプローチを提案する。
我々の幾何学的手法はミンコフスキー次元計算のためのよく知られたボックスカウントアルゴリズムのスパースデータの修正である。
実データセットの実験では、2つの手法の組み合わせに基づく提案されたアプローチが強力で効果的であることが示されている。
論文 参考訳(メタデータ) (2021-07-08T15:35:54Z) - Sum-of-norms clustering does not separate nearby balls [49.1574468325115]
我々は,データセットを一般的な測度に置き換えた,和和クラスタリングの連続的なバージョンを示す。
我々は,離散データポイントの場合においても,新たなクラスタリングの局所的特徴を記述し,証明する。
論文 参考訳(メタデータ) (2021-04-28T13:35:17Z) - Manifold Density Estimation via Generalized Dequantization [9.090451761951101]
ある種のデータは、その基礎となる幾何学がユークリッドであると仮定してよくモデル化されていない。
例えば、ある種のデータは球面上に存在することが知られているかもしれない。
そこで我々は,周辺ユークリッド空間の座標変換を通じて解釈する「量子化」に関する文献に触発された手法を提案する。
論文 参考訳(メタデータ) (2021-02-14T12:40:41Z) - A new model for natural groupings in high-dimensional data [0.4604003661048266]
クラスタリングは、一連のポイントをグループに分割することを目的としています。
最近の実験では、異なるバイナリグルーピングを形成するいくつかの高次元データセットが発見されている。
本稿では,この現象を説明できる確率モデルについて述べる。
論文 参考訳(メタデータ) (2019-09-14T02:38:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。