論文の概要: Mixture Complexity and Its Application to Gradual Clustering Change
Detection
- arxiv url: http://arxiv.org/abs/2007.07467v1
- Date: Wed, 15 Jul 2020 03:49:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 04:41:47.371326
- Title: Mixture Complexity and Its Application to Gradual Clustering Change
Detection
- Title(参考訳): 混合複雑性と段階的クラスタリング変化検出への応用
- Authors: Shunki Kyoya and Kenji Yamanishi
- Abstract要約: 混合複雑性(MC)と呼ばれる新しい概念を用いて混合モデルにおけるクラスタサイズを測定することを提案する。
これは情報理論の観点から正式に定義されており、重なり合いと重みバイアスを考慮したクラスタサイズの自然な拡張と見なすことができる。
混合モデルの階層構造に応じてMCを分解できることを実証する。
- 参考スコア(独自算出の注目度): 18.96912763708634
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In model-based clustering using finite mixture models, it is a significant
challenge to determine the number of clusters (cluster size). It used to be
equal to the number of mixture components (mixture size); however, this may not
be valid in the presence of overlaps or weight biases. In this study, we
propose to continuously measure the cluster size in a mixture model by a new
concept called mixture complexity (MC). It is formally defined from the
viewpoint of information theory and can be seen as a natural extension of the
cluster size considering overlap and weight bias. Subsequently, we apply MC to
the issue of gradual clustering change detection. Conventionally, clustering
changes has been considered to be abrupt, induced by the changes in the mixture
size or cluster size. Meanwhile, we consider the clustering changes to be
gradual in terms of MC; it has the benefits of finding the changes earlier and
discerning the significant and insignificant changes. We further demonstrate
that the MC can be decomposed according to the hierarchical structures of the
mixture models; it helps us to analyze the detail of substructures.
- Abstract(参考訳): 有限混合モデルを用いたモデルベースクラスタリングでは、クラスタ数(クラスタサイズ)を決定することが重要な課題である。
かつては混合成分の数(混合サイズ)に等しいものであったが、重なり合いや重みバイアスが存在する場合には有効ではない。
本研究では,混合複雑性(MC)と呼ばれる新しい概念を用いて,混合モデルのクラスタサイズを連続的に測定することを提案する。
情報理論の観点で正式に定義されており、重なりや重みバイアスを考慮したクラスターサイズの自然な拡張と見なすことができる。
その後,段階的クラスタリング変化検出の問題にmcを適用する。
従来、クラスタリングの変化は、混合サイズやクラスタサイズの変化によって、突然であると考えられてきた。
一方、クラスタ化の変化はmcの観点で徐々に変化し、早期に変化を見つけ、重要かつ重要でない変化を識別するメリットがあると考えています。
さらに,混合モデルの階層構造に従ってmcを分解できることを実証し,部分構造の詳細を分析するのに有用であることを示した。
関連論文リスト
- Clustering Based on Density Propagation and Subcluster Merging [92.15924057172195]
本稿では,クラスタ数を自動的に決定し,データ空間とグラフ空間の両方に適用可能な密度に基づくノードクラスタリング手法を提案する。
二つのノード間の距離を計算する従来の密度クラスタリング法とは異なり,提案手法は伝播過程を通じて密度を決定する。
論文 参考訳(メタデータ) (2024-11-04T04:09:36Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Clustering Change Sign Detection by Fusing Mixture Complexity [7.620964812906982]
クラスタ構造は、データが有限混合モデルで表現される場合、クラスタの数などの離散的な構造特性を指す。
私たちは、時間とともにクラスタ構造が徐々に変化するシナリオに注目します。
複数の混合数が可能である状況に対処するために, MC の拡張として MC 融合を提案する。
論文 参考訳(メタデータ) (2024-03-27T05:50:23Z) - Dendrogram of mixing measures: Hierarchical clustering and model
selection for finite mixture models [5.044813181406083]
本稿では,過度に適合した潜在混合指標から構築した階層的クラスタリング木(デンドログラム)を用いて,混合モデルを要約し,選択する新しい方法を提案する。
提案手法は,集合的階層的クラスタリングと混合モデリングを橋渡しする。
論文 参考訳(メタデータ) (2024-03-04T02:31:53Z) - On Mitigating Hard Clusters for Face Clustering [48.39472979642971]
顔クラスタリングは、大規模な未ラベルの顔画像を使用して顔認識システムをスケールアップするための有望な方法である。
我々はNDDe(Neighborhood-Diffusion-based Density)とTPDi(Transition-Probability-based Distance)の2つの新しいモジュールを紹介した。
複数のベンチマーク実験により,各モジュールが最終性能に寄与することが示された。
論文 参考訳(メタデータ) (2022-07-25T03:55:15Z) - Correlation Clustering Reconstruction in Semi-Adversarial Models [70.11015369368272]
相関クラスタリングは多くのアプリケーションにおいて重要なクラスタリング問題である。
本研究では,ランダムノイズや対向的な修正によって崩壊した潜伏クラスタリングを再構築しようとする,この問題の再構築版について検討する。
論文 参考訳(メタデータ) (2021-08-10T14:46:17Z) - Skeleton Clustering: Dimension-Free Density-based Clustering [0.2538209532048866]
本稿では,スケルトンクラスタリングという密度に基づくクラスタリング手法を提案する。
次元の呪いを回避すべく,次元に依存しないが直感的な幾何学的解釈を持つ代理密度測度を提案する。
論文 参考訳(メタデータ) (2021-04-21T21:25:02Z) - Vine copula mixture models and clustering for non-Gaussian data [0.0]
連続データのための新しいブドウパウラ混合モデルを提案する。
本研究では, モデルベースクラスタリングアルゴリズムにおいて, ベインコプラ混合モデルが他のモデルベースクラスタリング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-02-05T16:04:26Z) - Consistent Estimation of Identifiable Nonparametric Mixture Models from
Grouped Observations [84.81435917024983]
この研究は、グループ化された観測から任意の同定可能な混合モデルを一貫して推定するアルゴリズムを提案する。
ペア化された観測のために実践的な実装が提供され、アプローチは既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-06-12T20:44:22Z) - Repulsive Mixture Models of Exponential Family PCA for Clustering [127.90219303669006]
指数関数型家族主成分分析(EPCA)の混合拡張は、従来のEPCAよりもデータ分布に関する構造情報を符号化するように設計された。
従来のEPCAの混合は、モデルの冗長性、すなわち混合成分間の重なりが問題であり、データクラスタリングの曖昧さを引き起こす可能性がある。
本稿では, 混合成分間での反発性増感前処理を導入し, ベイズ式に分散EPCA混合(DEPCAM)モデルを開発した。
論文 参考訳(メタデータ) (2020-04-07T04:07:29Z) - Blocked Clusterwise Regression [0.0]
我々は、各ユニットが複数の潜伏変数を持つことを可能にすることで、離散的非観測的不均一性に対する以前のアプローチを一般化する。
我々は,クラスタの過剰な数のクラスタリングの理論に寄与し,この設定に対する新たな収束率を導出する。
論文 参考訳(メタデータ) (2020-01-29T23:29:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。