論文の概要: Turtle shell clustering: A mixture approach to discriminative clustering with applications to flow cytometry and other data
- arxiv url: http://arxiv.org/abs/2604.23083v1
- Date: Sat, 25 Apr 2026 00:33:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.144958
- Title: Turtle shell clustering: A mixture approach to discriminative clustering with applications to flow cytometry and other data
- Title(参考訳): タートルシェルクラスタリング: 識別的クラスタリングとフローサイトメトリーと他のデータとの混合手法
- Authors: Mackenzie R. Neal, Paul D. McNicholas, Arthur White,
- Abstract要約: クラスタリングに対する生成的アプローチは、クラスタの幾何学的性質に関する情報を提供する。
識別的アプローチはクラスタ間のバウンダリを提供する。
完全教師なし,確率的,差別的なクラスタリング手法を提案する。
- 参考スコア(独自算出の注目度): 0.254890465057467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative approaches to clustering provide information on geometric properties of clusters, whereas discriminative approaches provide boundaries between clusters. Ideas from both approaches are incorporated to present a fully unsupervised, probabilistic, and discriminative clustering method via a regularized mutual information objective function, wherein a mixture of mixtures of Gaussian and uniform distributions is used for formulation of the conditional model. Automatic selection of the number of components is established with the introduction of the regularizing term and a merge step, similar to those applied in reversible jump Markov chain Monte Carlo methods used in Bayesian clustering. Consequently, the turtle shell method -- a fully unsupervised clustering method capable of estimating non-linear boundary lines, automatically selecting the number of components, and capturing intuitive clusters in the presence of data abnormalities such as noise and/or irregular cluster shapes -- is introduced. We test this method on various simulated and real datasets commonly explored in clustering research, and extend the analysis to datasets arising from flow cytometry experiments.
- Abstract(参考訳): クラスタリングに対する生成的アプローチはクラスタの幾何学的性質に関する情報を提供するが、識別的アプローチはクラスタ間のバウンダリを提供する。
両手法のアイデアは、正規化された相互情報目的関数を介して、完全に教師なし、確率的、差別的なクラスタリング法を示すために組み込まれ、ガウス分布と一様分布の混合が条件モデルの定式化に使用される。
成分数の自動選択は、ベイズクラスタリングで用いられる可逆ジャンプマルコフ連鎖モンテカルロ法と同様、正規化項とマージステップの導入によって確立される。
その結果, 非直線境界線を推定し, 部品数を自動的に選択し, ノイズや不規則なクラスタ形状などのデータ異常の存在下で直感的なクラスタを捕捉する, 完全教師なしクラスタリング手法が導入された。
本手法はクラスタリング研究でよく研究されている様々なシミュレーションおよび実データを用いて検証し,フローサイトメトリー実験から得られたデータセットに拡張する。
関連論文リスト
- Clustering Based on Density Propagation and Subcluster Merging [92.15924057172195]
本稿では,クラスタ数を自動的に決定し,データ空間とグラフ空間の両方に適用可能な密度に基づくノードクラスタリング手法を提案する。
二つのノード間の距離を計算する従来の密度クラスタリング法とは異なり,提案手法は伝播過程を通じて密度を決定する。
論文 参考訳(メタデータ) (2024-11-04T04:09:36Z) - An Agglomerative Clustering of Simulation Output Distributions Using Regularized Wasserstein Distance [0.0]
本稿では,正規化ワッサーシュタイン距離をクラスタシミュレーション出力に利用した新しいクラスタリングアルゴリズムを提案する。
このフレームワークには、異常検出、事前最適化、オンライン監視など、いくつかの重要なユースケースがある。
論文 参考訳(メタデータ) (2024-07-16T18:07:32Z) - A Deterministic Information Bottleneck Method for Clustering Mixed-Type Data [0.0]
混合型データ,すなわち連続変数と分類変数の両方からなるデータをクラスタリングするための情報理論手法を提案する。
提案手法は、一般化された製品カーネルを通して、インフォメーション・ボトルネックの原理を異種データに拡張する。
提案手法はDIBmixと呼ばれ,従来の4つの手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-03T09:06:19Z) - A Computational Theory and Semi-Supervised Algorithm for Clustering [0.0]
クラスタリングは異常のないデータのグループ化の獲得である。
クラスタリング手法のカーネルは知覚異常検出アルゴリズムである。
半教師付きクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-12T09:15:58Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Spatially Coherent Clustering Based on Orthogonal Nonnegative Matrix
Factorization [0.0]
本稿では,クラスタメンバシップ行列の総変動(TV)正規化手順に基づく作業クラスタリングモデルを紹介する。
マトリックス支援レーザー脱離イオン化イメージング測定から得られた超スペクトルデータセット上の提案手法をすべて数値的に評価する。
論文 参考訳(メタデータ) (2021-04-25T23:40:41Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Conjoined Dirichlet Process [63.89763375457853]
我々はディリクレ過程に基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、列と列の双方に強い共起を持つビクラスタを同定する。
本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
論文 参考訳(メタデータ) (2020-02-08T19:41:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。