論文の概要: Statistical Inference for Fuzzy Clustering
- arxiv url: http://arxiv.org/abs/2601.02656v1
- Date: Tue, 06 Jan 2026 02:11:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.771945
- Title: Statistical Inference for Fuzzy Clustering
- Title(参考訳): ファジィクラスタリングの統計的推測
- Authors: Qiuyi Wu, Zihan Zhu, Anru R. Zhang,
- Abstract要約: ファジィ$c$-means (FCM) は、混合メンバーシップを可能にし、不確実性と段階的な遷移をよりよく捉える。
我々は,クラスタサイズ不均衡の可能性のある設定のための,重み付きファジィ$c$-means (WFCM) のための新しいフレームワークを開発した。
- 参考スコア(独自算出の注目度): 7.416766339318596
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Clustering is a central tool in biomedical research for discovering heterogeneous patient subpopulations, where group boundaries are often diffuse rather than sharply separated. Traditional methods produce hard partitions, whereas soft clustering methods such as fuzzy $c$-means (FCM) allow mixed memberships and better capture uncertainty and gradual transitions. Despite the widespread use of FCM, principled statistical inference for fuzzy clustering remains limited. We develop a new framework for weighted fuzzy $c$-means (WFCM) for settings with potential cluster size imbalance. Cluster-specific weights rebalance the classical FCM criterion so that smaller clusters are not overwhelmed by dominant groups, and the weighted objective induces a normalized density model with scale parameter $σ$ and fuzziness parameter $m$. Estimation is performed via a blockwise majorize--minimize (MM) procedure that alternates closed-form membership and centroid updates with likelihood-based updates of $(σ,\bw)$. The intractable normalizing constant is approximated by importance sampling using a data-adaptive Gaussian mixture proposal. We further provide likelihood ratio tests for comparing cluster centers and bootstrap-based confidence intervals. We establish consistency and asymptotic normality of the maximum likelihood estimator, validate the method through simulations, and illustrate it using single-cell RNA-seq and Alzheimer disease Neuroimaging Initiative (ADNI) data. These applications demonstrate stable uncertainty quantification and biologically meaningful soft memberships, ranging from well-separated cell populations under imbalance to a graded AD versus non-AD continuum consistent with disease progression.
- Abstract(参考訳): クラスタリングは異種患者のサブポピュレーションを発見するための生体医学研究において中心的なツールであり、グループの境界は鋭く分離されるのではなく、しばしば拡散される。
従来の方法ではハードパーティションが生成され、ファジィ$c$-means (FCM) のようなソフトクラスタリング手法では、混合メンバシップが実現され、不確実性と漸進的な遷移がよりよく捕捉される。
FCMが広く使われているにもかかわらず、ファジィクラスタリングの統計的推測は依然として限られている。
我々は,クラスタサイズ不均衡の可能性のある設定のための,重み付きファジィ$c$-means (WFCM) のための新しいフレームワークを開発した。
クラスタ固有の重みは古典的なFCM基準を再均衡させ、より小さなクラスタが支配的なグループに圧倒されないようにし、重み付けされた目的は、スケールパラメータ$σ$とファジネスパラメータ$m$で正規化密度モデルを誘導する。
推定はブロックワイズ・プライマリズ・最小化(MM)手順で行われ、クローズドフォームのメンバシップとセントロイドの更新を$(σ,\bw)$の確率ベースの更新で置き換える。
抽出可能な正規化定数は、データ適応型ガウス混合提案を用いた重要サンプリングにより近似される。
さらに,クラスタセンターとブートストラップに基づく信頼区間の比較を行う。
最大極大推定器の整合性と漸近正規性を確立し, シミュレーションによる評価を行い, 単細胞RNA-seqとアルツハイマー病ニューロイメージングイニシアチブ(ADNI)データを用いて解析を行った。
これらの応用は、安定な不確実性定量化と生物学的に有意なソフトなメンバーシップを示し、不均衡な細胞集団から、段階的ADと疾患進行に整合した非AD連続体まで幅広い。
関連論文リスト
- SafeBench-Seq: A Homology-Clustered, CPU-Only Baseline for Protein Hazard Screening with Physicochemical/Composition Features and Cluster-Aware Confidence Intervals [26.81598226089532]
SafeBench-Seqはメタデータのみの再現可能なベンチマークと,すべて公開データから構築されたベースライン分類器である。
の脅威を近似するために、組み合わせたデータセットを40パーセントのIDでクラスタリングし、クラスタレベルのホールドアウトを実行します。
AUROC/AUPRCとスクリーニング操作点(TPR@1% FPR; FPR@95% TPR)の95%ブートストラップ信頼区間(n=200)を報告した。
我々は,ブライアスコア,期待誤差(ECE),15ビン,信頼性図を用いて,確率品質を定量化する。
論文 参考訳(メタデータ) (2025-12-19T12:51:31Z) - ADNF-Clustering: An Adaptive and Dynamic Neuro-Fuzzy Clustering for Leukemia Prediction [4.43233586255351]
本稿では、畳み込みニューラルネットワークに基づく特徴抽出とオンラインファジィクラスタリングエンジンを組み合わせた、新しいストリーミング対応フレームワークであるAdaptive and Dynamic Neuro-Fuzzy Clusteringを紹介する。
C-NMC 白血病顕微鏡データセットでは, シルエットスコア0.51を達成し, 静的塩基性よりも優れた凝集度と分離性を示した。
論文 参考訳(メタデータ) (2025-06-23T08:30:17Z) - Interaction-Aware Gaussian Weighting for Clustered Federated Learning [58.92159838586751]
フェデレートラーニング(FL)は、プライバシを維持しながらモデルをトレーニングするための分散パラダイムとして登場した。
本稿では,新たなクラスタリングFL法であるFedGWC(Federated Gaussian Weighting Clustering)を提案する。
ベンチマークデータセットを用いた実験により,FedGWCはクラスタの品質と分類精度において,既存のFLアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2025-02-05T16:33:36Z) - A Fresh Look at Generalized Category Discovery through Non-negative Matrix Factorization [83.12938977698988]
Generalized Category Discovery (GCD) は、ラベル付きベースデータを用いて、ベース画像と新規画像の両方を分類することを目的としている。
現在のアプローチでは、コサイン類似性に基づく共起行列 $barA$ の固有の最適化に不適切に対処している。
本稿では,これらの欠陥に対処するNon-Negative Generalized Category Discovery (NN-GCD) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T07:24:11Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Adaptive Fuzzy C-Means with Graph Embedding [84.47075244116782]
ファジィクラスタリングアルゴリズムは、大まかに2つの主要なグループに分類できる: ファジィC平均法(FCM)と混合モデルに基づく方法。
本稿では,FCMを用いたクラスタリングモデルを提案する。
論文 参考訳(メタデータ) (2024-05-22T08:15:50Z) - Dirichlet Process-based Robust Clustering using the Median-of-Means Estimator [16.774378814288806]
本稿では,モデルに基づく手法とセントロイド方式の長所を統合することにより,効率的かつ自動的なクラスタリング手法を提案する。
本手法は,クラスタリングの品質に及ぼすノイズの影響を緩和するが,同時にクラスタ数を推定する。
論文 参考訳(メタデータ) (2023-11-26T19:01:15Z) - Likelihood Adjusted Semidefinite Programs for Clustering Heterogeneous
Data [16.153709556346417]
クラスタリングは広くデプロイされた学習ツールである。
iLA-SDPはEMよりも感度が低く、高次元データでは安定である。
論文 参考訳(メタデータ) (2022-09-29T21:03:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。