論文の概要: Selective inference for k-means clustering
- arxiv url: http://arxiv.org/abs/2203.15267v1
- Date: Tue, 29 Mar 2022 06:28:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 05:08:50.832555
- Title: Selective inference for k-means clustering
- Title(参考訳): k-meansクラスタリングの選択的推論
- Authors: Yiqun T. Chen, Daniela M. Witten
- Abstract要約: k平均クラスタリングを用いて得られた一対のクラスタ間の差分に対する選択型I誤差を制御する有限サンプルp値を提案する。
提案手法をシミュレーションや手書き桁データ,シングルセルRNAシークエンシングデータに適用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of testing for a difference in means between clusters
of observations identified via k-means clustering. In this setting, classical
hypothesis tests lead to an inflated Type I error rate. To overcome this
problem, we take a selective inference approach. We propose a finite-sample
p-value that controls the selective Type I error for a test of the difference
in means between a pair of clusters obtained using k-means clustering, and show
that it can be efficiently computed. We apply our proposal in simulation, and
on hand-written digits data and single-cell RNA-sequencing data.
- Abstract(参考訳): k-meansクラスタリングによって特定された観測クラスタ間の方法の違いに対するテストの問題を考える。
この設定では、古典的な仮説テストはタイプiのエラー率を膨らませる。
この問題を克服するため、選択的推論アプローチを採る。
そこで本研究では,k-meansクラスタリングを用いて得られたクラスタのペア間の差分に対する選択型I誤差を制御する有限サンプルp値を提案し,効率よく計算可能であることを示す。
本提案はシミュレーションと手書き桁データと単細胞rnaシーケンシングデータに適用する。
関連論文リスト
- On uniqueness of the set of k-means [0.5735035463793009]
非特異性の設定に適応した経験的k平均の整合性を評価する。
k-平均集合の特異性に対するブートストラップ試験を導出する。
結果は、異なる種類の非特異性の例で示される。
論文 参考訳(メタデータ) (2024-10-17T12:40:56Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Interpretable Clustering with the Distinguishability Criterion [0.4419843514606336]
本稿では,特定クラスタの分離可能性の定量化と推定クラスタ構成の検証を行うために,分散可能性基準と呼ばれるグローバルな基準を提案する。
本稿では、分散可能性基準と多くの一般的なクラスタリング手順を統合した損失関数に基づく計算フレームワークを提案する。
シミュレーション研究および実データアプリケーションに基づく包括的データ解析の結果とともに,これらの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-24T16:38:15Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Sketch-and-solve approaches to k-means clustering by semidefinite
programming [14.930208990741132]
我々は,k-meansクラスタリングのPeng-Wei半定緩和を高速化するためのスケッチ・アンド・ソルジ手法を提案する。
データが適切に分離された場合、k平均の最適なクラスタリングを特定する。
そうでなければ、我々のアプローチは最適k-平均値に高信頼な下界を与える。
論文 参考訳(メタデータ) (2022-11-28T19:51:30Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Local versions of sum-of-norms clustering [77.34726150561087]
本手法はボールモデルにおいて任意に閉じた球を分離できることを示す。
我々は、不連結連結集合のクラスタリングで発生する誤差に定量的な有界性を証明した。
論文 参考訳(メタデータ) (2021-09-20T14:45:29Z) - Selective Inference for Hierarchical Clustering [2.3311605203774386]
本稿では,任意のクラスタリング法から得られた2つのクラスタ間の平均差をテストするための選択的推論手法を提案する。
提案手法は,データからNull仮説が生成されたという事実を考慮し,選択型Iエラー率を制御する。
論文 参考訳(メタデータ) (2020-12-05T03:03:19Z) - Decorrelated Clustering with Data Selection Bias [55.91842043124102]
本稿では,データ選択バイアスを伴うクラスタリングのためのデコリレーション正規化K-Meansアルゴリズム(DCKM)を提案する。
DCKMアルゴリズムは,選択バイアスによって生じる予期せぬ特徴相関を除去する必要があることを示す。
論文 参考訳(メタデータ) (2020-06-29T08:55:50Z) - Selective Inference for Latent Block Models [50.83356836818667]
本研究では,潜在ブロックモデルに対する選択的推論法を提案する。
我々は,潜在ブロックモデルの行と列クラスタのメンバシップの集合に対する統計的テストを構築した。
提案された正確で近似されたテストは、選択バイアスを考慮していない単純なテストと比較して効果的に機能する。
論文 参考訳(メタデータ) (2020-05-27T10:44:19Z) - Blocked Clusterwise Regression [0.0]
我々は、各ユニットが複数の潜伏変数を持つことを可能にすることで、離散的非観測的不均一性に対する以前のアプローチを一般化する。
我々は,クラスタの過剰な数のクラスタリングの理論に寄与し,この設定に対する新たな収束率を導出する。
論文 参考訳(メタデータ) (2020-01-29T23:29:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。