論文の概要: Confident Clustering via PCA Compression Ratio and Its Application to
Single-cell RNA-seq Analysis
- arxiv url: http://arxiv.org/abs/2205.09849v1
- Date: Thu, 19 May 2022 20:46:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 11:25:27.592301
- Title: Confident Clustering via PCA Compression Ratio and Its Application to
Single-cell RNA-seq Analysis
- Title(参考訳): PCA圧縮比による信頼クラスタリングと単一セルRNA配列解析への応用
- Authors: Yingcong Li, Chandra Sekhar Mukherjee and Jiapeng Zhang
- Abstract要約: 我々は,境界データポイントの影響を小さくするために,信頼度の高いクラスタリング手法を開発した。
本アルゴリズムは単一セルRNA-seqデータを用いて検証する。
単一セル解析における従来のクラスタリング法とは異なり、信頼性クラスタリングはパラメータの異なる選択下で高い安定性を示す。
- 参考スコア(独自算出の注目度): 4.511561231517167
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised clustering algorithms for vectors has been widely used in the
area of machine learning. Many applications, including the biological data we
studied in this paper, contain some boundary datapoints which show combination
properties of two underlying clusters and could lower the performance of the
traditional clustering algorithms. We develop a confident clustering method
aiming to diminish the influence of these datapoints and improve the clustering
results. Concretely, for a list of datapoints, we give two clustering results.
The first-round clustering attempts to classify only pure vectors with high
confidence. Based on it, we classify more vectors with less confidence in the
second round. We validate our algorithm on single-cell RNA-seq data, which is a
powerful and widely used tool in biology area. Our confident clustering shows a
high accuracy on our tested datasets. In addition, unlike traditional
clustering methods in single-cell analysis, the confident clustering shows high
stability under different choices of parameters.
- Abstract(参考訳): ベクトルに対する教師なしクラスタリングアルゴリズムは機械学習の分野で広く利用されている。
この論文で研究した生物学的データを含む多くのアプリケーションには、2つの下位クラスタの組合せ特性を示し、従来のクラスタリングアルゴリズムの性能を低下させる可能性のある境界データポイントが含まれている。
我々は,これらのデータポイントの影響を低減し,クラスタリング結果を改善することを目的とした,確実なクラスタリング手法を開発した。
具体的には、データポイントのリストに対して、2つのクラスタリング結果を与えます。
第1ラウンドのクラスタリングは、信頼性の高い純粋なベクトルのみを分類しようとする。
それに基づいて,第2ラウンドへの信頼度の低い,より多くのベクトルを分類する。
我々は,生物学領域において強力で広く利用されている単一セルRNA-seqデータを用いて,本アルゴリズムの有効性を検証する。
信頼性の高いクラスタリングは、テストデータセットに高い精度を示しています。
さらに、単一セル解析における従来のクラスタリング法とは異なり、信頼性クラスタリングはパラメータの異なる選択下で高い安定性を示す。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Single-cell Multi-view Clustering via Community Detection with Unknown
Number of Clusters [64.31109141089598]
シングルセルデータに適した,革新的なマルチビュークラスタリング手法である scUNC を導入する。
scUNCは、事前に定義された数のクラスタを必要とせずに、異なるビューからの情報をシームレスに統合する。
3つの異なる単一セルデータセットを用いて,SCUNCの総合評価を行った。
論文 参考訳(メタデータ) (2023-11-28T08:34:58Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Deep Clustering of Tabular Data by Weighted Gaussian Distribution Learning [0.0]
本稿では,自動エンコーダ遅延空間(G-CEALS)におけるガウスクラスタ埋め込みという,表型データのための最初のディープクラスタリング手法の1つを開発する。
G-CEALS法は、クラスタリング精度に基づいて平均ランク順を2.9(1.7)と2.8(1.7)とし、16のデータセット上で調整されたRand index(ARI)スコアをそれぞれ示し、9つの最先端クラスタリング法より優れている。
論文 参考訳(メタデータ) (2023-01-02T18:45:53Z) - DeepCluE: Enhanced Image Clustering via Multi-layer Ensembles in Deep
Neural Networks [53.88811980967342]
本稿では,Ensembles (DeepCluE) を用いたDeep Clusteringを提案する。
ディープニューラルネットワークにおける複数のレイヤのパワーを活用することで、ディープクラスタリングとアンサンブルクラスタリングのギャップを埋める。
6つの画像データセットの実験結果から、最先端のディープクラスタリングアプローチに対するDeepCluEの利点が確認されている。
論文 参考訳(メタデータ) (2022-06-01T09:51:38Z) - Self-Evolutionary Clustering [1.662966122370634]
既存のディープクラスタリング手法の多くは、単純な距離比較に基づいており、手作り非線形マッピングによって生成されたターゲット分布に大きく依存している。
新たなモジュール型自己進化クラスタリング(Self-EvoC)フレームワークが構築され,自己管理的な分類によってクラスタリング性能が向上する。
このフレームワークは、サンプルアウトレイラを効率よく識別し、自己監督の助けを借りて、より良い目標分布を生成することができる。
論文 参考訳(メタデータ) (2022-02-21T19:38:18Z) - Very Compact Clusters with Structural Regularization via Similarity and
Connectivity [3.779514860341336]
本稿では,汎用データセットのためのエンドツーエンドのディープクラスタリングアルゴリズムであるVery Compact Clusters (VCC)を提案する。
提案手法は,最先端のクラスタリング手法よりも優れたクラスタリング性能を実現する。
論文 参考訳(メタデータ) (2021-06-09T23:22:03Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z) - Supervised Enhanced Soft Subspace Clustering (SESSC) for TSK Fuzzy
Classifiers [25.32478253796209]
ファジィc平均クラスタリングアルゴリズムは,高木・スゲノカン(TSK)ファジィ分類器パラメータ推定によく用いられる。
本稿では,クラスタ内コンパクト性,クラスタ間分離,クラスタリングにおけるラベル情報とを同時に考慮した拡張ソフトサブスペースクラスタリング(SESSC)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-27T19:39:19Z) - Tree-SNE: Hierarchical Clustering and Visualization Using t-SNE [0.0]
Tree-SNEは1次元のt-SNE埋め込みに基づく階層的クラスタリングと可視化アルゴリズムである。
アルファクラスタリングでは、クラスタの数を知ることなく、最適なクラスタ割り当てを推奨している。
本研究は,手書きディジットの画像,血液細胞からの大量CyTOFデータ,網膜細胞からの単細胞RNAシークエンシング(scRNA-seq)データに対するツリーSNEとアルファクラスタリングの有効性を示す。
論文 参考訳(メタデータ) (2020-02-13T18:11:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。