論文の概要: scRNA-seq Data Clustering by Cluster-aware Iterative Contrastive
Learning
- arxiv url: http://arxiv.org/abs/2312.16600v1
- Date: Wed, 27 Dec 2023 14:50:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 18:37:13.099170
- Title: scRNA-seq Data Clustering by Cluster-aware Iterative Contrastive
Learning
- Title(参考訳): クラスタ対応反復学習によるcRNA-seqデータクラスタリング
- Authors: Weikang Jiang, Jinxian Wang, Jihong Guan and Shuigeng Zhou
- Abstract要約: 単一細胞RNAシークエンシング(scRNA-seq)により、研究者は単一細胞レベルで遺伝子発現を解析できる。
scRNA-seqデータ分析における重要なタスクは、教師なしクラスタリングである。
我々は,cRNA-seqデータクラスタリングのためのクラスタ対応反復コントラスト学習(CICL)を提案する。
- 参考スコア(独自算出の注目度): 29.199004624757233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-cell RNA sequencing (scRNA-seq) enables researchers to analyze gene
expression at single-cell level. One important task in scRNA-seq data analysis
is unsupervised clustering, which helps identify distinct cell types, laying
down the foundation for other downstream analysis tasks. In this paper, we
propose a novel method called Cluster-aware Iterative Contrastive Learning
(CICL in short) for scRNA-seq data clustering, which utilizes an iterative
representation learning and clustering framework to progressively learn the
clustering structure of scRNA-seq data with a cluster-aware contrastive loss.
CICL consists of a Transformer encoder, a clustering head, a projection head
and a contrastive loss module. First, CICL extracts the feature vectors of the
original and augmented data by the Transformer encoder. Then, it computes the
clustering centroids by K-means and employs the student t-distribution to
assign pseudo-labels to all cells in the clustering head. The projection-head
uses a Multi-Layer Perceptron (MLP) to obtain projections of the augmented
data. At last, both pseudo-labels and projections are used in the contrastive
loss to guide the model training. Such a process goes iteratively so that the
clustering result becomes better and better. Extensive experiments on 25 real
world scRNA-seq datasets show that CICL outperforms the SOTA methods.
Concretely, CICL surpasses the existing methods by from 14% to 280%, and from
5% to 133% on average in terms of performance metrics ARI and NMI respectively.
- Abstract(参考訳): 単一細胞RNAシークエンシング(scRNA-seq)により、研究者は単一細胞レベルで遺伝子発現を解析できる。
scRNA-seqデータ分析における重要なタスクのひとつは、教師なしクラスタリング(unsupervised clustering)である。
本稿では,反復表現学習およびクラスタリングフレームワークを用いて,クラスタ認識によるコントラスト損失を伴うscrna-seqデータのクラスタリング構造を段階的に学習するscrna-seqデータクラスタリングのための,クラスタ認識型反復コントラスト学習(cicl)と呼ばれる新しい手法を提案する。
CICLはTransformerエンコーダ、クラスタリングヘッド、プロジェクションヘッド、コントラスト損失モジュールで構成される。
まず、CICLはトランスフォーマーエンコーダにより、オリジナルおよび拡張データの特徴ベクトルを抽出する。
そして、k平均でクラスタリングセンタロイドを計算し、学生t分布を用いてクラスタリングヘッド内の全セルに擬似ラベルを割り当てる。
投影ヘッドは、拡張データの投影を得るために多層パーセプトロン(mlp)を使用する。
最後に、擬似ラベルと射影の両方が、モデルのトレーニングを導くためにコントラスト損失として使用される。
このようなプロセスは反復的に行われ、クラスタリングの結果がより良くなるようにします。
25の現実世界の scRNA-seq データセットに対する大規模な実験により、CICL が SOTA 法より優れていることが示された。
具体的には、CICLは既存の手法を14%から280%に上回り、それぞれパフォーマンス指標のARIとNMIの平均で5%から133%に上っている。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - scASDC: Attention Enhanced Structural Deep Clustering for Single-cell RNA-seq Data [5.234149080137045]
scRNA-seqデータに固有の高空間性および複雑なノイズパターンは、従来のクラスタリング手法において重要な課題である。
本稿では,深層クラスタリング手法であるアテンション強化構造深層埋め込みグラフクラスタリング(scASDC)を提案する。
scASDCはクラスタリングの精度と堅牢性を改善するために、複数の高度なモジュールを統合している。
論文 参考訳(メタデータ) (2024-08-09T09:10:36Z) - scCDCG: Efficient Deep Structural Clustering for single-cell RNA-seq via Deep Cut-informed Graph Embedding [12.996418312603284]
scCDCG (Single-cell RNA-seq Clustering via Deep Cut-informed Graph)は、cRNA-seqデータの効率的かつ正確なクラスタリングを目的とした新しいフレームワークである。
scCDCGは3つの主要な構成要素から構成される: (i) 細胞間高次構造情報を効果的にキャプチャするディープカットインフォームド技術を利用したグラフ埋め込みモジュール。
(II)cRNA-seqデータの特異な複雑さに対応するため,最適なトランスポートによって誘導される自己教師型学習モジュール。
論文 参考訳(メタデータ) (2024-04-09T09:46:17Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - Single-cell Multi-view Clustering via Community Detection with Unknown
Number of Clusters [64.31109141089598]
シングルセルデータに適した,革新的なマルチビュークラスタリング手法である scUNC を導入する。
scUNCは、事前に定義された数のクラスタを必要とせずに、異なるビューからの情報をシームレスに統合する。
3つの異なる単一セルデータセットを用いて,SCUNCの総合評価を行った。
論文 参考訳(メタデータ) (2023-11-28T08:34:58Z) - Analyzing scRNA-seq data by CCP-assisted UMAP and t-SNE [0.0]
相関クラスタリングとプロジェクション(CCP)は、cRNA-seqデータを前処理する有効な方法として導入された。
CCPは、行列対角化を必要としないデータドメインアプローチである。
8つの公開データセットを使用することで、CCPは UMAP と t-SNE の可視化を大幅に改善することがわかった。
論文 参考訳(メタデータ) (2023-06-23T19:15:43Z) - Confident Clustering via PCA Compression Ratio and Its Application to
Single-cell RNA-seq Analysis [4.511561231517167]
我々は,境界データポイントの影響を小さくするために,信頼度の高いクラスタリング手法を開発した。
本アルゴリズムは単一セルRNA-seqデータを用いて検証する。
単一セル解析における従来のクラスタリング法とは異なり、信頼性クラスタリングはパラメータの異なる選択下で高い安定性を示す。
論文 参考訳(メタデータ) (2022-05-19T20:46:49Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Contrastive Clustering [57.71729650297379]
本稿では,インスタンスレベルのコントラスト学習を明示的に行うContrastive Clustering (CC)を提案する。
特にCCは、CIFAR-10(CIFAR-100)データセット上で0.705(0.431)のNMIを達成しており、最高のベースラインと比較して最大19%(39%)のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-09-21T08:54:40Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z) - Review of Single-cell RNA-seq Data Clustering for Cell Type
Identification and Characterization [12.655970720359297]
教師なし学習は、新しい細胞タイプと遺伝子発現パターンを識別し、特徴付ける中心的な要素となっている。
本稿では,既存の単一セルRNA-seqデータクラスタリング手法について概説する。
そこで本研究では,2つの単一セルRNA-seqクラスタリング手法の性能比較実験を行った。
論文 参考訳(メタデータ) (2020-01-03T22:48:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。