論文の概要: scCDCG: Efficient Deep Structural Clustering for single-cell RNA-seq via Deep Cut-informed Graph Embedding
- arxiv url: http://arxiv.org/abs/2404.06167v1
- Date: Tue, 9 Apr 2024 09:46:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-10 15:19:37.067467
- Title: scCDCG: Efficient Deep Structural Clustering for single-cell RNA-seq via Deep Cut-informed Graph Embedding
- Title(参考訳): scCDCG:Deep Cut-informed Graph EmbeddingによるシングルセルRNA-seqの効率的な深部構造クラスタリング
- Authors: Ping Xu, Zhiyuan Ning, Meng Xiao, Guihai Feng, Xin Li, Yuanchun Zhou, Pengfei Wang,
- Abstract要約: scCDCG (Single-cell RNA-seq Clustering via Deep Cut-informed Graph)は、cRNA-seqデータの効率的かつ正確なクラスタリングを目的とした新しいフレームワークである。
scCDCGは3つの主要な構成要素から構成される: (i) 細胞間高次構造情報を効果的にキャプチャするディープカットインフォームド技術を利用したグラフ埋め込みモジュール。
(II)cRNA-seqデータの特異な複雑さに対応するため,最適なトランスポートによって誘導される自己教師型学習モジュール。
- 参考スコア(独自算出の注目度): 12.996418312603284
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Single-cell RNA sequencing (scRNA-seq) is essential for unraveling cellular heterogeneity and diversity, offering invaluable insights for bioinformatics advancements. Despite its potential, traditional clustering methods in scRNA-seq data analysis often neglect the structural information embedded in gene expression profiles, crucial for understanding cellular correlations and dependencies. Existing strategies, including graph neural networks, face challenges in handling the inefficiency due to scRNA-seq data's intrinsic high-dimension and high-sparsity. Addressing these limitations, we introduce scCDCG (single-cell RNA-seq Clustering via Deep Cut-informed Graph), a novel framework designed for efficient and accurate clustering of scRNA-seq data that simultaneously utilizes intercellular high-order structural information. scCDCG comprises three main components: (i) A graph embedding module utilizing deep cut-informed techniques, which effectively captures intercellular high-order structural information, overcoming the over-smoothing and inefficiency issues prevalent in prior graph neural network methods. (ii) A self-supervised learning module guided by optimal transport, tailored to accommodate the unique complexities of scRNA-seq data, specifically its high-dimension and high-sparsity. (iii) An autoencoder-based feature learning module that simplifies model complexity through effective dimension reduction and feature extraction. Our extensive experiments on 6 datasets demonstrate scCDCG's superior performance and efficiency compared to 7 established models, underscoring scCDCG's potential as a transformative tool in scRNA-seq data analysis. Our code is available at: https://github.com/XPgogogo/scCDCG.
- Abstract(参考訳): 単細胞RNAシークエンシング(scRNA-seq)は、細胞内の不均一性と多様性の解明に不可欠であり、バイオインフォマティクスの進歩に重要な洞察を与える。
scRNA-seqデータ解析における従来のクラスタリング手法は、その可能性にもかかわらず、細胞間の相関や依存関係を理解するのに不可欠な、遺伝子発現プロファイルに埋め込まれた構造情報を無視することが多い。
グラフニューラルネットワークを含む既存の戦略は、scRNA-seqデータの本質的な高次元と高スパーシリティによる非効率処理の課題に直面している。
このような制約に対処するため,我々はcCDCG (Single-cell RNA-seq Clustering via Deep Cut-informed Graph)を導入した。
scCDCGは3つの主成分から構成される。
一 ディープカットインフォームド技術を利用したグラフ埋め込みモジュールで、細胞間高次構造情報を効果的に捕捉し、従来のグラフニューラルネットワーク手法でよく見られる過度に滑らかで非効率な問題を克服する。
二 最適な輸送によって導かれる自己教師型学習モジュールで、cRNA-seqデータの特異な複雑さ、特にその高次元と高疎度に対応するように調整された。
三 有効次元の削減及び特徴抽出によりモデルの複雑さを簡易化するオートエンコーダに基づく特徴学習モジュール。
6つのデータセットに対する広範な実験により、scCDCGが確立された7つのモデルと比較して優れた性能と効率を示し、scRNA-seqデータ解析における変換ツールとしてのSCCDCGの可能性を強調した。
私たちのコードは、https://github.com/XPgogogo/scCDCG.comで利用可能です。
関連論文リスト
- scRNA-seq Data Clustering by Cluster-aware Iterative Contrastive
Learning [29.199004624757233]
単一細胞RNAシークエンシング(scRNA-seq)により、研究者は単一細胞レベルで遺伝子発現を解析できる。
scRNA-seqデータ分析における重要なタスクは、教師なしクラスタリングである。
我々は,cRNA-seqデータクラスタリングのためのクラスタ対応反復コントラスト学習(CICL)を提案する。
論文 参考訳(メタデータ) (2023-12-27T14:50:59Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - Analyzing scRNA-seq data by CCP-assisted UMAP and t-SNE [0.0]
相関クラスタリングとプロジェクション(CCP)は、cRNA-seqデータを前処理する有効な方法として導入された。
CCPは、行列対角化を必要としないデータドメインアプローチである。
8つの公開データセットを使用することで、CCPは UMAP と t-SNE の可視化を大幅に改善することがわかった。
論文 参考訳(メタデータ) (2023-06-23T19:15:43Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - Application of Deep Learning on Single-Cell RNA-sequencing Data
Analysis: A Review [17.976898403296275]
単細胞RNAシークエンシング(scRNA-seq)は、数千の単細胞の遺伝子発現プロファイルを同時に定量するために日常的に使用される技術となっている。
人工知能の最近の進歩であるディープラーニングも、scRNA-seqデータ分析のための有望なツールとして登場した。
論文 参考訳(メタデータ) (2022-10-11T17:07:22Z) - Simple and Efficient Heterogeneous Graph Neural Network [55.56564522532328]
不均一グラフニューラルネットワーク(HGNN)は、不均一グラフの豊富な構造的および意味的な情報をノード表現に埋め込む強力な能力を持つ。
既存のHGNNは、同種グラフ上のグラフニューラルネットワーク(GNN)から多くのメカニズム、特に注意機構と多層構造を継承する。
本稿では,これらのメカニズムを詳細に検討し,簡便かつ効率的なヘテロジニアスグラフニューラルネットワーク(SeHGNN)を提案する。
論文 参考訳(メタデータ) (2022-07-06T10:01:46Z) - Visualizing hierarchies in scRNA-seq data using a density tree-biased
autoencoder [50.591267188664666]
本研究では,高次元scRNA-seqデータから意味のある木構造を同定する手法を提案する。
次に、低次元空間におけるデータのツリー構造を強調する木バイアスオートエンコーダDTAEを紹介する。
論文 参考訳(メタデータ) (2021-02-11T08:48:48Z) - Classification of Long Noncoding RNA Elements Using Deep Convolutional
Neural Networks and Siamese Networks [17.8181080354116]
この論文は、cRNA配列を分類するために、ディープ畳み込みニューラルネットワーク(CNN)の新たな手法を提案する。
その結果、CNNベースの分類モデルにより効率よく解ける画像分類プロブレムに、クラスサイズRNA配列を変換する。
論文 参考訳(メタデータ) (2021-02-10T17:26:38Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。