論文の概要: scCDCG: Efficient Deep Structural Clustering for single-cell RNA-seq via Deep Cut-informed Graph Embedding
- arxiv url: http://arxiv.org/abs/2404.06167v1
- Date: Tue, 9 Apr 2024 09:46:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-10 15:19:37.067467
- Title: scCDCG: Efficient Deep Structural Clustering for single-cell RNA-seq via Deep Cut-informed Graph Embedding
- Title(参考訳): scCDCG:Deep Cut-informed Graph EmbeddingによるシングルセルRNA-seqの効率的な深部構造クラスタリング
- Authors: Ping Xu, Zhiyuan Ning, Meng Xiao, Guihai Feng, Xin Li, Yuanchun Zhou, Pengfei Wang,
- Abstract要約: scCDCG (Single-cell RNA-seq Clustering via Deep Cut-informed Graph)は、cRNA-seqデータの効率的かつ正確なクラスタリングを目的とした新しいフレームワークである。
scCDCGは3つの主要な構成要素から構成される: (i) 細胞間高次構造情報を効果的にキャプチャするディープカットインフォームド技術を利用したグラフ埋め込みモジュール。
(II)cRNA-seqデータの特異な複雑さに対応するため,最適なトランスポートによって誘導される自己教師型学習モジュール。
- 参考スコア(独自算出の注目度): 12.996418312603284
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Single-cell RNA sequencing (scRNA-seq) is essential for unraveling cellular heterogeneity and diversity, offering invaluable insights for bioinformatics advancements. Despite its potential, traditional clustering methods in scRNA-seq data analysis often neglect the structural information embedded in gene expression profiles, crucial for understanding cellular correlations and dependencies. Existing strategies, including graph neural networks, face challenges in handling the inefficiency due to scRNA-seq data's intrinsic high-dimension and high-sparsity. Addressing these limitations, we introduce scCDCG (single-cell RNA-seq Clustering via Deep Cut-informed Graph), a novel framework designed for efficient and accurate clustering of scRNA-seq data that simultaneously utilizes intercellular high-order structural information. scCDCG comprises three main components: (i) A graph embedding module utilizing deep cut-informed techniques, which effectively captures intercellular high-order structural information, overcoming the over-smoothing and inefficiency issues prevalent in prior graph neural network methods. (ii) A self-supervised learning module guided by optimal transport, tailored to accommodate the unique complexities of scRNA-seq data, specifically its high-dimension and high-sparsity. (iii) An autoencoder-based feature learning module that simplifies model complexity through effective dimension reduction and feature extraction. Our extensive experiments on 6 datasets demonstrate scCDCG's superior performance and efficiency compared to 7 established models, underscoring scCDCG's potential as a transformative tool in scRNA-seq data analysis. Our code is available at: https://github.com/XPgogogo/scCDCG.
- Abstract(参考訳): 単細胞RNAシークエンシング(scRNA-seq)は、細胞内の不均一性と多様性の解明に不可欠であり、バイオインフォマティクスの進歩に重要な洞察を与える。
scRNA-seqデータ解析における従来のクラスタリング手法は、その可能性にもかかわらず、細胞間の相関や依存関係を理解するのに不可欠な、遺伝子発現プロファイルに埋め込まれた構造情報を無視することが多い。
グラフニューラルネットワークを含む既存の戦略は、scRNA-seqデータの本質的な高次元と高スパーシリティによる非効率処理の課題に直面している。
このような制約に対処するため,我々はcCDCG (Single-cell RNA-seq Clustering via Deep Cut-informed Graph)を導入した。
scCDCGは3つの主成分から構成される。
一 ディープカットインフォームド技術を利用したグラフ埋め込みモジュールで、細胞間高次構造情報を効果的に捕捉し、従来のグラフニューラルネットワーク手法でよく見られる過度に滑らかで非効率な問題を克服する。
二 最適な輸送によって導かれる自己教師型学習モジュールで、cRNA-seqデータの特異な複雑さ、特にその高次元と高疎度に対応するように調整された。
三 有効次元の削減及び特徴抽出によりモデルの複雑さを簡易化するオートエンコーダに基づく特徴学習モジュール。
6つのデータセットに対する広範な実験により、scCDCGが確立された7つのモデルと比較して優れた性能と効率を示し、scRNA-seqデータ解析における変換ツールとしてのSCCDCGの可能性を強調した。
私たちのコードは、https://github.com/XPgogogo/scCDCG.comで利用可能です。
関連論文リスト
- Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - Single-cell Curriculum Learning-based Deep Graph Embedding Clustering [21.328135630638343]
シングルセル学習に基づく深層グラフ埋め込みクラスタリング(scCLG)を提案する。
まず,3つのデコーダに対応する3つの最適化目標を組み合わせたマルチデコーダ(ChebAE)を用いたChebyshevグラフ畳み込みオートエンコーダを提案する。
我々は、ノードの特徴とエントロピーに基づいてGNNを訓練し、高品質なグラフを維持するための難易度スコアに基づいて困難なノードを訓練する選択的なトレーニング戦略を採用している。
論文 参考訳(メタデータ) (2024-08-20T03:20:13Z) - scASDC: Attention Enhanced Structural Deep Clustering for Single-cell RNA-seq Data [5.234149080137045]
scRNA-seqデータに固有の高空間性および複雑なノイズパターンは、従来のクラスタリング手法において重要な課題である。
本稿では,深層クラスタリング手法であるアテンション強化構造深層埋め込みグラフクラスタリング(scASDC)を提案する。
scASDCはクラスタリングの精度と堅牢性を改善するために、複数の高度なモジュールを統合している。
論文 参考訳(メタデータ) (2024-08-09T09:10:36Z) - BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - Analyzing scRNA-seq data by CCP-assisted UMAP and t-SNE [0.0]
相関クラスタリングとプロジェクション(CCP)は、cRNA-seqデータを前処理する有効な方法として導入された。
CCPは、行列対角化を必要としないデータドメインアプローチである。
8つの公開データセットを使用することで、CCPは UMAP と t-SNE の可視化を大幅に改善することがわかった。
論文 参考訳(メタデータ) (2023-06-23T19:15:43Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - Application of Deep Learning on Single-Cell RNA-sequencing Data
Analysis: A Review [17.976898403296275]
単細胞RNAシークエンシング(scRNA-seq)は、数千の単細胞の遺伝子発現プロファイルを同時に定量するために日常的に使用される技術となっている。
人工知能の最近の進歩であるディープラーニングも、scRNA-seqデータ分析のための有望なツールとして登場した。
論文 参考訳(メタデータ) (2022-10-11T17:07:22Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。