論文の概要: Analyzing scRNA-seq data by CCP-assisted UMAP and t-SNE
- arxiv url: http://arxiv.org/abs/2306.13750v1
- Date: Fri, 23 Jun 2023 19:15:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-27 19:28:25.327906
- Title: Analyzing scRNA-seq data by CCP-assisted UMAP and t-SNE
- Title(参考訳): CCP支援UMAPとt-SNEによるscRNA-seqデータの解析
- Authors: Yuta Hozumi, Gu-Wei Wei
- Abstract要約: 相関クラスタリングとプロジェクション(CCP)は、cRNA-seqデータを前処理する有効な方法として導入された。
CCPは、行列対角化を必要としないデータドメインアプローチである。
8つの公開データセットを使用することで、CCPは UMAP と t-SNE の可視化を大幅に改善することがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-cell RNA sequencing (scRNA-seq) is widely used to reveal heterogeneity
in cells, which has given us insights into cell-cell communication, cell
differentiation, and differential gene expression. However, analyzing scRNA-seq
data is a challenge due to sparsity and the large number of genes involved.
Therefore, dimensionality reduction and feature selection are important for
removing spurious signals and enhancing downstream analysis. Correlated
clustering and projection (CCP) was recently introduced as an effective method
for preprocessing scRNA-seq data. CCP utilizes gene-gene correlations to
partition the genes and, based on the partition, employs cell-cell interactions
to obtain super-genes. Because CCP is a data-domain approach that does not
require matrix diagonalization, it can be used in many downstream machine
learning tasks. In this work, we utilize CCP as an initialization tool for
uniform manifold approximation and projection (UMAP) and t-distributed
stochastic neighbor embedding (t-SNE). By using eight publicly available
datasets, we have found that CCP significantly improves UMAP and t-SNE
visualization and dramatically improve their accuracy.
- Abstract(参考訳): 単細胞RNAシークエンシング(scRNA-seq)は、細胞内の不均一性を明らかにするために広く用いられ、細胞間通信、細胞分化、および分化遺伝子発現に関する洞察を与えてくれた。
しかし、scRNA-seqデータの解析は、スパーシリティと関連する多数の遺伝子によって困難である。
したがって,スプリアス信号の除去と下流解析の促進には,次元化と特徴選択が重要である。
相関クラスタリング・プロジェクション(CCP)は、最近、cRNA-seqデータを前処理する有効な方法として導入された。
CCPは遺伝子相関を利用して遺伝子を分割し、その分割に基づいて細胞間相互作用を用いてスーパー遺伝子を得る。
CCPは行列対角化を必要としないデータドメインアプローチであるため、多くの下流機械学習タスクで使用することができる。
本研究では,一様多様体近似および投影(UMAP)およびt分散確率的隣接埋め込み(t-SNE)の初期化ツールとしてCCPを利用する。
8つの公開データセットを使用することで、CCPは UMAP と t-SNE の可視化を大幅に改善し、精度を劇的に改善することがわかった。
関連論文リスト
- Nearest Neighbor CCP-Based Molecular Sequence Analysis [4.199844472131922]
Corelated Clustering and Projection (CCP) は生物学的シークエンシングデータに有効な方法として提案されている。
分子シークエンスデータを効率的に前処理するためのCCP-NN(Nearest Neighbor Correlated Clustering and Projection)に基づく手法を提案する。
以上の結果から,CCP-NNは分類タスクの精度を大幅に向上し,計算実行時においてCCPを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2024-09-07T22:06:00Z) - scASDC: Attention Enhanced Structural Deep Clustering for Single-cell RNA-seq Data [5.234149080137045]
scRNA-seqデータに固有の高空間性および複雑なノイズパターンは、従来のクラスタリング手法において重要な課題である。
本稿では,深層クラスタリング手法であるアテンション強化構造深層埋め込みグラフクラスタリング(scASDC)を提案する。
scASDCはクラスタリングの精度と堅牢性を改善するために、複数の高度なモジュールを統合している。
論文 参考訳(メタデータ) (2024-08-09T09:10:36Z) - scCDCG: Efficient Deep Structural Clustering for single-cell RNA-seq via Deep Cut-informed Graph Embedding [12.996418312603284]
scCDCG (Single-cell RNA-seq Clustering via Deep Cut-informed Graph)は、cRNA-seqデータの効率的かつ正確なクラスタリングを目的とした新しいフレームワークである。
scCDCGは3つの主要な構成要素から構成される: (i) 細胞間高次構造情報を効果的にキャプチャするディープカットインフォームド技術を利用したグラフ埋め込みモジュール。
(II)cRNA-seqデータの特異な複雑さに対応するため,最適なトランスポートによって誘導される自己教師型学習モジュール。
論文 参考訳(メタデータ) (2024-04-09T09:46:17Z) - Cell Graph Transformer for Nuclei Classification [78.47566396839628]
我々は,ノードとエッジを入力トークンとして扱うセルグラフ変換器(CGT)を開発した。
不愉快な特徴は、騒々しい自己注意スコアと劣等な収束につながる可能性がある。
グラフ畳み込みネットワーク(GCN)を利用して特徴抽出器を学習する新しいトポロジ対応事前学習法を提案する。
論文 参考訳(メタデータ) (2024-02-20T12:01:30Z) - scRNA-seq Data Clustering by Cluster-aware Iterative Contrastive
Learning [29.199004624757233]
単一細胞RNAシークエンシング(scRNA-seq)により、研究者は単一細胞レベルで遺伝子発現を解析できる。
scRNA-seqデータ分析における重要なタスクは、教師なしクラスタリングである。
我々は,cRNA-seqデータクラスタリングのためのクラスタ対応反復コントラスト学習(CICL)を提案する。
論文 参考訳(メタデータ) (2023-12-27T14:50:59Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - K-Nearest-Neighbors Induced Topological PCA for scRNA Sequence Data
Analysis [0.3683202928838613]
永続ラプラシアン(PL)法とL$_2,1$ノルム正規化を組み合わせたトポロジカルプライマリコンポーネント分析(tPCA)法を提案する。
さらに, k-Nearest-Neighbor (kNN) の永続ラプラス的手法を導入し, 永続ラプラス的手法の堅牢性を向上させる。
提案したtPCA法とkNN-tPCA法の有効性を,11種類のscRNA-seqデータセット上で検証した。
論文 参考訳(メタデータ) (2023-10-23T03:07:50Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Improved guarantees and a multiple-descent curve for Column Subset
Selection and the Nystr\"om method [76.73096213472897]
我々は,データ行列のスペクトル特性を利用して近似保証を改良する手法を開発した。
我々のアプローチは、特異値減衰の既知の速度を持つデータセットのバウンダリが大幅に向上する。
RBFパラメータを変更すれば,改良された境界線と多重発振曲線の両方を実データセット上で観測できることが示される。
論文 参考訳(メタデータ) (2020-02-21T00:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。