論文の概要: SimCD: Simultaneous Clustering and Differential expression analysis for
single-cell transcriptomic data
- arxiv url: http://arxiv.org/abs/2104.01512v1
- Date: Sun, 4 Apr 2021 01:06:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 14:26:26.587427
- Title: SimCD: Simultaneous Clustering and Differential expression analysis for
single-cell transcriptomic data
- Title(参考訳): SimCD: 単一セル転写データの同時クラスタリングと差分表現解析
- Authors: Seyednami Niyakan, Ehsan Hajiramezanali, Shahin Boluki, Siamak Zamani
Dadaneh, Xiaoning Qian
- Abstract要約: シングルセルRNAシークエンシング(scRNA-seq)は、個々の細胞のゲノムスケールの転写プロファイリングを促進する。
複数の scRNA-seq 解析法が提案されており、まずクラスター化によって細胞サブポピュレーションを同定し、別々に差分発現解析を行い、遺伝子発現の変化を理解する。
細胞不均一性および動的微分変化を1つの統合階層型ガンマ陰性二項モデルで明示的にモデル化する新しい方法であるSimCDを開発している。
- 参考スコア(独自算出の注目度): 22.702909270039314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-Cell RNA sequencing (scRNA-seq) measurements have facilitated
genome-scale transcriptomic profiling of individual cells, with the hope of
deconvolving cellular dynamic changes in corresponding cell sub-populations to
better understand molecular mechanisms of different development processes.
Several scRNA-seq analysis methods have been proposed to first identify cell
sub-populations by clustering and then separately perform differential
expression analysis to understand gene expression changes. Their corresponding
statistical models and inference algorithms are often designed disjointly. We
develop a new method -- SimCD -- that explicitly models cell heterogeneity and
dynamic differential changes in one unified hierarchical gamma-negative
binomial (hGNB) model, allowing simultaneous cell clustering and differential
expression analysis for scRNA-seq data. Our method naturally defines cell
heterogeneity by dynamic expression changes, which is expected to help achieve
better performances on the two tasks compared to the existing methods that
perform them separately. In addition, SimCD better models dropout (zero
inflation) in scRNA-seq data by both cell- and gene-level factors and obviates
the need for sophisticated pre-processing steps such as normalization, thanks
to the direct modeling of scRNA-seq count data by the rigorous hGNB model with
an efficient Gibbs sampling inference algorithm. Extensive comparisons with the
state-of-the-art methods on both simulated and real-world scRNA-seq count data
demonstrate the capability of SimCD to discover cell clusters and capture
dynamic expression changes. Furthermore, SimCD helps identify several known
genes affected by food deprivation in hypothalamic neuron cell subtypes as well
as some new potential markers, suggesting the capability of SimCD for
bio-marker discovery.
- Abstract(参考訳): 単細胞RNAシークエンシング(scRNA-seq)測定は、個々の細胞のゲノムスケールの転写学的プロファイリングを促進し、対応する細胞サブ集団における細胞動態を分解して、異なる発達過程の分子機構をよりよく理解することを期待している。
いくつかのscRNA-seq解析法が提案され、まずクラスタリングにより細胞サブ集団を同定し、その後、遺伝子発現の変化を理解するために差分式解析を行う。
対応する統計モデルと推論アルゴリズムは、しばしば不一致に設計される。
我々は,1つの階層的ガンマ陰性二項構造(hGNB)モデルにおいて,セルの不均一性と動的微分変化を明示的にモデル化し,cRNA-seqデータに対するセルクラスタリングと差分式解析を可能にする新しい手法,SimCDを開発した。
本手法は動的表現変化による細胞不均一性を自然に定義し、2つのタスクでそれぞれ個別に実行する既存の方法と比較して優れた性能を達成することが期待できる。
さらに、SimCDは、セルレベルと遺伝子レベルの両方の要素によるscRNA-seqデータのドロップアウト(ゼロインフレーション)を改善し、より厳密なhGNBモデルによるhGNBモデルによるcRNA-seqカウントデータのモデリングにより、正規化のような洗練された前処理ステップの必要性を排除した。
シミュレーションおよび実世界のscRNA-seqカウントデータを用いた最先端手法との比較により、SimCDが細胞クラスターを発見し、動的表現変化を捉える能力を示している。
さらに、simcdは視床下部神経細胞サブタイプにおける食物不足の影響を受けるいくつかの既知の遺伝子や新しい潜在的なマーカーの同定に役立ち、simcdが生体マーカーの発見に有用であることを示唆している。
関連論文リスト
- Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.02070962797794]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。
本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - Scalable Amortized GPLVMs for Single Cell Transcriptomics Data [9.010523724015398]
大規模単細胞RNA-seqデータの解析には次元化が不可欠である。
改良されたモデル、償却変分モデル(BGPLVM)を導入する。
BGPLVMは、特殊なエンコーダ、カーネル、そして可能性設計を備えたシングルセルRNA-seq向けに調整されている。
論文 参考訳(メタデータ) (2024-05-06T21:54:38Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - Mixed Models with Multiple Instance Learning [51.440557223100164]
一般化線形混合モデル(GLMM)とMultiple Instance Learning(MIL)を統合するフレームワークであるMixMILを紹介する。
実験結果から,MixMILは単一セルデータセットにおいて既存のMILモデルより優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-04T16:42:42Z) - Analyzing scRNA-seq data by CCP-assisted UMAP and t-SNE [0.0]
相関クラスタリングとプロジェクション(CCP)は、cRNA-seqデータを前処理する有効な方法として導入された。
CCPは、行列対角化を必要としないデータドメインアプローチである。
8つの公開データセットを使用することで、CCPは UMAP と t-SNE の可視化を大幅に改善することがわかった。
論文 参考訳(メタデータ) (2023-06-23T19:15:43Z) - Capturing dynamical correlations using implicit neural representations [85.66456606776552]
実験データから未知のパラメータを復元するために、モデルハミルトンのシミュレーションデータを模倣するために訓練されたニューラルネットワークと自動微分を組み合わせた人工知能フレームワークを開発する。
そこで本研究では, 実時間から多次元散乱データに適用可能な微分可能なモデルを1回だけ構築し, 訓練する能力について述べる。
論文 参考訳(メタデータ) (2023-04-08T07:55:36Z) - Learning Causal Representations of Single Cells via Sparse Mechanism
Shift Modeling [3.2435888122704037]
本稿では,各摂動を未知の,しかしスパースな,潜伏変数のサブセットを標的とした介入として扱う単一細胞遺伝子発現データの深部生成モデルを提案する。
これらの手法をシミュレーションした単一セルデータ上でベンチマークし、潜伏単位回復、因果的目標同定、領域外一般化における性能を評価する。
論文 参考訳(メタデータ) (2022-11-07T15:47:40Z) - Granger causal inference on DAGs identifies genomic loci regulating
transcription [77.58911272503771]
GrID-Netは、DBG構造化システムにおけるGranger因果推論のためのラタグメッセージパッシングを備えたグラフニューラルネットワークに基づくフレームワークである。
我々の応用は、特定の遺伝子の調節を仲介するゲノム座を同定する単一セルマルチモーダルデータの解析である。
論文 参考訳(メタデータ) (2022-10-18T21:15:10Z) - Topological Data Analysis in Time Series: Temporal Filtration and
Application to Single-Cell Genomics [13.173307471333619]
単細胞トポロジカル単純解析(scTSA)を提案する。
このアプローチを細胞の局所ネットワークから単細胞遺伝子発現プロファイルに適用すると、これまで見つからなかった細胞生態のトポロジーが明らかになる。
38,731細胞,25細胞タイプ,12時間ステップにまたがるゼブラフィッシュ胚発生の単一細胞RNA-seqデータに基づいて,本研究は胃粘膜を最も重要な段階として強調する。
論文 参考訳(メタデータ) (2022-04-29T12:46:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。