論文の概要: Modelling Technical and Biological Effects in scRNA-seq data with
Scalable GPLVMs
- arxiv url: http://arxiv.org/abs/2209.06716v1
- Date: Wed, 14 Sep 2022 15:25:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-15 13:08:14.254278
- Title: Modelling Technical and Biological Effects in scRNA-seq data with
Scalable GPLVMs
- Title(参考訳): scrna-seqデータのスケーラブルなgplvmによるモデリング技術と生物学的効果
- Authors: Vidhi Lalchand, Aditya Ravuri, Emma Dann, Natsuhiko Kumasaka, Dinithi
Sumanaweera, Rik G.H. Lindeboom, Shaista Madad, Sarah A. Teichmann, Neil D.
Lawrence
- Abstract要約: 我々は,ガウス過程潜在変数モデルである確率的非線形次元減少に対する一般的なアプローチを拡張し,大規模単一セルデータセットに拡張する。
鍵となる考え方は、高速な変動推論を可能にする下位境界の分解可能性を保存する拡張カーネルを使用することである。
- 参考スコア(独自算出の注目度): 6.708052194104378
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-cell RNA-seq datasets are growing in size and complexity, enabling the
study of cellular composition changes in various biological/clinical contexts.
Scalable dimensionality reduction techniques are in need to disentangle
biological variation in them, while accounting for technical and biological
confounders. In this work, we extend a popular approach for probabilistic
non-linear dimensionality reduction, the Gaussian process latent variable
model, to scale to massive single-cell datasets while explicitly accounting for
technical and biological confounders. The key idea is to use an augmented
kernel which preserves the factorisability of the lower bound allowing for fast
stochastic variational inference. We demonstrate its ability to reconstruct
latent signatures of innate immunity recovered in Kumasaka et al. (2021) with
9x lower training time. We further analyze a COVID dataset and demonstrate
across a cohort of 130 individuals, that this framework enables data
integration while capturing interpretable signatures of infection.
Specifically, we explore COVID severity as a latent dimension to refine patient
stratification and capture disease-specific gene expression.
- Abstract(参考訳): 単細胞RNA-seqデータセットはサイズと複雑さが増しており、様々な生物学的・臨床的文脈における細胞組成の変化を研究することができる。
スケーラブルな次元削減技術は、技術的および生物学的共同設立者を考慮しつつ、生物学的変異を解消する必要がある。
本研究では, 確率的非線形次元低減のための一般的な手法であるガウス過程潜在変数モデルを拡張し, 技術的および生物学的共同創設者を明示的に考慮しながら, 大規模単一セルデータセットに拡張する。
鍵となる考え方は、高速な確率的変動推論を可能にする下界の分解可能性を保存する拡張カーネルを使用することである。
熊坂ら(2021年)で回収された自然免疫の潜在性シグネチャを9倍のトレーニング時間で再構築する能力を示す。
我々はさらに、新型コロナウイルスデータセットを分析し、130人のコホートを通して、このフレームワークが感染の解釈可能なシグネチャをキャプチャしながらデータ統合を可能にすることを実証する。
具体的には、患者の階層化を洗練し、疾患特異的な遺伝子発現を捉えるための潜伏次元として、新型コロナウイルスの重症度を探求する。
関連論文リスト
- Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.02070962797794]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。
本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - Scalable Amortized GPLVMs for Single Cell Transcriptomics Data [9.010523724015398]
大規模単細胞RNA-seqデータの解析には次元化が不可欠である。
改良されたモデル、償却変分モデル(BGPLVM)を導入する。
BGPLVMは、特殊なエンコーダ、カーネル、そして可能性設計を備えたシングルセルRNA-seq向けに調整されている。
論文 参考訳(メタデータ) (2024-05-06T21:54:38Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Tertiary Lymphoid Structures Generation through Graph-based Diffusion [54.37503714313661]
本研究では,最先端のグラフベース拡散モデルを用いて生物学的に意味のある細胞グラフを生成する。
本研究では, グラフ拡散モデルを用いて, 3次リンパ構造(TLS)の分布を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-10-10T14:37:17Z) - PhagoStat a scalable and interpretable end to end framework for
efficient quantification of cell phagocytosis in neurodegenerative disease
studies [0.0]
本稿では,食欲活動の定量化と分析を行うためのエンドツーエンド,スケーラブル,汎用的なリアルタイムフレームワークを提案する。
提案するパイプラインでは,大規模なデータセットを処理でき,データ品質検証モジュールも備えている。
我々はこのパイプラインをFTDの微小グリア細胞食細胞解析に応用し,統計的に信頼性の高い結果を得た。
論文 参考訳(メタデータ) (2023-04-26T18:10:35Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z) - Learning Causal Representations of Single Cells via Sparse Mechanism
Shift Modeling [3.2435888122704037]
本稿では,各摂動を未知の,しかしスパースな,潜伏変数のサブセットを標的とした介入として扱う単一細胞遺伝子発現データの深部生成モデルを提案する。
これらの手法をシミュレーションした単一セルデータ上でベンチマークし、潜伏単位回復、因果的目標同定、領域外一般化における性能を評価する。
論文 参考訳(メタデータ) (2022-11-07T15:47:40Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - A Cross-Level Information Transmission Network for Predicting Phenotype
from New Genotype: Application to Cancer Precision Medicine [37.442717660492384]
本稿では,CLEIT(Cross-Level Information Transmission Network)フレームワークを提案する。
ドメイン適応にインスパイアされたCLEITは、まずハイレベルドメインの潜在表現を学び、その後、接地木埋め込みとして利用する。
体細胞突然変異による抗がん剤感受性の予測におけるCLEITの有効性と性能の向上を示す。
論文 参考訳(メタデータ) (2020-10-09T22:01:00Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。