論文の概要: scDiffusion: conditional generation of high-quality single-cell data
using diffusion model
- arxiv url: http://arxiv.org/abs/2401.03968v1
- Date: Mon, 8 Jan 2024 15:44:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-09 15:30:44.474501
- Title: scDiffusion: conditional generation of high-quality single-cell data
using diffusion model
- Title(参考訳): scdiffusion:拡散モデルを用いた高品質単細胞データの条件生成
- Authors: Erpai Luo, Minsheng Hao, Lei Wei, Xuegong Zhang
- Abstract要約: 単一細胞RNAシークエンシング(scRNA-seq)データは、単一細胞レベルでの発生や疾患の生物学を研究する上で重要である。
本研究では,制御条件付き高品質な scRNA-seq データを生成する拡散モデルである scDiffusion を開発した。
実験の結果、ScDiffusionは実際のScRNA-seqデータとよく似た単一細胞遺伝子発現データを生成でき、複数のメトリクスで最先端モデルを上回ることがわかった。
- 参考スコア(独自算出の注目度): 1.0738561302102216
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Single-cell RNA sequencing (scRNA-seq) data are important for studying the
biology of development or diseases at single-cell level. To better understand
the properties of the data, to build controlled benchmark data for testing
downstream methods, and to augment data when collecting sufficient real data is
challenging, generative models have been proposed to computationally generate
synthetic scRNA-seq data. However, the data generated with current models are
not very realistic yet, especially when we need to generate data with
controlled conditions. In the meantime, the Diffusion models have shown their
power in generating data in computer vision at high fidelity, providing a new
opportunity for scRNA-seq generation.
In this study, we developed scDiffusion, a diffusion-based model to generate
high-quality scRNA-seq data with controlled conditions. We designed multiple
classifiers to guide the diffusion process simultaneously, enabling scDiffusion
to generate data under multiple condition combinations. We also proposed a new
control strategy called Gradient Interpolation. This strategy allows the model
to generate continuous trajectories of cell development from a given cell
state.
Experiments showed that scDiffusion can generate single-cell gene expression
data closely resembling real scRNA-seq data, surpassing state-of-the-art models
in multiple metrics. Also, scDiffusion can conditionally produce data on
specific cell types including rare cell types. Furthermore, we could use the
multiple-condition generation of scDiffusion to generate cell type that was out
of the training data. Leveraging the Gradient Interpolation strategy, we
generated a continuous developmental trajectory of mouse embryonic cells. These
experiments demonstrate that scDiffusion is a powerful tool for augmenting the
real scRNA-seq data and can provide insights into cell fate research.
- Abstract(参考訳): 単一細胞RNAシークエンシング(scRNA-seq)データは、単一細胞レベルでの発生や疾患の生物学を研究する上で重要である。
データの性質をよりよく理解し、下流メソッドをテストするための制御されたベンチマークデータを構築し、十分な実データを集める際にデータを強化することが困難となるため、合成srna-seqデータを計算的に生成する生成モデルが提案されている。
しかし、現在のモデルで生成されたデータは、特に制御された条件でデータを生成する必要がある場合、まだあまり現実的ではない。
一方、Diffusionモデルはコンピュータビジョンのデータを高い忠実度で生成する能力を示しており、scRNA-seq生成の新しい機会となっている。
本研究では,制御条件付き高品質な scRNA-seq データを生成する拡散モデルである scDiffusion を開発した。
拡散過程を同時に導くために複数の分類器を設計し、複数の条件の組み合わせでScDiffusionでデータを生成する。
また,勾配補間と呼ばれる新しい制御戦略を提案した。
この戦略により、モデルは所定の細胞状態から細胞発達の連続的な軌道を生成することができる。
実験の結果、ScDiffusionは実際のScRNA-seqデータとよく似た単一細胞遺伝子発現データを生成でき、複数のメトリクスで最先端モデルを上回ることがわかった。
また、 scDiffusionは稀な細胞型を含む特定の細胞型のデータを生成することができる。
さらに,scdiffusionの多条件生成により,トレーニングデータから得られた細胞型を生成することができた。
勾配補間戦略を活用し,マウス胚細胞の発達過程を連続的に追跡した。
これらの実験は、scDiffusionが実際のscRNA-seqデータを増強する強力なツールであり、細胞運命研究の洞察を与えることを実証している。
関連論文リスト
- White-Box Diffusion Transformer for single-cell RNA-seq generation [9.846966401472802]
そこで我々はDiffusion ModelとWhite-Box Transformerに基づくハイブリッドモデルを提案する。
我々のWhite-Box Diffusion Transformerは、Diffusionモデルの生成能力とWhite-Box Transformerの数学的解釈性を組み合わせる。
論文 参考訳(メタデータ) (2024-11-11T08:24:59Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.02070962797794]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。
本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - sc-OTGM: Single-Cell Perturbation Modeling by Solving Optimal Mass Transport on the Manifold of Gaussian Mixtures [0.9674145073701153]
sc-OTGMは、scRNAseqデータが生成される誘導バイアスに基づく教師なしモデルである。
sc-OTGMは細胞状態の分類、異なる遺伝子発現の解析、標的同定のための遺伝子ランキングに有効である。
また、下流遺伝子制御に対する単一遺伝子の摂動の影響を予測し、特定の細胞状態に条件付けられた合成scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-05-06T06:46:11Z) - scRDiT: Generating single-cell RNA-seq data by diffusion transformers and accelerating sampling [9.013834280011293]
シングルセルRNAシークエンシング(英: Single-cell RNA Sequencing、scRNA-seq)は、生物研究で広く利用されている基盤技術である。
本研究は、scRDiT(scRNA-seq Diffusion Transformer)と呼ばれる生成的アプローチを紹介する。
この方法は、実際のデータセットを活用して、仮想scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-04-09T09:25:16Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - Improving Out-of-Distribution Robustness of Classifiers via Generative
Interpolation [56.620403243640396]
ディープニューラルネットワークは、独立かつ同一に分散されたデータ(すなわち、d)から学習する上で、優れたパフォーマンスを達成する。
しかし、アウト・オブ・ディストリビューション(OoD)データを扱う場合、その性能は著しく低下する。
多様なOoDサンプルを合成するために,複数のドメインから学習した生成モデルを融合するための生成補間法(Generative Interpolation)を開発した。
論文 参考訳(メタデータ) (2023-07-23T03:53:53Z) - Conditional Hybrid GAN for Sequence Generation [56.67961004064029]
本稿では,この問題を解決するための条件付きハイブリッドGAN(C-Hybrid-GAN)を提案する。
我々はGumbel-Softmax法を利用して離散値列の分布を近似する。
提案したC-Hybrid-GANは、文脈条件付き離散値シーケンス生成において既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-18T03:52:55Z) - Cell Type Identification from Single-Cell Transcriptomic Data via
Semi-supervised Learning [2.4271601178529063]
シングルセルRNAシークエンシング(scRNAseq)データ解析の共通の目的は、シングルセル転写データからの細胞型同定である。
ラベルなしの scRNAseq 細胞とラベル付き scRNAseq 細胞を限定的に使用して細胞識別を行う半教師付き学習モデルを提案する。
提案手法は, ラベル付きcRNAseq細胞を極端に限定して学習することで, 高い性能を達成できることが観察された。
論文 参考訳(メタデータ) (2020-05-06T19:15:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。