論文の概要: scDiffusion: conditional generation of high-quality single-cell data
using diffusion model
- arxiv url: http://arxiv.org/abs/2401.03968v2
- Date: Tue, 5 Mar 2024 04:45:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 00:58:25.267715
- Title: scDiffusion: conditional generation of high-quality single-cell data
using diffusion model
- Title(参考訳): scdiffusion:拡散モデルを用いた高品質単細胞データの条件生成
- Authors: Erpai Luo, Minsheng Hao, Lei Wei, Xuegong Zhang
- Abstract要約: 単細胞RNAシークエンシング(scRNA-seq)データは、単細胞レベルでの生命の法則を研究する上で重要である。
十分な高品質の scRNA-seq データを取得することは依然として困難である。
拡散モデルと基礎モデルを組み合わせた生成モデルである scDiffusion を開発し,高品質な scRNA-seq データを生成する。
- 参考スコア(独自算出の注目度): 1.0738561302102216
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Single-cell RNA sequencing (scRNA-seq) data are important for studying the
laws of life at single-cell level. However, it is still challenging to obtain
enough high-quality scRNA-seq data. To mitigate the limited availability of
data, generative models have been proposed to computationally generate
synthetic scRNA-seq data. Nevertheless, the data generated with current models
are not very realistic yet, especially when we need to generate data with
controlled conditions. In the meantime, the Diffusion models have shown their
power in generating data at high fidelity, providing a new opportunity for
scRNA-seq generation.
In this study, we developed scDiffusion, a generative model combining
diffusion model and foundation model to generate high-quality scRNA-seq data
with controlled conditions. We designed multiple classifiers to guide the
diffusion process simultaneously, enabling scDiffusion to generate data under
multiple condition combinations. We also proposed a new control strategy called
Gradient Interpolation. This strategy allows the model to generate continuous
trajectories of cell development from a given cell state.
Experiments showed that scDiffusion can generate single-cell gene expression
data closely resembling real scRNA-seq data. Also, scDiffusion can
conditionally produce data on specific cell types including rare cell types.
Furthermore, we could use the multiple-condition generation of scDiffusion to
generate cell type that was out of the training data. Leveraging the Gradient
Interpolation strategy, we generated a continuous developmental trajectory of
mouse embryonic cells. These experiments demonstrate that scDiffusion is a
powerful tool for augmenting the real scRNA-seq data and can provide insights
into cell fate research.
- Abstract(参考訳): 単細胞RNAシークエンシング(scRNA-seq)データは、単細胞レベルでの生命の法則を研究する上で重要である。
しかし、十分な高品質な scRNA-seq データを得るのは難しい。
データの可用性を損なうため、合成scRNA-seqデータを計算的に生成する生成モデルが提案されている。
しかしながら、現在のモデルで生成されたデータは、特に制御された条件でデータを生成する必要がある場合、まだあまり現実的ではない。
一方、Diffusionモデルは高い忠実度でデータを生成する能力を示し、scRNA-seq生成の新しい機会を提供する。
本研究では,拡散モデルと基礎モデルを組み合わせた生成モデルである scDiffusion を開発し,高品質な scRNA-seq データを制御条件で生成する。
拡散過程を同時に導くために複数の分類器を設計し、複数の条件の組み合わせでScDiffusionでデータを生成する。
また,勾配補間と呼ばれる新しい制御戦略を提案した。
この戦略により、モデルは所定の細胞状態から細胞発達の連続的な軌道を生成することができる。
実験の結果,ScDiffusionは実際のScRNA-seqデータとよく似た単一細胞遺伝子発現データを生成することができた。
また、 scDiffusionは稀な細胞型を含む特定の細胞型のデータを生成することができる。
さらに,scdiffusionの多条件生成により,トレーニングデータから得られた細胞型を生成することができた。
勾配補間戦略を活用し,マウス胚細胞の発達過程を連続的に追跡した。
これらの実験は、scDiffusionが実際のscRNA-seqデータを増強する強力なツールであり、細胞運命研究の洞察を与えることを実証している。
関連論文リスト
- White-Box Diffusion Transformer for single-cell RNA-seq generation [9.846966401472802]
そこで我々はDiffusion ModelとWhite-Box Transformerに基づくハイブリッドモデルを提案する。
我々のWhite-Box Diffusion Transformerは、Diffusionモデルの生成能力とWhite-Box Transformerの数学的解釈性を組み合わせる。
論文 参考訳(メタデータ) (2024-11-11T08:24:59Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.02070962797794]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。
本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - sc-OTGM: Single-Cell Perturbation Modeling by Solving Optimal Mass Transport on the Manifold of Gaussian Mixtures [0.9674145073701153]
sc-OTGMは、scRNAseqデータが生成される誘導バイアスに基づく教師なしモデルである。
sc-OTGMは細胞状態の分類、異なる遺伝子発現の解析、標的同定のための遺伝子ランキングに有効である。
また、下流遺伝子制御に対する単一遺伝子の摂動の影響を予測し、特定の細胞状態に条件付けられた合成scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-05-06T06:46:11Z) - scRDiT: Generating single-cell RNA-seq data by diffusion transformers and accelerating sampling [9.013834280011293]
シングルセルRNAシークエンシング(英: Single-cell RNA Sequencing、scRNA-seq)は、生物研究で広く利用されている基盤技術である。
本研究は、scRDiT(scRNA-seq Diffusion Transformer)と呼ばれる生成的アプローチを紹介する。
この方法は、実際のデータセットを活用して、仮想scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-04-09T09:25:16Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - Improving Out-of-Distribution Robustness of Classifiers via Generative
Interpolation [56.620403243640396]
ディープニューラルネットワークは、独立かつ同一に分散されたデータ(すなわち、d)から学習する上で、優れたパフォーマンスを達成する。
しかし、アウト・オブ・ディストリビューション(OoD)データを扱う場合、その性能は著しく低下する。
多様なOoDサンプルを合成するために,複数のドメインから学習した生成モデルを融合するための生成補間法(Generative Interpolation)を開発した。
論文 参考訳(メタデータ) (2023-07-23T03:53:53Z) - Conditional Hybrid GAN for Sequence Generation [56.67961004064029]
本稿では,この問題を解決するための条件付きハイブリッドGAN(C-Hybrid-GAN)を提案する。
我々はGumbel-Softmax法を利用して離散値列の分布を近似する。
提案したC-Hybrid-GANは、文脈条件付き離散値シーケンス生成において既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-18T03:52:55Z) - Cell Type Identification from Single-Cell Transcriptomic Data via
Semi-supervised Learning [2.4271601178529063]
シングルセルRNAシークエンシング(scRNAseq)データ解析の共通の目的は、シングルセル転写データからの細胞型同定である。
ラベルなしの scRNAseq 細胞とラベル付き scRNAseq 細胞を限定的に使用して細胞識別を行う半教師付き学習モデルを提案する。
提案手法は, ラベル付きcRNAseq細胞を極端に限定して学習することで, 高い性能を達成できることが観察された。
論文 参考訳(メタデータ) (2020-05-06T19:15:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。