論文の概要: Single-Cell RNA-seq Synthesis with Latent Diffusion Model
- arxiv url: http://arxiv.org/abs/2312.14220v1
- Date: Thu, 21 Dec 2023 13:15:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-25 17:11:51.437063
- Title: Single-Cell RNA-seq Synthesis with Latent Diffusion Model
- Title(参考訳): 潜伏拡散モデルを用いた単一セルRNA配列合成
- Authors: Yixuan Wang and Shuangyin Li and Shimin DI and Lei Chen
- Abstract要約: SCLD(Single-Cell Latent Diffusion)は、大規模で高品質なscRNA-seqサンプルを合成することができる。
プレガイダンスメカニズムは特定の細胞サブポピュレーションを合成するために設計され、ポストガイダンスメカニズムは、scRNA-seqサンプルの品質を高めることを目的としている。
- 参考スコア(独自算出の注目度): 17.852700180643325
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The single-cell RNA sequencing (scRNA-seq) technology enables researchers to
study complex biological systems and diseases with high resolution. The central
challenge is synthesizing enough scRNA-seq samples; insufficient samples can
impede downstream analysis and reproducibility. While various methods have been
attempted in past research, the resulting scRNA-seq samples were often of poor
quality or limited in terms of useful specific cell subpopulations. To address
these issues, we propose a novel method called Single-Cell Latent Diffusion
(SCLD) based on the Diffusion Model. This method is capable of synthesizing
large-scale, high-quality scRNA-seq samples, including both 'holistic' or
targeted specific cellular subpopulations within a unified framework. A
pre-guidance mechanism is designed for synthesizing specific cellular
subpopulations, while a post-guidance mechanism aims to enhance the quality of
scRNA-seq samples. The SCLD can synthesize large-scale and high-quality
scRNA-seq samples for various downstream tasks. Our experimental results
demonstrate state-of-the-art performance in cell classification and data
distribution distances when evaluated on two scRNA-seq benchmarks.
Additionally, visualization experiments show the SCLD's capability in
synthesizing specific cellular subpopulations.
- Abstract(参考訳): シングルセルRNAシークエンシング(scRNA-seq)技術により、研究者は複雑な生物学的システムや疾患を高解像度で研究することができる。
中心的な課題は、十分なscRNA-seqサンプルを合成することである。
過去の研究では様々な方法が試みられているが、結果として得られたscRNA-seqサンプルは、しばしば品質が悪く、有用な特定の細胞サブ集団の点で制限されていた。
そこで本研究では, 拡散モデルに基づくscld(single-cell latent diffusion)と呼ばれる新しい手法を提案する。
この方法は、統一されたフレームワーク内で「総括的」または特定の細胞亜集団の両方を含む、大規模で高品質なscrna-seqサンプルを合成することができる。
pre-guidance機構は特定の細胞サブポピュレーションを合成するために設計され、post-guidance機構はscrna-seqサンプルの品質を向上させることを目的としている。
SCLDは、様々な下流タスクのために、大規模で高品質なscRNA-seqサンプルを合成することができる。
実験により,2つのscRNA-seqベンチマークで評価した場合,細胞分類とデータ分布距離の最先端性能を示す。
さらに、可視化実験は、特定の細胞サブポピュレーションを合成するSCLDの機能を示している。
関連論文リスト
- Character-level Tokenizations as Powerful Inductive Biases for RNA Foundational Models [0.0]
RNAの挙動を理解し予測することは、RNAの構造と相互作用の複雑さのために困難である。
現在のRNAモデルは、タンパク質ドメインで観測された性能とはまだ一致していない。
ChaRNABERTは、確立されたベンチマークでいくつかのタスクで最先端のパフォーマンスに到達することができる。
論文 参考訳(メタデータ) (2024-11-05T21:56:16Z) - Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.02070962797794]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。
本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - sc-OTGM: Single-Cell Perturbation Modeling by Solving Optimal Mass Transport on the Manifold of Gaussian Mixtures [0.9674145073701153]
sc-OTGMは、scRNAseqデータが生成される誘導バイアスに基づく教師なしモデルである。
sc-OTGMは細胞状態の分類、異なる遺伝子発現の解析、標的同定のための遺伝子ランキングに有効である。
また、下流遺伝子制御に対する単一遺伝子の摂動の影響を予測し、特定の細胞状態に条件付けられた合成scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-05-06T06:46:11Z) - scRDiT: Generating single-cell RNA-seq data by diffusion transformers and accelerating sampling [9.013834280011293]
シングルセルRNAシークエンシング(英: Single-cell RNA Sequencing、scRNA-seq)は、生物研究で広く利用されている基盤技術である。
本研究は、scRDiT(scRNA-seq Diffusion Transformer)と呼ばれる生成的アプローチを紹介する。
この方法は、実際のデータセットを活用して、仮想scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-04-09T09:25:16Z) - Feedback Efficient Online Fine-Tuning of Diffusion Models [52.170384048274364]
提案手法は, 実現可能なサンプルの多様体上で効率的に探索できる新しい強化学習手法である。
本稿では,3つの領域にまたがる実証的検証とともに,後悔の保証を提供する理論的解析を提案する。
論文 参考訳(メタデータ) (2024-02-26T07:24:32Z) - scDiffusion: conditional generation of high-quality single-cell data
using diffusion model [1.0738561302102216]
単細胞RNAシークエンシング(scRNA-seq)データは、単細胞レベルでの生命の法則を研究する上で重要である。
十分な高品質の scRNA-seq データを取得することは依然として困難である。
拡散モデルと基礎モデルを組み合わせた生成モデルである scDiffusion を開発し,高品質な scRNA-seq データを生成する。
論文 参考訳(メタデータ) (2024-01-08T15:44:39Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - Score-based Generative Modeling in Latent Space [93.8985523558869]
スコアベース生成モデル(SGM)は,最近,サンプル品質と分布範囲の両面で顕著な結果を示した。
本稿では,Latent Score-based Generative Model (LSGM)を提案する。
データから潜在空間への移動により、より表現力のある生成モデルをトレーニングし、非連続データにSGMを適用し、よりスムーズなSGMをより小さな空間で学習することができる。
論文 参考訳(メタデータ) (2021-06-10T17:26:35Z) - SimCD: Simultaneous Clustering and Differential expression analysis for
single-cell transcriptomic data [22.702909270039314]
シングルセルRNAシークエンシング(scRNA-seq)は、個々の細胞のゲノムスケールの転写プロファイリングを促進する。
複数の scRNA-seq 解析法が提案されており、まずクラスター化によって細胞サブポピュレーションを同定し、別々に差分発現解析を行い、遺伝子発現の変化を理解する。
細胞不均一性および動的微分変化を1つの統合階層型ガンマ陰性二項モデルで明示的にモデル化する新しい方法であるSimCDを開発している。
論文 参考訳(メタデータ) (2021-04-04T01:06:18Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。