論文の概要: Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen
- arxiv url: http://arxiv.org/abs/2407.11734v1
- Date: Tue, 16 Jul 2024 14:05:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 14:52:24.936142
- Title: Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen
- Title(参考訳): CFGenを用いたマルチモーダル・マルチ属性単一セル数の生成
- Authors: Alessandro Palma, Till Richter, Hanyi Zhang, Manuel Lubetzki, Alexander Tong, Andrea Dittadi, Fabian Theis,
- Abstract要約: マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。
本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
- 参考スコア(独自算出の注目度): 76.02070962797794
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative modeling of single-cell RNA-seq data has shown invaluable potential in community-driven tasks such as trajectory inference, batch effect removal and gene expression generation. However, most recent deep models generating synthetic single cells from noise operate on pre-processed continuous gene expression approximations, ignoring the inherently discrete and over-dispersed nature of single-cell data, which limits downstream applications and hinders the incorporation of robust noise models. Moreover, crucial aspects of deep-learning-based synthetic single-cell generation remain underexplored, such as controllable multi-modal and multi-label generation and its role in the performance enhancement of downstream tasks. This work presents Cell Flow for Generation (CFGen), a flow-based conditional generative model for multi-modal single-cell counts, which explicitly accounts for the discrete nature of the data. Our results suggest improved recovery of crucial biological data characteristics while accounting for novel generative tasks such as conditioning on multiple attributes and boosting rare cell type classification via data augmentation. By showcasing CFGen on a diverse set of biological datasets and settings, we provide evidence of its value to the fields of computational biology and deep generative models.
- Abstract(参考訳): 単一細胞RNA-seqデータの生成モデリングは、軌道推論、バッチ効果除去、遺伝子発現生成といった、コミュニティ主導のタスクにおいて有意義な可能性を示唆している。
しかし、ノイズから合成単細胞を生成する最新のディープモデルは、前処理された連続的な遺伝子発現近似を演算し、単一セルデータの本質的に離散的で過分散性を無視し、下流での応用を制限し、頑健なノイズモデルの導入を妨げる。
さらに, 制御可能なマルチモーダル・マルチラベル生成や, 下流タスクの性能向上に果たす役割など, 深層学習に基づく合成単細胞生成の重要な側面についても検討が続けられている。
この研究は、複数のモーダルな単一セル数に対するフローベースの条件生成モデルであるCell Flow for Generation (CFGen)を提示する。
以上の結果から,複数属性の条件付けやデータ拡張による稀な細胞型分類の促進など,新たな生成タスクを考慮に入れた上で,重要な生物学的データ特性の回復が示唆された。
CFGenを多様な生物学的データセットと設定で表すことで、計算生物学や深層生成モデルの分野にその価値を示す。
関連論文リスト
- Diffusion-Based Generation of Neural Activity from Disentangled Latent Codes [1.9544534628180867]
本稿では,条件付き生成モデリングの進歩を生かしたニューラルデータ解析手法を提案する。
我々は,高情報付きコードに基づくニューラル・オブザーバ生成と呼ばれるモデルを時系列ニューラル・データに適用する。
VAEベースのシーケンシャルオートエンコーダと比較して、GNOCCHIは、鍵となる振る舞い変数に関してより明確に構造化され、よりゆがみのある高品質な潜在空間を学習する。
論文 参考訳(メタデータ) (2024-07-30T21:07:09Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - sc-OTGM: Single-Cell Perturbation Modeling by Solving Optimal Mass Transport on the Manifold of Gaussian Mixtures [0.9674145073701153]
sc-OTGMは、scRNAseqデータが生成される誘導バイアスに基づく教師なしモデルである。
sc-OTGMは細胞状態の分類、異なる遺伝子発現の解析、標的同定のための遺伝子ランキングに有効である。
また、下流遺伝子制御に対する単一遺伝子の摂動の影響を予測し、特定の細胞状態に条件付けられた合成scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-05-06T06:46:11Z) - Correlational Lagrangian Schr\"odinger Bridge: Learning Dynamics with
Population-Level Regularization [27.855576268065857]
相関型Lagrangian Schr"odinger Bridge (CLSB) と呼ばれる新しいフレームワークを紹介する。
CLSBは、最小人口の「コスト」のために正規化しながら、クロステキスト観察における進化の「ブリッジング」を求める
本研究の貢献は,(1)多変量関係における時間的変動を捉えた新しい集団正規化器群,(3)遺伝的共発現安定性に基づく3つのドメインインフォームドインスタンス化である。
論文 参考訳(メタデータ) (2024-02-04T19:33:44Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Mixed Models with Multiple Instance Learning [51.440557223100164]
一般化線形混合モデル(GLMM)とMultiple Instance Learning(MIL)を統合するフレームワークであるMixMILを紹介する。
実験結果から,MixMILは単一セルデータセットにおいて既存のMILモデルより優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-04T16:42:42Z) - Learning Causal Representations of Single Cells via Sparse Mechanism
Shift Modeling [3.2435888122704037]
本稿では,各摂動を未知の,しかしスパースな,潜伏変数のサブセットを標的とした介入として扱う単一細胞遺伝子発現データの深部生成モデルを提案する。
これらの手法をシミュレーションした単一セルデータ上でベンチマークし、潜伏単位回復、因果的目標同定、領域外一般化における性能を評価する。
論文 参考訳(メタデータ) (2022-11-07T15:47:40Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Conditional Hybrid GAN for Sequence Generation [56.67961004064029]
本稿では,この問題を解決するための条件付きハイブリッドGAN(C-Hybrid-GAN)を提案する。
我々はGumbel-Softmax法を利用して離散値列の分布を近似する。
提案したC-Hybrid-GANは、文脈条件付き離散値シーケンス生成において既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-18T03:52:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。