論文の概要: Lingshu-Cell: A generative cellular world model for transcriptome modeling toward virtual cells
- arxiv url: http://arxiv.org/abs/2603.25240v1
- Date: Thu, 26 Mar 2026 09:46:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.544127
- Title: Lingshu-Cell: A generative cellular world model for transcriptome modeling toward virtual cells
- Title(参考訳): Lingshu-Cell:仮想細胞に向けた転写酵素モデリングのための生成細胞世界モデル
- Authors: Han Zhang, Guo-Hua Yuan, Chaohao Yuan, Tingyang Xu, Tian Bian, Hong Cheng, Wenbing Huang, Deli Zhao, Yu Rong,
- Abstract要約: Lingshu-Cellは、転写状態の分布を学習し、摂動下で条件シミュレーションをサポートする離散拡散モデルである。
約18,000の遺伝子にまたがる複雑なトランスクリプトーム全体の発現依存性を、以前の遺伝子選択に頼らずに捕捉する。
これは、Virtual Cell Challenge H1遺伝子摂動ベンチマークにおいて、ヒトPBMCのサイトカイン誘発反応の予測において、主要な性能を発揮する。
- 参考スコア(独自算出の注目度): 48.885716676667776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modeling cellular states and predicting their responses to perturbations are central challenges in computational biology and the development of virtual cells. Existing foundation models for single-cell transcriptomics provide powerful static representations, but they do not explicitly model the distribution of cellular states for generative simulation. Here, we introduce Lingshu-Cell, a masked discrete diffusion model that learns transcriptomic state distributions and supports conditional simulation under perturbation. By operating directly in a discrete token space that is compatible with the sparse, non-sequential nature of single-cell transcriptomic data, Lingshu-Cell captures complex transcriptome-wide expression dependencies across approximately 18,000 genes without relying on prior gene selection, such as filtering by high variability or ranking by expression level. Across diverse tissues and species, Lingshu-Cell accurately reproduces transcriptomic distributions, marker-gene expression patterns and cell-subtype proportions, demonstrating its ability to capture complex cellular heterogeneity. Moreover, by jointly embedding cell type or donor identity with perturbation, Lingshu-Cell can predict whole-transcriptome expression changes for novel combinations of identity and perturbation. It achieves leading performance on the Virtual Cell Challenge H1 genetic perturbation benchmark and in predicting cytokine-induced responses in human PBMCs. Together, these results establish Lingshu-Cell as a flexible cellular world model for in silico simulation of cell states and perturbation responses, laying the foundation for a new paradigm in biological discovery and perturbation screening.
- Abstract(参考訳): 細胞状態のモデリングと摂動に対する反応の予測は、計算生物学と仮想細胞の開発における中心的な課題である。
既存の単細胞転写学の基礎モデルは強力な静的表現を提供するが、生成シミュレーションのために細胞状態の分布を明示的にモデル化するものではない。
ここでは, Lingshu-Cell というマスク付き離散拡散モデルを紹介し, 経時的状態分布を学習し, 摂動下での条件付きシミュレーションを支援する。
Lingshu-Cellは、単細胞転写データのスパースで非シークエンシャルな性質と直接互換性のある離散トークン空間で操作することにより、約18,000の遺伝子にまたがる複雑なトランスクリプトーム全体の発現依存性を、高い変数によるフィルタリングや表現レベルのランク付けなど、事前の遺伝子選択に頼ることなく、キャプチャする。
様々な組織や種にわたって、Lingshu-Cellは転写学的分布、マーカー遺伝子の発現パターン、細胞サブタイプの割合を正確に再現し、複雑な細胞多様性を捉える能力を示している。
さらに、Lingshu-Cellは、細胞型またはドナーIDと摂動を併用することにより、新しいアイデンティティと摂動の組み合わせに対する全転写産物の発現変化を予測することができる。
これは、Virtual Cell Challenge H1遺伝子摂動ベンチマークにおいて、ヒトPBMCのサイトカイン誘発反応の予測において、主要な性能を発揮する。
これらの結果とともに、Lingshu-Cellは、細胞状態と摂動応答のシリコシミュレーションにおけるフレキシブルなセルモデルとして確立され、生物の発見と摂動スクリーニングにおける新たなパラダイムの基礎を築いた。
関連論文リスト
- VCWorld: A Biological World Model for Virtual Cell Simulation [17.544411742899523]
本稿では、構造化された生物学的知識と大規模言語モデルの反復的推論能力を統合する、セルレベルのホワイトボックスシミュレータであるVCWorldを紹介する。
VCWorldは、摂動誘起シグナリングカスケードを再現し、解釈可能なステップワイズ予測を生成するために、データ効率のよい方法で運用されている。
論文 参考訳(メタデータ) (2025-11-29T04:02:24Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - A scalable gene network model of regulatory dynamics in single cells [88.48246132084441]
本稿では,遺伝子ネットワーク構造を結合微分方程式に組み込んで,遺伝子制御関数をモデル化する機能的学習可能モデルFLeCSを提案する。
FLeCS は (pseudo) 時系列の単一セルデータから, セルの動態を正確に推定する。
論文 参考訳(メタデータ) (2025-03-25T19:19:21Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - Learning Causal Representations of Single Cells via Sparse Mechanism
Shift Modeling [3.2435888122704037]
本稿では,各摂動を未知の,しかしスパースな,潜伏変数のサブセットを標的とした介入として扱う単一細胞遺伝子発現データの深部生成モデルを提案する。
これらの手法をシミュレーションした単一セルデータ上でベンチマークし、潜伏単位回復、因果的目標同定、領域外一般化における性能を評価する。
論文 参考訳(メタデータ) (2022-11-07T15:47:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。