論文の概要: ScDiVa: Masked Discrete Diffusion for Joint Modeling of Single-Cell Identity and Expression
- arxiv url: http://arxiv.org/abs/2602.03477v1
- Date: Tue, 03 Feb 2026 12:50:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.450844
- Title: ScDiVa: Masked Discrete Diffusion for Joint Modeling of Single-Cell Identity and Expression
- Title(参考訳): ScDiVa:シングルセルアイデンティティと表現の結合モデリングのためのマスク付き離散拡散
- Authors: Mingxuan Wang, Cheng Chen, Gaoyang Jiang, Zijia Ren, Chuangxin Zhao, Lu Shi, Yanbiao Ma,
- Abstract要約: シングルセルRNA-seqプロファイルは高次元、スパース、非秩序であり、自己回帰生成は人工的な秩序バイアスを課す。
そこで我々は,ScDiVaをマスク付き離散拡散基礎モデルとして提案する。
- 参考スコア(独自算出の注目度): 24.508523704467695
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-cell RNA-seq profiles are high-dimensional, sparse, and unordered, causing autoregressive generation to impose an artificial ordering bias and suffer from error accumulation. To address this, we propose scDiVa, a masked discrete diffusion foundation model that aligns generation with the dropout-like corruption process by defining a continuous-time forward masking mechanism in token space. ScDiVa features a bidirectional denoiser that jointly models discrete gene identities and continuous values, utilizing entropy-normalized serialization and a latent anchor token to maximize information efficiency and preserve global cell identity. The model is trained via depth-invariant time sampling and a dual denoising objective to simulate varying sparsity levels while ensuring precise recovery of both identity and magnitude. Pre-trained on 59 million cells, scDiVa achieves strong transfer performance across major benchmarks, including batch integration, cell type annotation, and perturbation response prediction. These results suggest that masked discrete diffusion serves as a biologically coherent and effective alternative to autoregression.
- Abstract(参考訳): シングルセルRNA-seqプロファイルは高次元、スパース、非秩序であり、自己回帰生成は人工的な秩序バイアスを課し、エラーの蓄積に悩まされる。
これを解決するために,トークン空間における連続時間フォワードマスキング機構を定義することにより,生成をドロップアウトのような汚職プロセスと整合させるマスク付き離散拡散基盤モデル scDiVa を提案する。
ScDiVaは、エントロピー正規化シリアライゼーションと潜在アンカートークンを利用して、情報の効率を最大化し、グローバルセルのアイデンティティを保存し、離散的な遺伝子アイデンティティと連続的な値を共同でモデル化する双方向デノイザを備えている。
このモデルは、深度不変の時間サンプリングと、異なる空間レベルをシミュレートし、アイデンティティとマグニチュードの両方の正確な回復を確実にするための双対な認知目標によって訓練される。
5900万のセルで事前トレーニングされたScDiVaは、バッチ統合、セルタイプアノテーション、摂動応答予測など、主要なベンチマーク間で強力な転送パフォーマンスを実現している。
これらの結果は、マスキングされた離散拡散が、自己回帰の生物学的に一貫性があり効果的な代替となることを示唆している。
関連論文リスト
- Latent Shadows: The Gaussian-Discrete Duality in Masked Diffusion [22.034770068249063]
マスク付き離散拡散は、トークンをマスク状態に反復的に劣化させる高品質言語モデリングにおいて支配的なパラダイムである。
拡散双対性は一様模型に対する決定論的蒸留を可能にするが、これらのアプローチは一般にマスク付き模型を過小評価し、複素積分作用素に依存する。
我々は、この双対性を利用する原理的フレームワークであるMasked Consistency Distillation (MCD)を導入し、数値ODEソルバをバイパスする。
論文 参考訳(メタデータ) (2026-01-31T16:00:46Z) - Departures: Distributional Transport for Single-Cell Perturbation Prediction with Neural Schrödinger Bridges [51.83259180910313]
遺伝子機能解析における大きなボトルネックは、単細胞データの未成熟の性質である。
我々は、SB(Schrdinger Bridge)を近似して、単セル摂動データに対処する。
本モデルは,異種単一セル応答を効果的に捉え,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-11-17T08:27:13Z) - Scalable Single-Cell Gene Expression Generation with Latent Diffusion Models [11.343106383645441]
単一細胞遺伝子発現データに対してスケーラブルな潜伏拡散モデルを導入し、これを scLDM と呼ぶ。
観測および摂動単細胞データおよびセルレベルの分類などの下流タスクにおいて,様々な実験において,その優れた性能を示す。
論文 参考訳(メタデータ) (2025-11-04T20:44:12Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - Unifying Autoregressive and Diffusion-Based Sequence Generation [3.1853022872760186]
拡散に基づくシーケンス生成モデルに対して,自己回帰型言語モデルで行を曖昧にする重要な拡張を提示する。
個別のトークン位置に異なるノイズスケジュールを割り当てるハイパースケジューリングを導入する。
第二に,吸収過程と一様過程の間に介在する2つのハイブリッドトークン単位のノイズ発生過程を提案し,過去の誤りを解消する。
論文 参考訳(メタデータ) (2025-04-08T20:32:10Z) - One-for-More: Continual Diffusion Model for Anomaly Detection [63.50488826645681]
異常検出法は拡散モデルを用いて任意の異常画像が与えられたときの正常サンプルの生成または再構成を行う。
われわれは,拡散モデルが「重度忠実幻覚」と「破滅的な忘れ」に悩まされていることを発見した。
本研究では,安定な連続学習を実現するために勾配予測を用いた連続拡散モデルを提案する。
論文 参考訳(メタデータ) (2025-02-27T07:47:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。