論文の概要: ScDiVa: Masked Discrete Diffusion for Joint Modeling of Single-Cell Identity and Expression
- arxiv url: http://arxiv.org/abs/2602.03477v1
- Date: Tue, 03 Feb 2026 12:50:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.450844
- Title: ScDiVa: Masked Discrete Diffusion for Joint Modeling of Single-Cell Identity and Expression
- Title(参考訳): ScDiVa:シングルセルアイデンティティと表現の結合モデリングのためのマスク付き離散拡散
- Authors: Mingxuan Wang, Cheng Chen, Gaoyang Jiang, Zijia Ren, Chuangxin Zhao, Lu Shi, Yanbiao Ma,
- Abstract要約: シングルセルRNA-seqプロファイルは高次元、スパース、非秩序であり、自己回帰生成は人工的な秩序バイアスを課す。
そこで我々は,ScDiVaをマスク付き離散拡散基礎モデルとして提案する。
- 参考スコア(独自算出の注目度): 24.508523704467695
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-cell RNA-seq profiles are high-dimensional, sparse, and unordered, causing autoregressive generation to impose an artificial ordering bias and suffer from error accumulation. To address this, we propose scDiVa, a masked discrete diffusion foundation model that aligns generation with the dropout-like corruption process by defining a continuous-time forward masking mechanism in token space. ScDiVa features a bidirectional denoiser that jointly models discrete gene identities and continuous values, utilizing entropy-normalized serialization and a latent anchor token to maximize information efficiency and preserve global cell identity. The model is trained via depth-invariant time sampling and a dual denoising objective to simulate varying sparsity levels while ensuring precise recovery of both identity and magnitude. Pre-trained on 59 million cells, scDiVa achieves strong transfer performance across major benchmarks, including batch integration, cell type annotation, and perturbation response prediction. These results suggest that masked discrete diffusion serves as a biologically coherent and effective alternative to autoregression.
- Abstract(参考訳): シングルセルRNA-seqプロファイルは高次元、スパース、非秩序であり、自己回帰生成は人工的な秩序バイアスを課し、エラーの蓄積に悩まされる。
これを解決するために,トークン空間における連続時間フォワードマスキング機構を定義することにより,生成をドロップアウトのような汚職プロセスと整合させるマスク付き離散拡散基盤モデル scDiVa を提案する。
ScDiVaは、エントロピー正規化シリアライゼーションと潜在アンカートークンを利用して、情報の効率を最大化し、グローバルセルのアイデンティティを保存し、離散的な遺伝子アイデンティティと連続的な値を共同でモデル化する双方向デノイザを備えている。
このモデルは、深度不変の時間サンプリングと、異なる空間レベルをシミュレートし、アイデンティティとマグニチュードの両方の正確な回復を確実にするための双対な認知目標によって訓練される。
5900万のセルで事前トレーニングされたScDiVaは、バッチ統合、セルタイプアノテーション、摂動応答予測など、主要なベンチマーク間で強力な転送パフォーマンスを実現している。
これらの結果は、マスキングされた離散拡散が、自己回帰の生物学的に一貫性があり効果的な代替となることを示唆している。
関連論文リスト
- scDFM: Distributional Flow Matching Model for Robust Single-Cell Perturbation Prediction [12.48933770510505]
条件付きフローマッチングに基づく生成フレームワークである scDFM を提案する。
scDFMは、細胞レベルでの通信以上の個体群を混乱させ、制御する。
論文 参考訳(メタデータ) (2026-02-06T17:00:21Z) - Latent Shadows: The Gaussian-Discrete Duality in Masked Diffusion [22.034770068249063]
マスク付き離散拡散は、トークンをマスク状態に反復的に劣化させる高品質言語モデリングにおいて支配的なパラダイムである。
拡散双対性は一様模型に対する決定論的蒸留を可能にするが、これらのアプローチは一般にマスク付き模型を過小評価し、複素積分作用素に依存する。
我々は、この双対性を利用する原理的フレームワークであるMasked Consistency Distillation (MCD)を導入し、数値ODEソルバをバイパスする。
論文 参考訳(メタデータ) (2026-01-31T16:00:46Z) - Departures: Distributional Transport for Single-Cell Perturbation Prediction with Neural Schrödinger Bridges [51.83259180910313]
遺伝子機能解析における大きなボトルネックは、単細胞データの未成熟の性質である。
我々は、SB(Schrdinger Bridge)を近似して、単セル摂動データに対処する。
本モデルは,異種単一セル応答を効果的に捉え,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-11-17T08:27:13Z) - Scalable Single-Cell Gene Expression Generation with Latent Diffusion Models [11.343106383645441]
単一細胞遺伝子発現データに対してスケーラブルな潜伏拡散モデルを導入し、これを scLDM と呼ぶ。
観測および摂動単細胞データおよびセルレベルの分類などの下流タスクにおいて,様々な実験において,その優れた性能を示す。
論文 参考訳(メタデータ) (2025-11-04T20:44:12Z) - Self-Speculative Masked Diffusions [46.04054227238148]
本稿では,離散データに対する自己投機的マスク拡散モデルを提案する。
マスク位置上の非分解予測を発生させることにより計算負担を低減する。
我々は,GPT2スケールのテキストモデリングとタンパク質配列生成に本手法を適用し,必要なネットワーク転送回数を2倍に削減できることを確認した。
論文 参考訳(メタデータ) (2025-10-04T20:16:38Z) - Continuously Augmented Discrete Diffusion model for Categorical Generative Modeling [87.34677262370924]
標準離散拡散モデルは、吸収[MASK]トークンにそれらをマッピングすることで、すべての観測されていない状態を同一に扱う。
これは'インフォメーション・ヴォイド'を生成します。そこでは、偽のトークンから推測できるセマンティック情報は、デノイングステップの間に失われます。
連続的拡張離散拡散(Continuously Augmented Discrete Diffusion)は、連続的な潜在空間における対拡散で離散状態空間を拡大するフレームワークである。
論文 参考訳(メタデータ) (2025-10-01T18:00:56Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - Unifying Autoregressive and Diffusion-Based Sequence Generation [3.1853022872760186]
拡散に基づくシーケンス生成モデルに対して,自己回帰型言語モデルで行を曖昧にする重要な拡張を提示する。
個別のトークン位置に異なるノイズスケジュールを割り当てるハイパースケジューリングを導入する。
第二に,吸収過程と一様過程の間に介在する2つのハイブリッドトークン単位のノイズ発生過程を提案し,過去の誤りを解消する。
論文 参考訳(メタデータ) (2025-04-08T20:32:10Z) - One-for-More: Continual Diffusion Model for Anomaly Detection [63.50488826645681]
異常検出法は拡散モデルを用いて任意の異常画像が与えられたときの正常サンプルの生成または再構成を行う。
われわれは,拡散モデルが「重度忠実幻覚」と「破滅的な忘れ」に悩まされていることを発見した。
本研究では,安定な連続学習を実現するために勾配予測を用いた連続拡散モデルを提案する。
論文 参考訳(メタデータ) (2025-02-27T07:47:27Z) - Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design [56.957070405026194]
拡散モデルにより生成された軌道全体を通して報酬の直接バックプロパゲーションを可能にするアルゴリズムを提案する。
DRAKESは自然に似ており、高い報酬をもたらすシーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-10-17T15:10:13Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。