論文の概要: LapDDPM: A Conditional Graph Diffusion Model for scRNA-seq Generation with Spectral Adversarial Perturbations
- arxiv url: http://arxiv.org/abs/2506.13344v1
- Date: Mon, 16 Jun 2025 10:35:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:48.193457
- Title: LapDDPM: A Conditional Graph Diffusion Model for scRNA-seq Generation with Spectral Adversarial Perturbations
- Title(参考訳): LapDDPM:スペクトル対向摂動を用いたscRNA-seq生成のための条件付きグラフ拡散モデル
- Authors: Lorenzo Bini, Stephane Marchand-Maillet,
- Abstract要約: 安定かつ高忠実な scRNA-seq 生成のための条件付きグラフ拡散確率モデルである LapDDPM を導入する。
我々は,複雑なscRNA-seq分布からの効果的な学習と生成のための条件付きスコアベースモデルを開発した。
多様なscRNA-seqデータセットの実験は、LapDDPMの優れた性能を示し、高い忠実性を実現し、生物学的に証明可能な細胞型特異なサンプルを生成する。
- 参考スコア(独自算出の注目度): 1.0377683220196872
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating high-fidelity and biologically plausible synthetic single-cell RNA sequencing (scRNA-seq) data, especially with conditional control, is challenging due to its high dimensionality, sparsity, and complex biological variations. Existing generative models often struggle to capture these unique characteristics and ensure robustness to structural noise in cellular networks. We introduce LapDDPM, a novel conditional Graph Diffusion Probabilistic Model for robust and high-fidelity scRNA-seq generation. LapDDPM uniquely integrates graph-based representations with a score-based diffusion model, enhanced by a novel spectral adversarial perturbation mechanism on graph edge weights. Our contributions are threefold: we leverage Laplacian Positional Encodings (LPEs) to enrich the latent space with crucial cellular relationship information; we develop a conditional score-based diffusion model for effective learning and generation from complex scRNA-seq distributions; and we employ a unique spectral adversarial training scheme on graph edge weights, boosting robustness against structural variations. Extensive experiments on diverse scRNA-seq datasets demonstrate LapDDPM's superior performance, achieving high fidelity and generating biologically-plausible, cell-type-specific samples. LapDDPM sets a new benchmark for conditional scRNA-seq data generation, offering a robust tool for various downstream biological applications.
- Abstract(参考訳): 高忠実で生物学的に安定な合成単細胞RNAシークエンシング(scRNA-seq)データの生成は、特に条件制御によって、その高次元性、疎性、複雑な生物学的変異のために困難である。
既存の生成モデルは、しばしばこれらのユニークな特徴を捉え、セルネットワークの構造的ノイズに対して堅牢性を確保するのに苦労する。
安定かつ高忠実な scRNA-seq 生成のための条件付きグラフ拡散確率モデルである LapDDPM を導入する。
LapDDPMは、グラフエッジ重みに対する新しいスペクトル逆摂動機構によって強化されたスコアベースの拡散モデルとグラフベースの表現を一意に統合する。
我々は,Laplacian Positional Encodings (LPEs) を利用して,重要なセル関係情報とともに潜伏空間を拡張し,複雑な scRNA-seq 分布からの効果的な学習と生成のための条件付きスコアベース拡散モデルを構築し,グラフエッジ重み付けに独自のスペクトル対向トレーニングスキームを採用し,構造的変動に対して堅牢性を高める。
多様なscRNA-seqデータセットに関する大規模な実験は、LapDDPMの優れた性能を示し、高い忠実性を実現し、生物学的に証明可能な細胞型特異なサンプルを生成する。
LapDDPMは条件付きscRNA-seqデータ生成のための新しいベンチマークを設定し、様々な下流の生物学的アプリケーションに堅牢なツールを提供する。
関連論文リスト
- UniGenX: Unified Generation of Sequence and Structure with Autoregressive Diffusion [61.690978792873196]
既存のアプローチは自己回帰シーケンスモデルか拡散モデルのいずれかに依存している。
自己回帰的次トーケン予測と条件拡散モデルを組み合わせた統合フレームワークUniGenXを提案する。
材料および小分子生成タスクにおけるUniGenXの有効性を検証する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design [56.957070405026194]
拡散モデルにより生成された軌道全体を通して報酬の直接バックプロパゲーションを可能にするアルゴリズムを提案する。
DRAKESは自然に似ており、高い報酬をもたらすシーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-10-17T15:10:13Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - scDiffusion: conditional generation of high-quality single-cell data
using diffusion model [1.0738561302102216]
単細胞RNAシークエンシング(scRNA-seq)データは、単細胞レベルでの生命の法則を研究する上で重要である。
十分な高品質の scRNA-seq データを取得することは依然として困難である。
拡散モデルと基礎モデルを組み合わせた生成モデルである scDiffusion を開発し,高品質な scRNA-seq データを生成する。
論文 参考訳(メタデータ) (2024-01-08T15:44:39Z) - Deceive D: Adaptive Pseudo Augmentation for GAN Training with Limited
Data [125.7135706352493]
GAN(Generative Adversarial Network)は、高忠実度画像を合成するために、訓練に十分なデータを必要とする。
近年の研究では、差別者の過度な適合により、限られたデータでGANを訓練することは困難であることが示されている。
本稿では,APA (Adaptive Pseudo Augmentation) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-12T18:13:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。