論文の概要: Latent Gene Diffusion for Spatial Transcriptomics Completion
- arxiv url: http://arxiv.org/abs/2509.01864v1
- Date: Tue, 02 Sep 2025 01:14:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.870614
- Title: Latent Gene Diffusion for Spatial Transcriptomics Completion
- Title(参考訳): 空間的トランスクリプトークス補完のための潜時遺伝子拡散
- Authors: Paula Cárdenas, Leonardo Manrique, Daniela Vega, Daniela Ruiz, Pablo Arbeláez,
- Abstract要約: LGDiSTは、データドロップアウトのための参照なし潜在遺伝子拡散モデルである。
以上の結果から,LGDiSTは遺伝子発現の完成度において,これまでの最先端よりも優れていたことが示唆された。
LGDiSTの重要な革新は、コンテキスト遺伝子を使用して、リッチで生物学的に意味のある遺伝的潜伏空間を構築することである。
- 参考スコア(独自算出の注目度): 2.8967421319667728
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Computer Vision has proven to be a powerful tool for analyzing Spatial Transcriptomics (ST) data. However, current models that predict spatially resolved gene expression from histopathology images suffer from significant limitations due to data dropout. Most existing approaches rely on single-cell RNA sequencing references, making them dependent on alignment quality and external datasets while also risking batch effects and inherited dropout. In this paper, we address these limitations by introducing LGDiST, the first reference-free latent gene diffusion model for ST data dropout. We show that LGDiST outperforms the previous state-of-the-art in gene expression completion, with an average Mean Squared Error that is 18% lower across 26 datasets. Furthermore, we demonstrate that completing ST data with LGDiST improves gene expression prediction performance on six state-of-the-art methods up to 10% in MSE. A key innovation of LGDiST is using context genes previously considered uninformative to build a rich and biologically meaningful genetic latent space. Our experiments show that removing key components of LGDiST, such as the context genes, the ST latent space, and the neighbor conditioning, leads to considerable drops in performance. These findings underscore that the full architecture of LGDiST achieves substantially better performance than any of its isolated components.
- Abstract(参考訳): コンピュータビジョンは空間トラノドミクス(ST)データを解析するための強力なツールであることが証明されている。
しかし, 病理画像から空間的に解決された遺伝子発現を予測する現在のモデルでは, データドロップアウトによる大きな限界が生じる。
既存のアプローチのほとんどはシングルセルRNAシークエンシング参照に依存しており、アライメント品質と外部データセットに依存し、バッチ効果のリスクとドロップアウトを継承する。
本稿では,STデータドロップアウトのための参照なし遅延遺伝子拡散モデルLGDiSTを導入することで,これらの制約に対処する。
以上の結果から,LGDiSTは,26のデータセットに対して平均18%低い平均二乗誤差で,遺伝子発現完了におけるこれまでの最先端よりも優れていたことが示唆された。
さらに,LGDiSTを用いたSTデータの完成により,6つの最先端手法の遺伝子発現予測性能が最大10%向上することが実証された。
LGDiSTの重要な革新は、以前は非情報的と考えられていた文脈遺伝子を用いて、リッチで生物学的に意味のある遺伝的潜伏空間を構築することである。
実験の結果,LGDiSTの主要成分,例えば文脈遺伝子,ST潜伏空間,および隣接条件などの除去は,性能の低下を招いた。
これらの結果は、LGDiSTの完全なアーキテクチャは、どの独立したコンポーネントよりも大幅に性能が向上していることを示している。
関連論文リスト
- GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文 参考訳(メタデータ) (2025-05-06T03:35:24Z) - Completing Spatial Transcriptomics Data for Gene Expression Prediction Benchmarking [1.177642303362119]
26の公開データセットからなるデータベースであるSpaREDと、最先端のトランスフォーマーに基づく遺伝子発現補完モデルであるSpaCKLEを紹介する。
我々の貢献は、これまででもっとも包括的な組織像からの遺伝子発現予測のベンチマークとなっている。
論文 参考訳(メタデータ) (2025-05-05T19:17:29Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Diffusion Generative Modeling for Spatially Resolved Gene Expression Inference from Histology Images [11.64540208294516]
我々は、拡散を伴う遺伝子 $textbfE$xpression の推論で、$textbfS$pa$textbfT$ially を提示する。
$textbfStem$は、同じ遺伝子変異レベルを基底真理データとして共有する高忠実な遺伝子発現予測を生成する。
提案したパイプラインは、ゲノムの観点から、既存の、容易にアクセス可能なH&E染色組織像を解析する可能性を開放する。
論文 参考訳(メタデータ) (2025-01-26T16:52:27Z) - SpaDiT: Diffusion Transformer for Spatial Gene Expression Prediction using scRNA-seq [9.624390863643109]
SpaDiTは、検出されていない遺伝子の予測のために、scRNA-seqとSTデータを統合したディープラーニング手法である。
本研究では,SpaDiTの有効性を,Seqベースおよび画像ベースSTデータの両方で広範な実験により実証した。
論文 参考訳(メタデータ) (2024-07-18T05:40:50Z) - SpaRED benchmark: Enhancing Gene Expression Prediction from Histology Images with Spatial Transcriptomics Completion [2.032350440475489]
我々は,26の公開資料から収集した体系的にキュレートされ,処理されたデータベースについて述べる。
また、欠落した遺伝子発現を推測する技術として、最先端のトランスフォーマーベースの補完手法を提案する。
我々の貢献は、これまででもっとも包括的な組織像からの遺伝子発現予測のベンチマークとなっている。
論文 参考訳(メタデータ) (2024-07-17T21:28:20Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - sc-OTGM: Single-Cell Perturbation Modeling by Solving Optimal Mass Transport on the Manifold of Gaussian Mixtures [0.9674145073701153]
sc-OTGMは、scRNAseqデータが生成される誘導バイアスに基づく教師なしモデルである。
sc-OTGMは細胞状態の分類、異なる遺伝子発現の解析、標的同定のための遺伝子ランキングに有効である。
また、下流遺伝子制御に対する単一遺伝子の摂動の影響を予測し、特定の細胞状態に条件付けられた合成scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-05-06T06:46:11Z) - DiffSTG: Probabilistic Spatio-Temporal Graph Forecasting with Denoising
Diffusion Models [53.67562579184457]
本稿では,不確実性や複雑な依存関係のモデル化が困難であることから,確率的STG予測に焦点をあてる。
本稿では,一般的な拡散モデルをSTGに一般化する最初の試みとして,DiffSTGと呼ばれる新しい非自己回帰フレームワークを提案する。
提案手法は,本質的時間学習能力STNNと拡散モデルの不確実性測定を組み合わせたものである。
論文 参考訳(メタデータ) (2023-01-31T13:42:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。