論文の概要: SPATIA: Multimodal Model for Prediction and Generation of Spatial Cell Phenotypes
- arxiv url: http://arxiv.org/abs/2507.04704v1
- Date: Mon, 07 Jul 2025 06:54:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.301414
- Title: SPATIA: Multimodal Model for Prediction and Generation of Spatial Cell Phenotypes
- Title(参考訳): SPATIA:空間セル現象の予測と生成のためのマルチモーダルモデル
- Authors: Zhenglun Kong, Mufan Qiu, John Boesen, Xiang Lin, Sukwon Yun, Tianlong Chen, Manolis Kellis, Marinka Zitnik,
- Abstract要約: 本研究では,空間転写学のマルチスケール生成予測モデルであるSPATIAを紹介する。
SPATIAは、画像由来のモルフォロジートークンと転写ベクタートークンを融合させることで、細胞レベルの埋め込みを学習する。
われわれはSPATIAを12のタスクにまたがる13の既存モデルに対してベンチマークする。
- 参考スコア(独自算出の注目度): 39.45743286683448
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding how cellular morphology, gene expression, and spatial organization jointly shape tissue function is a central challenge in biology. Image-based spatial transcriptomics technologies now provide high-resolution measurements of cell images and gene expression profiles, but machine learning methods typically analyze these modalities in isolation or at limited resolution. We address the problem of learning unified, spatially aware representations that integrate cell morphology, gene expression, and spatial context across biological scales. This requires models that can operate at single-cell resolution, reason across spatial neighborhoods, and generalize to whole-slide tissue organization. Here, we introduce SPATIA, a multi-scale generative and predictive model for spatial transcriptomics. SPATIA learns cell-level embeddings by fusing image-derived morphological tokens and transcriptomic vector tokens using cross-attention and then aggregates them at niche and tissue levels using transformer modules to capture spatial dependencies. SPATIA incorporates token merging in its generative diffusion decoder to synthesize high-resolution cell images conditioned on gene expression. We assembled a multi-scale dataset consisting of 17 million cell-gene pairs, 1 million niche-gene pairs, and 10,000 tissue-gene pairs across 49 donors, 17 tissue types, and 12 disease states. We benchmark SPATIA against 13 existing models across 12 individual tasks, which span several categories including cell annotation, cell clustering, gene imputation, cross-modal prediction, and image generation. SPATIA achieves improved performance over all baselines and generates realistic cell morphologies that reflect transcriptomic perturbations.
- Abstract(参考訳): 細胞形態、遺伝子発現、空間構造が組織機能とどのように結合するかを理解することは、生物学における中心的な課題である。
画像に基づく空間転写学技術は、細胞画像と遺伝子発現プロファイルの高分解能の測定を提供するが、機械学習手法は通常、これらのモダリティを分離または限定的な解像度で分析する。
本研究では, 細胞形態, 遺伝子発現, 空間的文脈を生物学的スケールで統合した, 空間的に意識された表現を学習することの課題に対処する。
これは、単一細胞の解像度で動作し、空間的近傍をまたいで推論し、全スライド組織に一般化できるモデルを必要とする。
本稿では,空間転写学のマルチスケール生成予測モデルであるSPATIAを紹介する。
SPATIAは、画像由来のモルフォロジートークンと転写ベクタートークンをクロスアテンションで融合させて細胞レベルの埋め込みを学習し、その後、トランスフォーマーモジュールを使用してニッチおよび組織レベルでそれらを集約し、空間的依存関係をキャプチャする。
SPATIAは、その生成拡散デコーダにトークンマージを組み込んで、遺伝子発現に条件付けられた高解像度の細胞画像を合成する。
1700万の細胞遺伝子ペア,100万のニッチ遺伝子ペア,49のドナーに1万の組織遺伝子ペア,17の組織タイプ,12の疾患状態からなるマルチスケールデータセットを構築した。
セルアノテーション,セルクラスタリング,遺伝子インプット,クロスモーダル予測,画像生成など,12のタスクにまたがる13の既存モデルに対してSPATIAをベンチマークする。
SPATIAはすべてのベースラインで性能を向上し、転写障害を反映する現実的な細胞形態を生成する。
関連論文リスト
- SemanticST: Spatially Informed Semantic Graph Learning for Clustering, Integration, and Scalable Analysis of Spatial Transcriptomics [3.1403380447856426]
本稿では,空間転写学解析のためのグラフベースのディープラーニングフレームワークSemanticSTを提案する。
ミニバッチトレーニングをサポートしており、Xenium(50,000セル)のような大規模データセットにスケーラブルなグラフニューラルネットワークとしては初めてのものだ。
論文 参考訳(メタデータ) (2025-06-13T06:30:48Z) - HEIST: A Graph Foundation Model for Spatial Transcriptomics and Proteomics Data [13.66950862644406]
本稿では,空間転写学データのための階層型グラフトランスフォーマーモデルHEISTを紹介する。
HEISTは15の臓器にまたがる124の組織から22.3M細胞で事前訓練されている。
細胞埋め込みにおける微小環境の影響を効果的にコードし、空間的にインフォームドされたサブ集団の発見を可能にする。
論文 参考訳(メタデータ) (2025-06-11T12:29:01Z) - HistoSmith: Single-Stage Histology Image-Label Generation via Conditional Latent Diffusion for Enhanced Cell Segmentation and Classification [0.19791587637442667]
本研究は, 画像ラベルペア生成のための新しい単一ステージアプローチを導入し, 組織学データセットを増強する。
ラベル生成と画像生成を分離した拡散モデルを用いる最先端の手法とは異なり,本手法では遅延拡散モデルを用いる。
このモデルは、細胞タイプ、量、組織タイプなどのユーザ定義パラメータを条件付けすることで、データ生成の調整を可能にする。
論文 参考訳(メタデータ) (2025-02-12T19:51:41Z) - Multi-modal Spatial Clustering for Spatial Transcriptomics Utilizing High-resolution Histology Images [1.3124513975412255]
空間転写学(spatial transcriptomics, ST)は、空間的文脈を保ちながら、転写産物全体の遺伝子発現プロファイリングを可能にする。
現在の空間クラスタリング法では、高解像度の組織像と遺伝子発現データを完全に統合することができない。
本稿では、遺伝子発現データと組織像の特徴を融合した、新しいコントラスト学習に基づく深層学習手法を提案する。
論文 参考訳(メタデータ) (2024-10-31T00:32:24Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。