論文の概要: SAGE-FM: A lightweight and interpretable spatial transcriptomics foundation model
- arxiv url: http://arxiv.org/abs/2601.15504v1
- Date: Wed, 21 Jan 2026 22:22:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-23 21:37:20.432767
- Title: SAGE-FM: A lightweight and interpretable spatial transcriptomics foundation model
- Title(参考訳): SAGE-FM:軽量かつ解釈可能な空間転写基礎モデル
- Authors: Xianghao Zhan, Jingyu Xu, Yuanning Zheng, Zinaida Good, Olivier Gevaert,
- Abstract要約: グラフ畳み込みネットワーク(GCN)に基づく軽量空間転写基盤モデルであるSAGE-FMを紹介する。
SAGE-FMは、15個の臓器にまたがる416個のヒトのビシウムサンプルに基づいて、マスクされた遺伝子を確実に回収する空間的に整合した埋め込みを学習する。
以上の結果から,GCNは大規模空間転写学において生物学的に解釈可能かつ空間的に認識可能な基礎モデルとして機能することが示唆された。
- 参考スコア(独自算出の注目度): 2.060288975192133
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Spatial transcriptomics enables spatial gene expression profiling, motivating computational models that capture spatially conditioned regulatory relationships. We introduce SAGE-FM, a lightweight spatial transcriptomics foundation model based on graph convolutional networks (GCNs) trained with a masked central spot prediction objective. Trained on 416 human Visium samples spanning 15 organs, SAGE-FM learns spatially coherent embeddings that robustly recover masked genes, with 91% of masked genes showing significant correlations (p < 0.05). The embeddings generated by SAGE-FM outperform MOFA and existing spatial transcriptomics methods in unsupervised clustering and preservation of biological heterogeneity. SAGE-FM generalizes to downstream tasks, enabling 81% accuracy in pathologist-defined spot annotation in oropharyngeal squamous cell carcinoma and improving glioblastoma subtype prediction relative to MOFA. In silico perturbation experiments further demonstrate that the model captures directional ligand-receptor and upstream-downstream regulatory effects consistent with ground truth. These results demonstrate that simple, parameter-efficient GCNs can serve as biologically interpretable and spatially aware foundation models for large-scale spatial transcriptomics.
- Abstract(参考訳): 空間転写学は空間的遺伝子発現プロファイリングを可能にし、空間的条件付き規制関係をキャプチャする計算モデルを動機付けている。
SAGE-FMは,グラフ畳み込みネットワーク(GCN)に基づく軽量な空間転写基盤モデルである。
SAGE-FMは15の臓器にまたがる416個のヒトビシウムサンプルに基づいて、マスクされた遺伝子の91%が有意な相関を示す(p < 0.05)。
SAGE-FMが生成した埋め込みはMOFAと既存の空間転写学的手法を上回り、非教師なしクラスタリングと生物多様性の保存に役立てた。
SAGE-FMは、口腔扁平上皮癌において、病理医が定義したスポットアノテーションにおいて81%の精度でダウンストリームタスクを一般化し、MOFAに対するグリオブラスト腫の亜型予測を改善した。
さらにシリコ摂動実験では、このモデルが方向リガンド受容体と上流下流の規制効果を捉えていることが示される。
これらの結果は,大規模空間転写学の基礎モデルとして,簡便でパラメータ効率のよいGCNが生物学的に解釈可能かつ空間的に認識できることを示した。
関連論文リスト
- SIGMA: Scalable Spectral Insights for LLM Collapse [51.863164847253366]
SIGMA(Spectral Inequalities for Gram Matrix Analysis)は,モデル崩壊のための統一的なフレームワークである。
行列のスペクトル上の決定論的境界を導出するベンチマークを利用することで、SIGMAは表現空間の収縮を追跡するために数学的に基底化された計量を提供する。
我々は、SIGMAが状態への遷移を効果的に捉え、崩壊のメカニズムに関する理論的知見の両方を提供することを示した。
論文 参考訳(メタデータ) (2026-01-06T19:47:11Z) - Digital Modeling of Spatial Pathway Activity from Histology Reveals Tumor Microenvironment Heterogeneity [0.08994003055762607]
ヘマトキシリンおよびエオシン染色組織像から直接空間経路活性を予測する計算フレームワークを提案する。
TGFbシグナリングは3つの乳癌および肺癌STデータセットにおいて最も正確に予測された経路であることがわかった。
論文 参考訳(メタデータ) (2025-12-09T07:54:25Z) - When Genes Speak: A Semantic-Guided Framework for Spatially Resolved Transcriptomics Data Clustering [26.67465778995387]
SemSTは空間転写学データクラスタリングのための意味誘導型ディープラーニングフレームワークである。
FSMモジュールは、空間的特徴の要素ワイドキャリブレーションを実行するためにセマンティック埋め込みを促進するスポット特異的なアフィン変換を学習する。
公共空間トランスクリプトミクスデータセットの実験により、SemSTが最先端のクラスタリング性能を達成することが示された。
論文 参考訳(メタデータ) (2025-11-14T15:03:41Z) - AdaFusion: Prompt-Guided Inference with Adaptive Fusion of Pathology Foundation Models [49.550545038402184]
本稿では,新しいプロンプト誘導推論フレームワークであるAdaFusionを提案する。
本手法は,多様なモデルからタイルレベルの特徴を圧縮・整列する。
AdaFusionは、分類タスクと回帰タスクの両方にわたって、個々のPFMを一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-07T07:09:31Z) - Generate Aligned Anomaly: Region-Guided Few-Shot Anomaly Image-Mask Pair Synthesis for Industrial Inspection [53.137651284042434]
異常検査は製造業において重要な役割を担っているが、異常サンプルの不足は既存の方法の有効性を制限している。
本稿では,GAA (Generate grained Anomaly) を提案する。
GAAは少数のサンプルのみを用いて現実的で多様で意味的に整合した異常を発生させる。
論文 参考訳(メタデータ) (2025-07-13T12:56:59Z) - Controllable diffusion-based generation for multi-channel biological data [66.44042377817074]
本研究では, 構造的および空間的生物学的データに対する制御可能生成のための統合拡散フレームワークを提案する。
空間的および非空間的予測タスクにまたがって,IMCにおけるタンパク質のインパルス化や単一セルデータセットにおける遺伝子対タンパク質の予測など,最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-06-24T00:56:21Z) - HEIST: A Graph Foundation Model for Spatial Transcriptomics and Proteomics Data [25.915980581662023]
本稿では,空間転写学とトランスフォーマーのための階層グラフ基盤モデルであるHEISTを紹介する。
HEISTは、124の組織から15の臓器の22.3M細胞に、空間的に認識されるコントラストとマスクされた自己エンコーディングの目的を用いて事前訓練されている。
論文 参考訳(メタデータ) (2025-06-11T12:29:01Z) - Distance-Preserving Spatial Representations in Genomic Data [0.0]
単一細胞遺伝子発現データの空間的コンテキストは、多くの下流解析において重要であるが、実際的および技術的制限のため、しばしばアクセスできない。
本稿では、提供された遺伝子発現データに関連する空間座標を再構成できる汎用表現学習・伝達学習フレームワークdp-VAEを提案する。
論文 参考訳(メタデータ) (2024-08-01T21:04:27Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。