論文の概要: When Genes Speak: A Semantic-Guided Framework for Spatially Resolved Transcriptomics Data Clustering
- arxiv url: http://arxiv.org/abs/2511.11380v1
- Date: Fri, 14 Nov 2025 15:03:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.669986
- Title: When Genes Speak: A Semantic-Guided Framework for Spatially Resolved Transcriptomics Data Clustering
- Title(参考訳): Genes Speak: 空間的に解決されたトランスクリプトミクスデータクラスタリングのためのセマンティックガイドフレームワーク
- Authors: Jiangkai Long, Yanran Zhu, Chang Tang, Kun Sun, Yuanyuan Liu, Xuesong Yan,
- Abstract要約: SemSTは空間転写学データクラスタリングのための意味誘導型ディープラーニングフレームワークである。
FSMモジュールは、空間的特徴の要素ワイドキャリブレーションを実行するためにセマンティック埋め込みを促進するスポット特異的なアフィン変換を学習する。
公共空間トランスクリプトミクスデータセットの実験により、SemSTが最先端のクラスタリング性能を達成することが示された。
- 参考スコア(独自算出の注目度): 26.67465778995387
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spatial transcriptomics enables gene expression profiling with spatial context, offering unprecedented insights into the tissue microenvironment. However, most computational models treat genes as isolated numerical features, ignoring the rich biological semantics encoded in their symbols. This prevents a truly deep understanding of critical biological characteristics. To overcome this limitation, we present SemST, a semantic-guided deep learning framework for spatial transcriptomics data clustering. SemST leverages Large Language Models (LLMs) to enable genes to "speak" through their symbolic meanings, transforming gene sets within each tissue spot into biologically informed embeddings. These embeddings are then fused with the spatial neighborhood relationships captured by Graph Neural Networks (GNNs), achieving a coherent integration of biological function and spatial structure. We further introduce the Fine-grained Semantic Modulation (FSM) module to optimally exploit these biological priors. The FSM module learns spot-specific affine transformations that empower the semantic embeddings to perform an element-wise calibration of the spatial features, thus dynamically injecting high-order biological knowledge into the spatial context. Extensive experiments on public spatial transcriptomics datasets show that SemST achieves state-of-the-art clustering performance. Crucially, the FSM module exhibits plug-and-play versatility, consistently improving the performance when integrated into other baseline methods.
- Abstract(参考訳): 空間転写学は、遺伝子発現を空間的文脈でプロファイリングし、組織微小環境に対する前例のない洞察を与える。
しかし、ほとんどの計算モデルは、遺伝子を独立した数値的な特徴として扱い、記号にエンコードされたリッチな生物学的意味論を無視している。
これにより、重要な生物学的特性の真に深い理解が妨げられる。
この制限を克服するために、空間転写学データクラスタリングのための意味誘導深層学習フレームワークSemSTを提案する。
SemSTはLarge Language Models(LLM)を利用して、遺伝子がそれらの象徴的な意味を通して「話す」ことを可能にする。
これらの埋め込みは、グラフニューラルネットワーク(GNN)が捉えた空間的近傍関係と融合し、生物学的機能と空間構造を整合的に統合する。
さらに,これらの生物的前提を最適に活用するためのFSMモジュールについても紹介する。
FSMモジュールは、意味的な埋め込みを促進するスポット特異的なアフィン変換を学習し、空間的特徴の要素ワイドなキャリブレーションを実行することにより、空間的文脈に高次生物学的知識を動的に注入する。
公共空間トランスクリプトミクスデータセットの大規模な実験は、SemSTが最先端のクラスタリング性能を達成することを示す。
重要な点として、FSMモジュールはプラグアンドプレイの汎用性を示し、他のベースラインメソッドに統合された場合のパフォーマンスを一貫して改善する。
関連論文リスト
- GeoGNN: Quantifying and Mitigating Semantic Drift in Text-Attributed Graphs [59.61242815508687]
テキスト分散グラフ(TAG)上のグラフニューラルネットワーク(GNN)は、事前訓練された言語モデル(PLM)を使用してノードテキストを符号化し、これらの埋め込みを線形近傍アグリゲーションを通じて伝播する。
本研究は,意味的ドリフトの度合いを計測する局所PCAベースの計量を導入し,異なる凝集機構が多様体構造にどのように影響するかを解析するための最初の定量的枠組みを提供する。
論文 参考訳(メタデータ) (2025-11-12T06:48:43Z) - SemanticST: Spatially Informed Semantic Graph Learning for Clustering, Integration, and Scalable Analysis of Spatial Transcriptomics [3.1403380447856426]
本稿では,空間転写学解析のためのグラフベースのディープラーニングフレームワークSemanticSTを提案する。
ミニバッチトレーニングをサポートしており、Xenium(50,000セル)のような大規模データセットにスケーラブルなグラフニューラルネットワークとしては初めてのものだ。
論文 参考訳(メタデータ) (2025-06-13T06:30:48Z) - MIRROR: Multi-Modal Pathological Self-Supervised Representation Learning via Modality Alignment and Retention [57.044719143401664]
病理組織学と転写学は、腫瘍学の基本的なモダリティであり、疾患の形態学的および分子的側面を包含している。
モーダルアライメントと保持を両立させる新しいマルチモーダル表現学習法であるMIRRORを提案する。
がんの亜型化と生存分析のためのTCGAコホートに関する広範囲な評価は,MIRRORの優れた性能を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-03-01T07:02:30Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Segmentation-free integration of nuclei morphology and spatial transcriptomics for retinal images [1.2200074914789645]
SEFI(Segmentation-Free Integration)は、細胞核の形態的特徴と空間転写学データを統合する新しい方法である。
マルチプレックス単一分子Fluorescence In Situ Hybridization (smFISH)を用いて得られた発達期網膜の空間分解遺伝子発現プロファイルについてSEFIを実証する。
論文 参考訳(メタデータ) (2025-02-08T14:03:02Z) - Multi-modal Spatial Clustering for Spatial Transcriptomics Utilizing High-resolution Histology Images [1.3124513975412255]
空間転写学(spatial transcriptomics, ST)は、空間的文脈を保ちながら、転写産物全体の遺伝子発現プロファイリングを可能にする。
現在の空間クラスタリング法では、高解像度の組織像と遺伝子発現データを完全に統合することができない。
本稿では、遺伝子発現データと組織像の特徴を融合した、新しいコントラスト学習に基づく深層学習手法を提案する。
論文 参考訳(メタデータ) (2024-10-31T00:32:24Z) - Multimodal contrastive learning for spatial gene expression prediction using histology images [13.47034080678041]
空間的トランスクリプトミクス表現予測のための Transformer と Densenet-121 エンコーダを用いたマルチモーダルコントラスト学習である textbfmclSTExp を提案する。
textbfmclSTExpは空間的遺伝子発現を予測するのに優れた性能を持つ。
がん特異的な過剰発現遺伝子を解釈し、免疫関連遺伝子を解明し、病理学者によって注釈された特別な空間領域を特定することには、有望であることが示されている。
論文 参考訳(メタデータ) (2024-07-11T06:33:38Z) - GSMFlow: Generation Shifts Mitigating Flow for Generalized Zero-Shot
Learning [55.79997930181418]
Generalized Zero-Shot Learningは、目に見えないクラスから見えないクラスに意味的な知識を移すことで、目に見えないクラスと見えないクラスの両方から画像を認識することを目的としている。
生成モデルの利点を生かして、見学したクラスから学んだ知識に基づいて、現実的な見知らぬサンプルを幻覚させることは、有望な解決策である。
本研究では,複数の条件付きアフィン結合層からなるフローベース生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:04:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。