論文の概要: Scalable Generation of Spatial Transcriptomics from Histology Images via Whole-Slide Flow Matching
- arxiv url: http://arxiv.org/abs/2506.05361v1
- Date: Sun, 25 May 2025 01:29:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 03:13:19.005785
- Title: Scalable Generation of Spatial Transcriptomics from Histology Images via Whole-Slide Flow Matching
- Title(参考訳): 全スライディングフローマッチングによるヒストロジー画像からの空間トランスクリプトクスのスケーラブル生成
- Authors: Tinglin Huang, Tianyu Liu, Mehrtash Babadi, Wengong Jin, Rex Ying,
- Abstract要約: スライド全体の遺伝子発現の結合分布をモデル化し,細胞間相互作用を考慮したフローマッチング生成モデルSTFlowを提案する。
最近行われたHEST-1kとSTImage-1K4Mベンチマークでは、STFlowは最先端のベースラインを大幅に上回り、病理基盤モデルよりも18%以上改善されている。
- 参考スコア(独自算出の注目度): 21.343517232305533
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spatial transcriptomics (ST) has emerged as a powerful technology for bridging histology imaging with gene expression profiling. However, its application has been limited by low throughput and the need for specialized experimental facilities. Prior works sought to predict ST from whole-slide histology images to accelerate this process, but they suffer from two major limitations. First, they do not explicitly model cell-cell interaction as they factorize the joint distribution of whole-slide ST data and predict the gene expression of each spot independently. Second, their encoders struggle with memory constraints due to the large number of spots (often exceeding 10,000) in typical ST datasets. Herein, we propose STFlow, a flow matching generative model that considers cell-cell interaction by modeling the joint distribution of gene expression of an entire slide. It also employs an efficient slide-level encoder with local spatial attention, enabling whole-slide processing without excessive memory overhead. On the recently curated HEST-1k and STImage-1K4M benchmarks, STFlow substantially outperforms state-of-the-art baselines and achieves over 18% relative improvements over the pathology foundation models.
- Abstract(参考訳): 空間転写学 (Spatial transcriptomics, ST) は、遺伝子発現プロファイリングによる組織像のブリッジ化のための強力な技術として登場した。
しかし、その応用は低スループットと特殊な実験施設の必要性によって制限されてきた。
以前の研究では、この過程を加速するために、全スライディングのヒストロジー画像からSTを予測しようとしたが、2つの大きな限界に悩まされた。
まず、スライディングSTデータの結合分布を分解し、各スポットの遺伝子発現を独立して予測するため、細胞間相互作用を明示的にモデル化しない。
第二に、エンコーダは典型的なSTデータセットの多くのスポット(しばしば10,000を超える)のためにメモリ制約に悩まされる。
本稿では,スライド全体の遺伝子発現の結合分布をモデル化し,細胞間相互作用を考慮したフローマッチング生成モデルSTFlowを提案する。
また、局所的な空間的注意を伴う効率的なスライドレベルエンコーダを採用し、メモリオーバーヘッドを過大に発生させることなく全スライディング処理を可能にする。
最近行われたHEST-1kとSTImage-1K4Mベンチマークでは、STFlowは最先端のベースラインを大幅に上回り、病理基盤モデルよりも18%以上改善されている。
関連論文リスト
- Parallel Sequence Modeling via Generalized Spatial Propagation Network [80.66202109995726]
Generalized Spatial Propagation Network (GSPN)は、2次元空間構造を本質的にキャプチャする最適化された視覚タスクのための新しいアテンションメカニズムである。
GSPNは、空間的コヒーレントな画像データを直接操作し、ラインスキャンアプローチを通じて高密度なペアワイズ接続を形成することにより、制限を克服する。
GSPNは、ImageNet分類、クラス誘導画像生成、テキスト・ツー・イメージ生成などの視覚タスクにおいて、より優れた空間忠実性と最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-01-21T18:56:19Z) - SUICA: Learning Super-high Dimensional Sparse Implicit Neural Representations for Spatial Transcriptomics [23.396154129613528]
空間トランスクリプトミクス(Spatial Transcriptomics、ST)は、空間座標に整列した遺伝子発現プロファイルをキャプチャする手法である。
本稿では,提案ツールSUICAを用いて,STを連続的かつコンパクトにモデル化する。
グラフ拡張オートエンコーダを組み込んで,非構造化スポットのコンテキスト情報を効果的にモデル化する。
論文 参考訳(メタデータ) (2024-12-02T05:02:18Z) - ST-Align: A Multimodal Foundation Model for Image-Gene Alignment in Spatial Transcriptomics [6.680197957317297]
空間転写学 (Spatial transcriptomics, ST) は, 高解像度の病理像と全スライディングスケールの個々の部位における全スライディング表現プロファイルを提供する。
ST-Alignは、空間コンテキストを組み込んだ画像生成ペアを深く整合させる、ST用に設計された最初の基礎モデルである。
ST-AlignはSTコンテキストに合わせた特殊なエンコーダを採用しており、さらにマルチモーダル核融合のためのアテンションベース核融合ネットワーク(ABFN)を採用している。
論文 参考訳(メタデータ) (2024-11-25T09:15:07Z) - Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models [56.00251589760559]
大型言語モデル(LLM)はゼロショット設定でグラデーション先行として振る舞うことができる。
本稿では,LSMと算術符号を統合する新しい手法であるLM-GCを紹介する。
実験により、LM-GCは既存の最先端のロスレス圧縮手法を超越していることが示された。
論文 参考訳(メタデータ) (2024-09-26T13:38:33Z) - M2ORT: Many-To-One Regression Transformer for Spatial Transcriptomics
Prediction from Histopathology Images [17.158450092707042]
M2ORTは病理像の階層構造に対応する多対一回帰変換器である。
我々は3つのパブリックSTデータセット上でM2ORTを試験し、実験結果から、M2ORTが最先端の性能を達成できることが示されている。
論文 参考訳(メタデータ) (2024-01-19T10:37:27Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z) - Hierarchical Transformer for Survival Prediction Using Multimodality
Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。
本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。
より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文 参考訳(メタデータ) (2022-11-29T23:47:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。