論文の概要: Spatial Coordinates as a Cell Language: A Multi-Sentence Framework for Imaging Mass Cytometry Analysis
- arxiv url: http://arxiv.org/abs/2506.01918v1
- Date: Mon, 02 Jun 2025 17:38:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.674253
- Title: Spatial Coordinates as a Cell Language: A Multi-Sentence Framework for Imaging Mass Cytometry Analysis
- Title(参考訳): 細胞言語としての空間座標:マスサイトメトリー解析のための多文フレームワーク
- Authors: Chi-Jane Chen, Yuhang Chen, Sukwon Yun, Natalie Stanley, Tianlong Chen,
- Abstract要約: 画像質量(IMC)は、質量の分析力と細胞表現型の空間分布を組み合わせることで、高次元空間プロファイリングを可能にする。
近年の研究では、大きな言語モデル(LLM)を利用して、遺伝子またはタンパク質の発現を生物学的文脈に翻訳することで、細胞状態を抽出している。
マルチ文アプローチを用いて,単一セル表現と空間情報を自然言語に統合する新しいフレームワークであるSpatial2Sentenceを提案する。
- 参考スコア(独自算出の注目度): 34.60663420263495
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image mass cytometry (IMC) enables high-dimensional spatial profiling by combining mass cytometry's analytical power with spatial distributions of cell phenotypes. Recent studies leverage large language models (LLMs) to extract cell states by translating gene or protein expression into biological context. However, existing single-cell LLMs face two major challenges: (1) Integration of spatial information: they struggle to generalize spatial coordinates and effectively encode spatial context as text, and (2) Treating each cell independently: they overlook cell-cell interactions, limiting their ability to capture biological relationships. To address these limitations, we propose Spatial2Sentence, a novel framework that integrates single-cell expression and spatial information into natural language using a multi-sentence approach. Spatial2Sentence constructs expression similarity and distance matrices, pairing spatially adjacent and expressionally similar cells as positive pairs while using distant and dissimilar cells as negatives. These multi-sentence representations enable LLMs to learn cellular interactions in both expression and spatial contexts. Equipped with multi-task learning, Spatial2Sentence outperforms existing single-cell LLMs on preprocessed IMC datasets, improving cell-type classification by 5.98% and clinical status prediction by 4.18% on the diabetes dataset while enhancing interpretability. The source code can be found here: https://github.com/UNITES-Lab/Spatial2Sentence.
- Abstract(参考訳): 画像マスサイトメトリー(IMC)は、質量サイトメトリーの分析力と細胞表現型の空間分布を組み合わせることで、高次元空間プロファイリングを可能にする。
近年の研究では、大きな言語モデル(LLM)を利用して、遺伝子またはタンパク質の発現を生物学的文脈に翻訳することで、細胞状態を抽出している。
しかし,既存の単一細胞LSMは,(1)空間情報の統合:空間座標を一般化し,空間コンテキストをテキストとして効果的にエンコードすること,(2)個々のセルを独立して扱うこと:細胞間相互作用を見落とし,生物学的関係を捉える能力を制限すること,の2つの大きな課題に直面している。
このような制約に対処するために,多文アプローチを用いて単一セル表現と空間情報を自然言語に統合する新しいフレームワークであるSpatial2Sentenceを提案する。
Space2Sentenceは、表現類似性と距離行列を構築し、空間隣接細胞と表現類似細胞を正の対として、遠隔細胞と異種細胞を負の対として使用する。
これらの多文表現は、LLMが表現と空間の文脈の両方で細胞間相互作用を学習することを可能にする。
マルチタスク学習を備えたSpatial2Sentenceは、前処理したIMCデータセット上で既存の単一細胞LPMよりも優れており、細胞型分類は5.98%改善し、糖尿病データセットでは4.18%改善し、解釈可能性を高めている。
ソースコードは、https://github.com/UNITES-Lab/Spatial2Sentence.com/Spatial2Sentence.comで公開されている。
関連論文リスト
- CellVerse: Do Large Language Models Really Understand Cell Biology? [74.34984441715517]
我々は,4種類のシングルセルマルチオミクスデータを統合する統一言語中心の質問応答ベンチマークであるCellVerseを紹介する。
我々は,CellVerse上で160Mから671Bまでの14のオープンソースおよびクローズドソースLLMの性能を体系的に評価した。
論文 参考訳(メタデータ) (2025-05-09T06:47:23Z) - scReader: Prompting Large Language Models to Interpret scRNA-seq Data [12.767105992391555]
本稿では,大規模言語モデルの一般的な知識機能と,単一セルオミクスデータ解釈のためのドメイン固有表現モデルを統合する,革新的なハイブリッドアプローチを提案する。
単細胞遺伝子レベルでの遺伝子発現データをプロンプトで入力することにより、様々な種および細胞タイプにわたる遺伝子発現の差分レベルに基づいて、細胞表現を効果的にモデル化する。
論文 参考訳(メタデータ) (2024-12-24T04:28:42Z) - Interpretable Embeddings for Segmentation-Free Single-Cell Analysis in Multiplex Imaging [1.8687965482996822]
多重イメージング(MI)は、複数の生物学的マーカーを、細胞内解像度で別々のイメージングチャネルで同時に可視化することを可能にする。
本稿では,グループ化畳み込みを利用して各画像チャンネルから解釈可能な埋め込み特徴を学習するセグメンテーションフリーなディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2024-11-02T11:21:33Z) - Mixed Models with Multiple Instance Learning [51.440557223100164]
一般化線形混合モデル(GLMM)とMultiple Instance Learning(MIL)を統合するフレームワークであるMixMILを紹介する。
実験結果から,MixMILは単一セルデータセットにおいて既存のMILモデルより優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-04T16:42:42Z) - Geodesic Sinkhorn for Fast and Accurate Optimal Transport on Manifolds [53.110934987571355]
多様体グラフ上の熱核に基づく測地学的シンクホーンを提案する。
化学療法中の患者試料からの高次元単細胞データの複数分布のバリセンタの計算に本法を適用した。
論文 参考訳(メタデータ) (2022-11-02T00:51:35Z) - Contrastive Cycle Adversarial Autoencoders for Single-cell Multi-omics
Alignment and Integration [0.0]
本稿では,単一セルRNA-seqデータと単一セルATAC-seqデータとの整合と統合のための新しいフレームワークを提案する。
他の最先端手法と比較して,本手法はシミュレーションデータと実シングルセルデータの両方において優れた性能を発揮する。
論文 参考訳(メタデータ) (2021-12-05T13:00:58Z) - Split and Expand: An inference-time improvement for Weakly Supervised
Cell Instance Segmentation [71.50526869670716]
本研究では,分割マップのインスタンスへの変換を改善するために,2段階の後処理手順であるSplitとExpandを提案する。
Splitのステップでは,セルの集合をセグメント化マップから個々のセルインスタンスに分割し,セル中心の予測を導出する。
拡張ステップでは、細胞中心予測を用いて、小さな細胞が欠落していることが分かる。
論文 参考訳(メタデータ) (2020-07-21T14:05:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。