論文の概要: Spatial Transcriptomics Analysis of Zero-shot Gene Expression Prediction
- arxiv url: http://arxiv.org/abs/2401.14772v1
- Date: Fri, 26 Jan 2024 10:53:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-29 15:28:10.745810
- Title: Spatial Transcriptomics Analysis of Zero-shot Gene Expression Prediction
- Title(参考訳): ゼロショット遺伝子発現予測の空間転写学的解析
- Authors: Yan Yang and Md Zakir Hossain and Xuesong Li and Shafin Rahman and
Eric Stone
- Abstract要約: スライド画像ウィンドウから遺伝子発現を予測するゼロショットフレームワークを提案する。
遺伝子型は機能や表現型によって記述できるので、動的にベクターに遺伝子型を埋め込む。
このベクトルを用いてスライド画像ウィンドウを投影し、特徴空間における遺伝子発現を投影し、未知の遺伝子型に対するゼロショット表現予測を解き放つ。
- 参考スコア(独自算出の注目度): 7.8979634764500455
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spatial transcriptomics (ST) captures gene expression within distinct regions
(i.e., windows) of a tissue slide. Traditional supervised learning frameworks
applied to model ST are constrained to predicting expression from slide image
windows for gene types seen during training, failing to generalize to unseen
gene types. To overcome this limitation, we propose a semantic guided network
(SGN), a pioneering zero-shot framework for predicting gene expression from
slide image windows. Considering a gene type can be described by functionality
and phenotype, we dynamically embed a gene type to a vector per its
functionality and phenotype, and employ this vector to project slide image
windows to gene expression in feature space, unleashing zero-shot expression
prediction for unseen gene types. The gene type functionality and phenotype are
queried with a carefully designed prompt from a pre-trained large language
model (LLM). On standard benchmark datasets, we demonstrate competitive
zero-shot performance compared to past state-of-the-art supervised learning
approaches.
- Abstract(参考訳): 空間転写学(st)は、組織スライドの異なる領域(すなわち窓)における遺伝子発現をキャプチャする。
モデルSTに適用された従来の教師付き学習フレームワークは、トレーニング中に見られる遺伝子型に対するスライド画像ウィンドウからの表現を予測するために制約され、見知らぬ遺伝子型への一般化に失敗する。
この制限を克服するため、スライド画像ウィンドウから遺伝子発現を予測するためのゼロショットフレームワークであるセマンティックガイドネットワーク(SGN)を提案する。
遺伝子型を機能と表現型で記述できることを考慮し、その機能と表現型に応じてベクターに遺伝子型を動的に埋め込み、このベクターを用いてスライド画像ウィンドウを機能空間における遺伝子発現に投影し、未発見の遺伝子型に対するゼロショット発現予測を解き放つ。
遺伝子型機能と表現型は、事前訓練された大型言語モデル(LLM)から慎重に設計されたプロンプトでクエリされる。
標準ベンチマークデータセットでは,従来の最先端教師あり学習手法と比較して,ゼロショット性能の競争力を示す。
関連論文リスト
- Long-range gene expression prediction with token alignment of large language model [37.10820914895689]
本稿では,遺伝子配列の特徴を自然言語トークンと整合させる遺伝子配列Token Alignment(GTA)を提案する。
GTAは規制文法を学習し、遺伝子特異的な人間のアノテーションをプロンプトとして組み込むことができる。
GTAは、事前訓練された言語モデルを利用して、遺伝子発現予測に対する強力で斬新なクロスモーダルなアプローチを示す。
論文 参考訳(メタデータ) (2024-10-02T02:42:29Z) - Gene-Level Representation Learning via Interventional Style Transfer in Optical Pooled Screening [3.7038542578642715]
光プールスクリーニング(OPS)を用いて得られた遺伝的摂動細胞の画像から、遺伝子レベルの特徴表現を学習するためのスタイル変換アプローチを採用する。
本手法は,遺伝子機能に応じた遺伝子表現のクラスタリングにおける工学的特徴よりも優れ,潜伏する生物学的関係を明らかにするために有用であることを示す。
論文 参考訳(メタデータ) (2024-06-11T22:56:50Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Generative Type Inference for Python [62.01560866916557]
本稿では静的解析から静的ドメイン知識を取り入れた数ショットの生成型推論手法であるTypeGenを紹介する。
TypeGenは、静的解析の型推論ステップを、型依存グラフ(TDG)に基づいたプロンプトに変換することで、COTプロンプトを生成する。
実験の結果、TypeGenは引数型予測では10.0%、Top-1 Exact Matchでは22.5%で最高のベースラインであるType4Pyを上回っている。
論文 参考訳(メタデータ) (2023-07-18T11:40:31Z) - GENIE: Large Scale Pre-training for Text Generation with Diffusion Model [86.2022500090247]
GENIEは、Transformerと拡散を組み合わせたシーケンス・ツー・シーケンスのテキスト生成モデルである。
本研究では,拡散モデルの特徴を基礎として,連続段落認知という新しい事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-12-22T13:17:11Z) - Exemplar Guided Deep Neural Network for Spatial Transcriptomics Analysis
of Gene Expression Prediction [9.192169460752805]
本稿では,組織スライド画像の各ウィンドウから直接,遺伝子発現を高精度かつ効率的に予測するExemplar Guided Network(EGN)を提案する。
我々のEGNフレームワークは,(1)教師なし検索のための表現空間を構成する抽出器,(2)入力ウィンドウの表現を段階的に抽出する視覚変換器(ViT)バックボーン,(3)中間の例を用いて中間のViT表現を適応的に修正するExemplar Bridging(EB)ブロックの3つの主要コンポーネントで構成されている。
論文 参考訳(メタデータ) (2022-10-30T02:22:20Z) - Generative Visual Prompt: Unifying Distributional Control of Pre-Trained
Generative Models [77.47505141269035]
Generative Visual Prompt (PromptGen) は、事前訓練された生成モデルの分散制御のためのフレームワークである。
PromptGenはエネルギーベースモデル(EBM)を近似し、フィードフォワード方式で画像をサンプリングする。
コードはhttps://github.com/ChenWu98/Generative-Visual-Prompt.comで入手できる。
論文 参考訳(メタデータ) (2022-09-14T22:55:18Z) - Neural network facilitated ab initio derivation of linear formula: A
case study on formulating the relationship between DNA motifs and gene
expression [8.794181445664243]
本稿では、解釈可能なニューラルネットワークモデルに基づく新しいアプローチを用いて、シーケンスモチーフと線形式を導出するためのフレームワークを提案する。
この線形モデルは、深いニューラルネットワークモデルに匹敵する性能を持つプロモーター配列を用いて遺伝子発現レベルを予測することができることを示した。
論文 参考訳(メタデータ) (2022-08-19T22:29:30Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - All You Need is Color: Image based Spatial Gene Expression Prediction
using Neural Stain Learning [11.9045433112067]
本研究では,空間的転写学的遺伝子発現プロファイルの予測のための機械学習手法を提案する。
提案手法から得られた遺伝子発現予測は,シークエンシングにより得られた真の表現値と高い相関関係を示した。
論文 参考訳(メタデータ) (2021-08-23T23:43:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。