論文の概要: Spatial Transcriptomics Analysis of Zero-shot Gene Expression Prediction
- arxiv url: http://arxiv.org/abs/2401.14772v1
- Date: Fri, 26 Jan 2024 10:53:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-29 15:28:10.745810
- Title: Spatial Transcriptomics Analysis of Zero-shot Gene Expression Prediction
- Title(参考訳): ゼロショット遺伝子発現予測の空間転写学的解析
- Authors: Yan Yang and Md Zakir Hossain and Xuesong Li and Shafin Rahman and
Eric Stone
- Abstract要約: スライド画像ウィンドウから遺伝子発現を予測するゼロショットフレームワークを提案する。
遺伝子型は機能や表現型によって記述できるので、動的にベクターに遺伝子型を埋め込む。
このベクトルを用いてスライド画像ウィンドウを投影し、特徴空間における遺伝子発現を投影し、未知の遺伝子型に対するゼロショット表現予測を解き放つ。
- 参考スコア(独自算出の注目度): 7.8979634764500455
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spatial transcriptomics (ST) captures gene expression within distinct regions
(i.e., windows) of a tissue slide. Traditional supervised learning frameworks
applied to model ST are constrained to predicting expression from slide image
windows for gene types seen during training, failing to generalize to unseen
gene types. To overcome this limitation, we propose a semantic guided network
(SGN), a pioneering zero-shot framework for predicting gene expression from
slide image windows. Considering a gene type can be described by functionality
and phenotype, we dynamically embed a gene type to a vector per its
functionality and phenotype, and employ this vector to project slide image
windows to gene expression in feature space, unleashing zero-shot expression
prediction for unseen gene types. The gene type functionality and phenotype are
queried with a carefully designed prompt from a pre-trained large language
model (LLM). On standard benchmark datasets, we demonstrate competitive
zero-shot performance compared to past state-of-the-art supervised learning
approaches.
- Abstract(参考訳): 空間転写学(st)は、組織スライドの異なる領域(すなわち窓)における遺伝子発現をキャプチャする。
モデルSTに適用された従来の教師付き学習フレームワークは、トレーニング中に見られる遺伝子型に対するスライド画像ウィンドウからの表現を予測するために制約され、見知らぬ遺伝子型への一般化に失敗する。
この制限を克服するため、スライド画像ウィンドウから遺伝子発現を予測するためのゼロショットフレームワークであるセマンティックガイドネットワーク(SGN)を提案する。
遺伝子型を機能と表現型で記述できることを考慮し、その機能と表現型に応じてベクターに遺伝子型を動的に埋め込み、このベクターを用いてスライド画像ウィンドウを機能空間における遺伝子発現に投影し、未発見の遺伝子型に対するゼロショット発現予測を解き放つ。
遺伝子型機能と表現型は、事前訓練された大型言語モデル(LLM)から慎重に設計されたプロンプトでクエリされる。
標準ベンチマークデータセットでは,従来の最先端教師あり学習手法と比較して,ゼロショット性能の競争力を示す。
関連論文リスト
- On The Nature Of The Phenotype In Tree Genetic Programming [3.8642945120580703]
ツリーベースGP(TGP)における遺伝子型と表現型の基本概念について論じる。
次に、5つのベンチマークデータセットを使ってその振る舞いを分析する。
表現型を生成するために,GP木から意味的に非効率なコードを取り除くユニークな手法を提案する。
論文 参考訳(メタデータ) (2024-02-12T19:19:29Z) - Generative Type Inference for Python [62.01560866916557]
本稿では静的解析から静的ドメイン知識を取り入れた数ショットの生成型推論手法であるTypeGenを紹介する。
TypeGenは、静的解析の型推論ステップを、型依存グラフ(TDG)に基づいたプロンプトに変換することで、COTプロンプトを生成する。
実験の結果、TypeGenは引数型予測では10.0%、Top-1 Exact Matchでは22.5%で最高のベースラインであるType4Pyを上回っている。
論文 参考訳(メタデータ) (2023-07-18T11:40:31Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - GENIE: Large Scale Pre-training for Text Generation with Diffusion Model [86.2022500090247]
GENIEは、Transformerと拡散を組み合わせたシーケンス・ツー・シーケンスのテキスト生成モデルである。
本研究では,拡散モデルの特徴を基礎として,連続段落認知という新しい事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-12-22T13:17:11Z) - Exemplar Guided Deep Neural Network for Spatial Transcriptomics Analysis
of Gene Expression Prediction [9.192169460752805]
本稿では,組織スライド画像の各ウィンドウから直接,遺伝子発現を高精度かつ効率的に予測するExemplar Guided Network(EGN)を提案する。
我々のEGNフレームワークは,(1)教師なし検索のための表現空間を構成する抽出器,(2)入力ウィンドウの表現を段階的に抽出する視覚変換器(ViT)バックボーン,(3)中間の例を用いて中間のViT表現を適応的に修正するExemplar Bridging(EB)ブロックの3つの主要コンポーネントで構成されている。
論文 参考訳(メタデータ) (2022-10-30T02:22:20Z) - A single-cell gene expression language model [2.9112649816695213]
遺伝子間のコンテキスト依存を学習する機械学習システムを提案する。
我々のモデルであるExceiverは、自己教師型タスクを用いて、多様な細胞タイプで訓練されている。
生物学的アノテーションに関して,潜在サンプル表現の類似性プロファイルと学習された遺伝子埋め込みとの間に一致が認められた。
論文 参考訳(メタデータ) (2022-10-25T20:52:19Z) - Generative Visual Prompt: Unifying Distributional Control of Pre-Trained
Generative Models [77.47505141269035]
Generative Visual Prompt (PromptGen) は、事前訓練された生成モデルの分散制御のためのフレームワークである。
PromptGenはエネルギーベースモデル(EBM)を近似し、フィードフォワード方式で画像をサンプリングする。
コードはhttps://github.com/ChenWu98/Generative-Visual-Prompt.comで入手できる。
論文 参考訳(メタデータ) (2022-09-14T22:55:18Z) - Neural network facilitated ab initio derivation of linear formula: A
case study on formulating the relationship between DNA motifs and gene
expression [8.794181445664243]
本稿では、解釈可能なニューラルネットワークモデルに基づく新しいアプローチを用いて、シーケンスモチーフと線形式を導出するためのフレームワークを提案する。
この線形モデルは、深いニューラルネットワークモデルに匹敵する性能を持つプロモーター配列を用いて遺伝子発現レベルを予測することができることを示した。
論文 参考訳(メタデータ) (2022-08-19T22:29:30Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - All You Need is Color: Image based Spatial Gene Expression Prediction
using Neural Stain Learning [11.9045433112067]
本研究では,空間的転写学的遺伝子発現プロファイルの予測のための機械学習手法を提案する。
提案手法から得られた遺伝子発現予測は,シークエンシングにより得られた真の表現値と高い相関関係を示した。
論文 参考訳(メタデータ) (2021-08-23T23:43:38Z) - Complexity-based speciation and genotype representation for
neuroevolution [81.21462458089142]
本稿では、進化するネットワークを隠されたニューロンの数に基づいて種に分類する神経進化の種分化原理を提案する。
提案された種分化原理は、種および生態系全体における多様性の促進と保存を目的として設計されたいくつかの技術で採用されている。
論文 参考訳(メタデータ) (2020-10-11T06:26:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。