論文の概要: Teaching pathology foundation models to accurately predict gene expression with parameter efficient knowledge transfer
- arxiv url: http://arxiv.org/abs/2504.07061v1
- Date: Wed, 09 Apr 2025 17:24:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-10 13:06:02.634568
- Title: Teaching pathology foundation models to accurately predict gene expression with parameter efficient knowledge transfer
- Title(参考訳): パラメータ効率の良い知識伝達による遺伝子発現の正確な予測のための病理基礎モデル
- Authors: Shi Pan, Jianan Chen, Maria Secrier,
- Abstract要約: PEKA(Efficient Knowledge Adaptation)は、クロスモーダルな知識伝達のための知識蒸留と構造アライメント損失を統合する新しいフレームワークである。
複数の空間転写学データセットを用いた遺伝子発現予測のためのPEKAの評価を行った。
- 参考スコア(独自算出の注目度): 1.5416321520529301
- License:
- Abstract: Gene expression profiling provides critical insights into cellular heterogeneity, biological processes and disease mechanisms. There has been an increasing interest in computational approaches that can predict gene expression directly from digitalized histopathology images. While image foundation models have shown promise in a variety of pathology downstream analysis, their performances on gene-expression prediction are still limited. Explicitly incorporating information from the transcriptomic models can help image models to address domain shift, yet the fine-tuning and alignment of foundation models can be expensive. In the work, we propose Parameter Efficient Knowledge trAnsfer (PEKA), a novel framework that leverages Block-Affine Adaptation and integrates knowledge distillation and structure alignment losses for cross-modal knowledge transfer. We evaluated PEKA for gene expression prediction using multiple spatial transcriptomics datasets (comprising 206,123 image tiles with matched gene expression profiles) that encompassed various types of tissue. PEKA achieved at least 5\% performance improvement over baseline foundation models while also outperforming alternative parameter-efficient fine-tuning strategies. We will release the code, datasets and aligned models after peer-review to facilitate broader adoption and further development for parameter efficient model alignment.
- Abstract(参考訳): 遺伝子発現プロファイリングは、細胞不均一性、生物学的プロセス、疾患機構に関する重要な洞察を与える。
デジタル化された病理画像から直接遺伝子発現を予測できる計算手法への関心が高まっている。
画像基盤モデルは、下流の様々な病理解析において有望であるが、遺伝子発現予測におけるその性能はまだ限られている。
転写モデルからの情報を明示的に組み込むことは、画像モデルがドメインシフトに対処するのに役立つが、基礎モデルの微調整と調整は高価である。
本研究は,ブロックアフィン適応を活用し,知識蒸留と構造アライメント損失を統合したクロスモーダルな知識伝達のための新しいフレームワークであるパラメータ有効知識trAnsfer(PEKA)を提案する。
各種組織を包含する複数の空間転写学的データセット(206,123個の画像タイルと一致した遺伝子発現プロファイルを含む)を用いて,PEKAによる遺伝子発現予測の評価を行った。
PEKAはベースライン基礎モデルよりも少なくとも5倍の性能向上を達成し、代替パラメータ効率の微調整戦略よりも優れていた。
我々は、より広く採用し、パラメータ効率の良いモデルアライメントのためのさらなる開発を促進するために、ピアレビューの後、コード、データセット、アライメントされたモデルをリリースします。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Prior Knowledge Injection into Deep Learning Models Predicting Gene Expression from Whole Slide Images [6.726990710194119]
我々は、ディープラーニングアーキテクチャに遺伝子間相互作用に関する事前知識を注入できるモデルに依存しないフレームワークを導入する。
当社の戦略は18の実験すべてにおいて、平均で983個の重要な遺伝子が増加し、14個の独立したデータセットが増加するまで一般化される。
論文 参考訳(メタデータ) (2025-01-23T19:43:05Z) - MERGE: Multi-faceted Hierarchical Graph-based GNN for Gene Expression Prediction from Whole Slide Histopathology Images [6.717786190771243]
MERGE(Multifaceted hiErarchical gRaph for Gene Expressions)を導入し、階層グラフ構築戦略とグラフニューラルネットワーク(GNN)を組み合わせて、スライド画像全体の遺伝子発現予測を改善する。
組織像パッチを空間的特徴と形態的特徴の両方に基づいてクラスタリングすることにより,GNN学習における遠隔組織間の相互作用を促進する。
さらに,STデータ中のアーティファクトを緩和するために必要な異なるデータ平滑化技術の評価を行った。
論文 参考訳(メタデータ) (2024-12-03T17:32:05Z) - Integrating Large Language Models for Genetic Variant Classification [12.244115429231888]
大型言語モデル (LLM) は遺伝学においてトランスフォーメーションツールとして登場した。
本研究では,GPN-MSA,ESM1b,AlphaMissenseを含む最先端LLMの統合について検討した。
提案手法は,よく注釈付けされたProteinGymとClinVarのデータセットを用いて,これらの統合モデルを評価する。
論文 参考訳(メタデータ) (2024-11-07T13:45:56Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - Incorporating Prior Knowledge in Deep Learning Models via Pathway
Activity Autoencoders [5.950889585409067]
本稿では,癌におけるRNA-seqデータのための,事前知識に基づく新しいディープオートエンコーディングフレームワークPAAEを提案する。
機能セットが小さいにもかかわらず,PAAEモデルとPAAEモデルでは,一般的な手法と比較して,アウト・オブ・セットの再現性が向上していることを示す。
論文 参考訳(メタデータ) (2023-06-09T11:12:55Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - All You Need is Color: Image based Spatial Gene Expression Prediction
using Neural Stain Learning [11.9045433112067]
本研究では,空間的転写学的遺伝子発現プロファイルの予測のための機械学習手法を提案する。
提案手法から得られた遺伝子発現予測は,シークエンシングにより得られた真の表現値と高い相関関係を示した。
論文 参考訳(メタデータ) (2021-08-23T23:43:38Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。