論文の概要: Efficient Fine-Tuning of Single-Cell Foundation Models Enables Zero-Shot Molecular Perturbation Prediction
- arxiv url: http://arxiv.org/abs/2412.13478v1
- Date: Wed, 18 Dec 2024 03:42:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-19 16:47:39.572440
- Title: Efficient Fine-Tuning of Single-Cell Foundation Models Enables Zero-Shot Molecular Perturbation Prediction
- Title(参考訳): ゼロショット分子摂動予測が可能な単セルファンデーションモデルの効率的な微調整
- Authors: Sepideh Maleki, Jan-Christian Huetter, Kangway V. Chuang, Gabriele Scalia, Tommaso Biancalani,
- Abstract要約: 本研究では,数千万の単細胞上で事前学習した単一細胞基盤モデル(FM)を利用する。
本稿では,基礎モデルの1%未満のトレーニングにより,効率的な微調整を可能にする薬物調和アダプタを提案する。
- 参考スコア(独自算出の注目度): 0.6501158610800594
- License:
- Abstract: Predicting transcriptional responses to novel drugs provides a unique opportunity to accelerate biomedical research and advance drug discovery efforts. However, the inherent complexity and high dimensionality of cellular responses, combined with the extremely limited available experimental data, makes the task challenging. In this study, we leverage single-cell foundation models (FMs) pre-trained on tens of millions of single cells, encompassing multiple cell types, states, and disease annotations, to address molecular perturbation prediction. We introduce a drug-conditional adapter that allows efficient fine-tuning by training less than 1% of the original foundation model, thus enabling molecular conditioning while preserving the rich biological representation learned during pre-training. The proposed strategy allows not only the prediction of cellular responses to novel drugs, but also the zero-shot generalization to unseen cell lines. We establish a robust evaluation framework to assess model performance across different generalization tasks, demonstrating state-of-the-art results across all settings, with significant improvements in the few-shot and zero-shot generalization to new cell lines compared to existing baselines.
- Abstract(参考訳): 新規薬物に対する転写反応の予測は、生体医学の研究を加速し、薬物発見を前進させるユニークな機会となる。
しかし、セル応答の本質的な複雑さと高次元性は、非常に限られた実験データと相まって、この課題を困難にしている。
本研究では, 分子摂動予測に対処するために, 複数の細胞タイプ, 状態, 疾患アノテーションを含む, 数千万の単一細胞上で事前訓練された単一細胞基盤モデル(FM)を利用する。
基礎モデルの1%未満のトレーニングで効率的な微調整が可能となり, 事前学習中に学習した豊かな生物学的表現を保ちながら, 分子コンディショニングが可能となった。
提案した戦略は、新規薬物に対する細胞応答の予測だけでなく、目に見えない細胞株へのゼロショットの一般化を可能にする。
我々は,様々な一般化タスクにおけるモデル性能を評価するためのロバストな評価フレームワークを構築し,すべての設定における最新結果を示すとともに,既存のベースラインと比較して,新規のセルラインに対する数ショットおよびゼロショットの一般化を大幅に改善する。
関連論文リスト
- Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.02070962797794]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。
本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - Predicting Single-cell Drug Sensitivity by Adaptive Weighted Feature for
Adversarial Multi-source Domain Adaptation [9.043161950476055]
scAdaDrugはシングルセル薬物感受性を予測するマルチソース適応重み付けモデルである。
本モデルでは, 肝細胞, 細胞株, 患者データセットに対する薬剤感受性の予測において, 最先端の性能を達成した。
論文 参考訳(メタデータ) (2024-03-08T12:31:03Z) - Regression-Based Analysis of Multimodal Single-Cell Data Integration
Strategies [0.0]
マルチモーダルシングルセル技術は、個々のセルから多様なデータ型の同時収集を可能にする。
この研究は、Echo State Networksの異常なパフォーマンスを強調し、顕著な相関スコアが0.94である。
これらの発見は、機械学習の可能性を生かして、細胞の分化と機能に関する理解を深めることを約束している。
論文 参考訳(メタデータ) (2023-11-21T16:31:27Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Embracing assay heterogeneity with neural processes for markedly
improved bioactivity predictions [0.276240219662896]
リガンドの生物活性を予測することは、コンピュータ支援薬物発見において最も困難かつ最も重要な課題の1つである。
長年のデータ収集とキュレーションの努力にもかかわらず、生物活性データは希少で不均一である。
異種アッセイ間の情報シナジーを利用した階層型メタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-17T16:26:58Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Predicting single-cell perturbation responses for unseen drugs [3.4591290171087747]
新規なエンコーダデコーダアーキテクチャを導入し, 未知薬物の摂動効果について検討する。
提案手法は, シリカ内仮説を生成する能力により, より効率的な実験設計を容易にすることを期待する。
論文 参考訳(メタデータ) (2022-04-28T14:53:54Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。