論文の概要: scDrugMap: Benchmarking Large Foundation Models for Drug Response Prediction
- arxiv url: http://arxiv.org/abs/2505.05612v1
- Date: Thu, 08 May 2025 19:46:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-12 20:40:10.065147
- Title: scDrugMap: Benchmarking Large Foundation Models for Drug Response Prediction
- Title(参考訳): scDrugMap: 薬物反応予測のための大規模基盤モデルのベンチマーク
- Authors: Qing Wang, Yining Pan, Minghao Zhou, Zijia Tang, Yanfei Wang, Guangyu Wang, Qianqian Song,
- Abstract要約: scDrugMapはPythonのコマンドラインインターフェースと薬物反応予測のためのWebサーバを備えた統合フレームワークである。
scDrugMapは8つの単一セルモデルと2つの大きな言語モデルを含む、幅広い基礎モデルを評価する。
scDrugMapは、単一セルデータの薬物反応予測のための基礎モデルの大規模なベンチマークとして、初めてのものである。
- 参考スコア(独自算出の注目度): 5.058966163642362
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Drug resistance presents a major challenge in cancer therapy. Single cell profiling offers insights into cellular heterogeneity, yet the application of large-scale foundation models for predicting drug response in single cell data remains underexplored. To address this, we developed scDrugMap, an integrated framework featuring both a Python command-line interface and a web server for drug response prediction. scDrugMap evaluates a wide range of foundation models, including eight single-cell models and two large language models, using a curated dataset of over 326,000 cells in the primary collection and 18,800 cells in the validation set, spanning 36 datasets and diverse tissue and cancer types. We benchmarked model performance under pooled-data and cross-data evaluation settings, employing both layer freezing and Low-Rank Adaptation (LoRA) fine-tuning strategies. In the pooled-data scenario, scFoundation achieved the best performance, with mean F1 scores of 0.971 (layer freezing) and 0.947 (fine-tuning), outperforming the lowest-performing model by over 50%. In the cross-data setting, UCE excelled post fine-tuning (mean F1: 0.774), while scGPT led in zero-shot learning (mean F1: 0.858). Overall, scDrugMap provides the first large-scale benchmark of foundation models for drug response prediction in single-cell data and serves as a user-friendly, flexible platform for advancing drug discovery and translational research.
- Abstract(参考訳): 薬物耐性はがん治療において大きな課題となる。
単細胞プロファイリングは、細胞不均一性に関する洞察を提供するが、単一細胞データにおける薬物応答を予測するための大規模な基礎モデルの適用は、未解明のままである。
そこで我々は,Pythonのコマンドラインインターフェースと薬物応答予測のためのWebサーバを備えた統合フレームワークである scDrugMap を開発した。
scDrugMapは8つの単一セルモデルと2つの大きな言語モデルを含む幅広い基礎モデルを評価し、プライマリコレクションに326,000以上のセルのキュレートされたデータセット、バリデーションセットに18,800のセルを使用し、36のデータセットと多様な組織とがんタイプにまたがる。
我々は、層凍結とローランド適応(LoRA)ファインチューニング戦略を用いて、プールデータとクロスデータ評価設定下でモデル性能をベンチマークした。
プールデータのシナリオでは、ScFoundationは、平均F1スコアが0.971(層凍結)と0.947(微調整)で最高のパフォーマンスを達成し、最低性能のモデルを50%以上上回った。
クロスデータ環境では、UCEは後細調整(平均F1: 0.774)に優れ、ScGPTはゼロショット学習(平均F1: 0.858)を導いた。
scDrugMapは、シングルセルデータにおける薬物反応予測のための基礎モデルの大規模なベンチマークを初めて提供し、薬物発見と翻訳研究を進めるための、ユーザフレンドリで柔軟なプラットフォームとして機能する。
関連論文リスト
- DataDecide: How to Predict Best Pretraining Data with Small Experiments [67.95896457895404]
私たちはDataDecideのモデル、データ、評価を公開しています。
最大100Bトークン,最大1Bパラメータのモデルサイズ,および3つのランダムシードを用いて,25コーパスにわたる事前学習実験を行った。
論文 参考訳(メタデータ) (2025-04-15T17:02:15Z) - A multimodal ensemble approach for clear cell renal cell carcinoma treatment outcome prediction [6.199310532720352]
臨床データ,マルチオミクスデータ,および病理組織学的全スライド画像(WSI)データを統合するマルチモーダルアンサンブルモデル(MMEM)を開発した。
MMEMはccRCC患者の全身生存率(OS)と無病生存率(DFS)を予測した。
論文 参考訳(メタデータ) (2024-12-10T02:51:14Z) - CRTRE: Causal Rule Generation with Target Trial Emulation Framework [47.2836994469923]
ターゲットトライアルエミュレーションフレームワーク(CRTRE)を用いた因果ルール生成という新しい手法を提案する。
CRTREは、アソシエーションルールの因果効果を推定するためにランダム化トライアル設計原則を適用している。
次に、病気発症予測などの下流アプリケーションにそのような関連ルールを組み込む。
論文 参考訳(メタデータ) (2024-11-10T02:40:06Z) - Fast Polypharmacy Side Effect Prediction Using Tensor Factorisation [2.631060597686179]
テンソル因子化モデルにより,多剤副作用予測における最先端性能が達成できることを実証する。
ベストモデル (SimplE) は, 963側効果に対して0.978 AUROC, 0.971 AUPRC, 1.000 AP@50の中央値を得た。
論文 参考訳(メタデータ) (2024-04-17T13:32:05Z) - MediTab: Scaling Medical Tabular Data Predictors via Data Consolidation, Enrichment, and Refinement [44.693325083735424]
患者の健康リスク予測などの医療応用において,タブラルデータ予測が採用されている。
以前の予測子は、手動でキュレートされた小さなデータセットでトレーニングされることが多い。
論文 参考訳(メタデータ) (2023-05-20T03:37:09Z) - A Meta-Learning Approach to Predicting Performance and Data Requirements [163.4412093478316]
本稿では,モデルが目標性能に達するために必要なサンプル数を推定する手法を提案する。
モデル性能を推定するデファクト原理であるパワー法則が,小さなデータセットを使用する場合の誤差が大きいことが判明した。
本稿では,2つのデータを異なる方法で処理するPPL法について紹介する。
論文 参考訳(メタデータ) (2023-03-02T21:48:22Z) - A Meta-GNN approach to personalized seizure detection and classification [53.906130332172324]
本稿では,特定の患者に限られた発作サンプルから迅速に適応できるパーソナライズされた発作検出・分類フレームワークを提案する。
トレーニング患者の集合からグローバルモデルを学ぶメタGNNベースの分類器を訓練する。
本手法は, 未確認患者20回に限って, 精度82.7%, F1スコア82.08%を達成し, ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2022-11-01T14:12:58Z) - An Interpretable Web-based Glioblastoma Multiforme Prognosis Prediction
Tool using Random Forest Model [1.1024591739346292]
治療後1年間のGBM患者の健康状態を推定する予測モデルを提案する。
総計467名のGBM患者の臨床像を13の特徴と2つの経過日で比較検討した。
GBM患者生存の予後因子のトップ3はMGMT遺伝子プロモーター,切除範囲,年齢であった。
論文 参考訳(メタデータ) (2021-08-30T07:56:34Z) - Short-term forecasting COVID-19 cumulative confirmed cases: Perspectives
for Brazil [3.0711362702464675]
新型コロナウイルス(COVID-19)は、今日までの最初の通知以来、何百万人もの人に感染する新興の病気だ。
本稿では、自己回帰統合移動平均(ARIMA)、キュビスト(CUBIST)、ランダムフォレスト(RF)、リッジ回帰(RIDGE)、スタックングアンサンブル学習を評価する。
開発されたモデルは正確な予測を生成でき、それぞれ0.87%から3.51%、1.02%から5.63%、0.95%から6.90%の誤差を発生させる。
論文 参考訳(メタデータ) (2020-07-21T17:58:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。