論文の概要: Learning Curves for Drug Response Prediction in Cancer Cell Lines
- arxiv url: http://arxiv.org/abs/2011.12466v1
- Date: Wed, 25 Nov 2020 01:08:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 03:50:11.616456
- Title: Learning Curves for Drug Response Prediction in Cancer Cell Lines
- Title(参考訳): がん細胞株における薬物応答予測のための学習曲線
- Authors: Alexander Partin (1 and 2), Thomas Brettin (2 and 3), Yvonne A. Evrard
(4), Yitan Zhu (1 and 2), Hyunseung Yoo (1 and 2), Fangfang Xia (1 and 2),
Songhao Jiang (7), Austin Clyde (1 and 7), Maulik Shukla (1 and 2), Michael
Fonstein (5), James H. Doroshow (6), Rick Stevens (3 and 7) ((1) Division of
Data Science and Learning, Argonne National Laboratory, Argonne, IL, USA, (2)
University of Chicago Consortium for Advanced Science and Engineering,
University of Chicago, Chicago, IL, USA, (3) Computing, Environment and Life
Sciences, Argonne National Laboratory, Lemont, IL, USA, (4) Frederick
National Laboratory for Cancer Research, Leidos Biomedical Research, Inc.
Frederick, MD, USA, (5) Biosciences Division, Argonne National Laboratory,
Lemont, IL, USA, (6) Division of Cancer Therapeutics and Diagnosis, National
Cancer Institute, Bethesda, MD, USA, (7) Department of Computer Science, The
University of Chicago, Chicago, IL, USA)
- Abstract要約: 2つのニューラルネットワーク(NN)と2つの勾配強化決定木(GBDT)モデルの4つの薬物スクリーニングデータセットで訓練されたデータスケーリング特性を評価する。
学習曲線は、パワーローモデルに正確に適合し、これらの予測器のデータスケーリング挙動を評価するためのフレームワークを提供する。
- 参考スコア(独自算出の注目度): 29.107984441845673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivated by the size of cell line drug sensitivity data, researchers have
been developing machine learning (ML) models for predicting drug response to
advance cancer treatment. As drug sensitivity studies continue generating data,
a common question is whether the proposed predictors can further improve the
generalization performance with more training data. We utilize empirical
learning curves for evaluating and comparing the data scaling properties of two
neural networks (NNs) and two gradient boosting decision tree (GBDT) models
trained on four drug screening datasets. The learning curves are accurately
fitted to a power law model, providing a framework for assessing the data
scaling behavior of these predictors. The curves demonstrate that no single
model dominates in terms of prediction performance across all datasets and
training sizes, suggesting that the shape of these curves depends on the unique
model-dataset pair. The multi-input NN (mNN), in which gene expressions and
molecular drug descriptors are input into separate subnetworks, outperforms a
single-input NN (sNN), where the cell and drug features are concatenated for
the input layer. In contrast, a GBDT with hyperparameter tuning exhibits
superior performance as compared with both NNs at the lower range of training
sizes for two of the datasets, whereas the mNN performs better at the higher
range of training sizes. Moreover, the trajectory of the curves suggests that
increasing the sample size is expected to further improve prediction scores of
both NNs. These observations demonstrate the benefit of using learning curves
to evaluate predictors, providing a broader perspective on the overall data
scaling characteristics. The fitted power law curves provide a forward-looking
performance metric and can serve as a co-design tool to guide experimental
biologists and computational scientists in the design of future experiments.
- Abstract(参考訳): 細胞株の薬剤感受性データの大きさに触発された研究者は、進行がん治療に対する薬物反応を予測する機械学習(ML)モデルを開発している。
薬物感受性研究がデータ生成を続けるにつれて、提案する予測器がより多くのトレーニングデータで一般化性能をさらに向上できるかどうかが問題となる。
2つのニューラルネットワーク(NN)と2つの勾配促進決定木(GBDT)モデルの4つの薬物スクリーニングデータセットで訓練されたデータスケーリング特性の評価と比較に経験的学習曲線を利用する。
学習曲線はパワーローモデルに正確に適合し、これらの予測器のデータスケーリング挙動を評価するためのフレームワークを提供する。
これらの曲線は、全てのデータセットの予測性能やトレーニングサイズにおいて、単一のモデルが支配的でないことを示している。
遺伝子発現および分子ドラッグディスクリプタが別々のサブネットに入力されるマルチインプットNN(mNN)は、入力層に対して細胞および薬物の特徴が連結された単一インプットNN(sNN)より優れる。
対照的に、ハイパーパラメータチューニングを備えたGBDTは、両方のNNが2つのデータセットのトレーニングサイズよりも低い範囲のトレーニングサイズで、mNNはより高いトレーニングサイズで、優れたパフォーマンスを示す。
さらに, この曲線の軌跡から, 試料径の増大により, 両NNの予測スコアがさらに向上することが示唆された。
これらの観察は、予測器を評価するために学習曲線を使うことの利点を示し、データスケーリングの全体的な特徴についてより広い視点を提供する。
入出力法則曲線は前向きのパフォーマンス指標を提供し、将来の実験の設計において実験生物学者や計算科学者を導くための共同設計ツールとして機能する。
関連論文リスト
- CogDPM: Diffusion Probabilistic Models via Cognitive Predictive Coding [62.075029712357]
本研究は認知拡散確率モデル(CogDPM)を紹介する。
CogDPMは拡散モデルの階層的サンプリング能力に基づく精度推定法と拡散モデル固有の性質から推定される精度重み付きガイダンスを備える。
我々は,Universal Kindomの降水量と表面風速データセットを用いた実世界の予測タスクにCogDPMを適用した。
論文 参考訳(メタデータ) (2024-05-03T15:54:50Z) - Graph-enabled Reinforcement Learning for Time Series Forecasting with
Adaptive Intelligence [11.249626785206003]
グラフニューラルネットワーク(GNN)と強化学習(RL)を用いたモニタリングによる時系列データの予測手法を提案する。
GNNは、データのグラフ構造をモデルに明示的に組み込むことができ、時間的依存関係をより自然な方法でキャプチャすることができる。
このアプローチは、医療、交通、天気予報など、複雑な時間構造におけるより正確な予測を可能にする。
論文 参考訳(メタデータ) (2023-09-18T22:25:12Z) - Transferability of coVariance Neural Networks and Application to
Interpretable Brain Age Prediction using Anatomical Features [119.45320143101381]
グラフ畳み込みネットワーク(GCN)は、トポロジー駆動のグラフ畳み込み演算を利用して、推論タスクのためにグラフをまたいだ情報を結合する。
我々は、共分散行列をグラフとして、共分散ニューラルネットワーク(VNN)の形でGCNを研究した。
VNNは、GCNからスケールフリーなデータ処理アーキテクチャを継承し、ここでは、共分散行列が極限オブジェクトに収束するデータセットに対して、VNNが性能の転送可能性を示すことを示す。
論文 参考訳(メタデータ) (2023-05-02T22:15:54Z) - Pipeline-Invariant Representation Learning for Neuroimaging [5.502218439301424]
我々は,前処理パイプラインの選択が教師付き学習モデルの下流性能に与える影響を評価する。
本稿では,2つのパイプライン不変表現学習手法,MPSLとPXLを提案する。
これらの結果は,本モデルがパイプライン関連バイアスを緩和し,脳-フェノタイプモデルにおける予測ロバスト性の向上に有効であることを示唆している。
論文 参考訳(メタデータ) (2022-08-27T02:34:44Z) - Discovering Invariant Rationales for Graph Neural Networks [104.61908788639052]
グラフニューラルネットワーク(GNN)の固有の解釈可能性とは、入力グラフの特徴の小さなサブセットを見つけることである。
本稿では,本質的に解釈可能なGNNを構築するために,不変理性(DIR)を発見するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2022-01-30T16:43:40Z) - Towards Open-World Feature Extrapolation: An Inductive Graph Learning
Approach [80.8446673089281]
グラフ表現と学習を伴う新しい学習パラダイムを提案する。
本フレームワークは,1) 下位モデルとしてのバックボーンネットワーク(フィードフォワードニューラルネットなど)が,予測ラベルの入力および出力として機能を取り,2) 上位モデルとしてのグラフニューラルネットワークが,観測データから構築された特徴データグラフをメッセージパッシングすることで,新機能の埋め込みを外挿することを学ぶ。
論文 参考訳(メタデータ) (2021-10-09T09:02:45Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - A robust low data solution: dimension prediction of semiconductor
nanorods [5.389015968413988]
半導体ナノロッド(NR)の長さ,幅,アスペクト比を正確に予測するために,ロバストディープニューラルネットワークに基づく回帰アルゴリズムを開発した。
深部ニューラルネットワークは、類似した分布を持つ原データと生成データの両方に対して、よく実行される予測を実証した回帰モデルの開発にさらに応用される。
論文 参考訳(メタデータ) (2020-10-27T07:51:38Z) - Bidirectional Representation Learning from Transformers using Multimodal
Electronic Health Record Data to Predict Depression [11.1492931066686]
うつ病の予測のために,ERHシーケンス上で双方向の表現学習を行うための時間的深層学習モデルを提案する。
このモデルでは, 曲線(PRAUC)下において, 最良ベースラインモデルと比較して, 抑うつ予測において0.70から0.76まで, 精度・リコール面積の最大値が得られた。
論文 参考訳(メタデータ) (2020-09-26T17:56:37Z) - Ensemble Transfer Learning for the Prediction of Anti-Cancer Drug
Response [49.86828302591469]
本稿では,抗がん剤感受性の予測にトランスファーラーニングを適用した。
我々は、ソースデータセット上で予測モデルをトレーニングし、ターゲットデータセット上でそれを洗練する古典的な転送学習フレームワークを適用した。
アンサンブル転送学習パイプラインは、LightGBMと異なるアーキテクチャを持つ2つのディープニューラルネットワーク(DNN)モデルを使用して実装されている。
論文 参考訳(メタデータ) (2020-05-13T20:29:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。