論文の概要: CLDR: Contrastive Learning Drug Response Models from Natural Language
Supervision
- arxiv url: http://arxiv.org/abs/2312.10707v1
- Date: Sun, 17 Dec 2023 12:51:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 14:57:24.089546
- Title: CLDR: Contrastive Learning Drug Response Models from Natural Language
Supervision
- Title(参考訳): CLDR:自然言語スーパービジョンによる対照的学習薬物応答モデル
- Authors: Kun Li, Wenbin Hu
- Abstract要約: 自然言語の教師付きコントラスト学習フレームワークであるMNを提案する。
がんデータセットにおける薬物感受性のゲノムから数十万のサンプルを検証した。
実験により、MN は標本を表現空間内の連続分布に効果的に制約することを示した。
- 参考スコア(独自算出の注目度): 15.330792768046615
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning-based drug response prediction (DRP) methods can accelerate the
drug discovery process and reduce R\&D costs. Although the mainstream methods
achieve high accuracy in predicting response regression values, the
regression-aware representations of these methods are fragmented and fail to
capture the continuity of the sample order. This phenomenon leads to models
optimized to sub-optimal solution spaces, reducing generalization ability and
may result in significant wasted costs in the drug discovery phase. In this
paper, we propose \MN, a contrastive learning framework with natural language
supervision for the DRP. The \MN~converts regression labels into text, which is
merged with the captions text of the drug response as a second modality of the
samples compared to the traditional modalities (graph, sequence). In each
batch, two modalities of one sample are considered positive pairs and the other
pairs are considered negative pairs. At the same time, in order to enhance the
continuous representation capability of the numerical text, a common-sense
numerical knowledge graph is introduced. We validated several hundred thousand
samples from the Genomics of Drug Sensitivity in Cancer dataset, observing the
average improvement of the DRP method ranges from 7.8\% to 31.4\% with the
application of our framework. The experiments prove that the \MN~effectively
constrains the samples to a continuous distribution in the representation
space, and achieves impressive prediction performance with only a few epochs of
fine-tuning after pre-training. The code is available at:
\url{https://gitee.com/xiaoyibang/clipdrug.git}.
- Abstract(参考訳): 深層学習に基づく薬物反応予測(DRP)法は、薬物発見プロセスを加速し、研究開発コストを削減できる。
本手法は応答回帰の予測において高い精度を達成するが,これらの手法の回帰認識表現は断片化され,サンプル順序の連続性を捉えることができない。
この現象は、最適解空間に最適化されたモデルにつながり、一般化能力が低下し、薬物発見フェーズでかなりの無駄なコストが発生する可能性がある。
本稿では, DRP を自然言語で管理するコントラスト学習フレームワークである \MN を提案する。
\mn~は回帰ラベルをテキストに変換し、従来のモダリティ(グラフ、シーケンス)と比較して、サンプルの第二のモダリティとして薬物応答のキャプションテキストとマージする。
各バッチでは、1つのサンプルの2つのモダリティは正のペア、もう1つのペアは負のペアと見なされる。
同時に、数値テキストの連続表現能力を高めるために、常識的な数値知識グラフを導入する。
がんデータセットにおける薬物感受性のゲノミクス(Genomics of Drug Sensitivity)から数十万のサンプルを検証し,DRP法の平均改善率は7.8\%から31.4\%であった。
実験により, サンプルを表現空間内の連続分布に効果的に拘束し, 事前学習後の微調整をわずかに行うことで, 印象的な予測性能が得られることがわかった。
コードは \url{https://gitee.com/xiaoyibang/clipdrug.git} で入手できる。
関連論文リスト
- ROTI-GCV: Generalized Cross-Validation for right-ROTationally Invariant Data [1.194799054956877]
高次元正規化回帰における2つの重要なタスクは、正確な予測のために正規化強度を調整し、サンプル外リスクを推定することである。
問題のある条件下でクロスバリデーションを確実に行うための新しいフレームワーク ROTI-GCV を導入する。
論文 参考訳(メタデータ) (2024-06-17T15:50:00Z) - Flexible Heteroscedastic Count Regression with Deep Double Poisson Networks [4.58556584533865]
本稿ではDDPN(Deep Double Poisson Network)を提案する。
DDPNは既存の離散モデルを大幅に上回っている。
これは様々なカウント回帰データセットに適用できる。
論文 参考訳(メタデータ) (2024-06-13T16:02:03Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - Embracing Uncertainty Flexibility: Harnessing a Supervised Tree Kernel
to Empower Ensemble Modelling for 2D Echocardiography-Based Prediction of
Right Ventricular Volume [0.5492530316344587]
右室機能低下は,多くの状況において臨床効果を強く予測する。
本稿では,不確実性スコアによるボリューム予測を補完する手法を提案する。
提案手法は意思決定プロセスの強化とリスク低減に有効である。
論文 参考訳(メタデータ) (2024-03-04T12:36:31Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Tailoring Language Generation Models under Total Variation Distance [55.89964205594829]
ニューラルネットワーク生成の標準パラダイムは、最適化方法として最大推定(MLE)を採用する。
言語生成に適用するための実践的境界を開発する。
本稿では,TVD推定のトレードオフのバランスをとるためのTaiLr の目標について紹介する。
論文 参考訳(メタデータ) (2023-02-26T16:32:52Z) - MetaRF: Differentiable Random Forest for Reaction Yield Prediction with
a Few Trails [58.47364143304643]
本稿では,反応収率予測問題に焦点をあてる。
筆者らはまず,数発の収量予測のために特別に設計された,注意に基づく識別可能なランダム森林モデルであるMetaRFを紹介した。
数発の学習性能を改善するために,さらに次元還元に基づくサンプリング手法を導入する。
論文 参考訳(メタデータ) (2022-08-22T06:40:13Z) - Saliency Grafting: Innocuous Attribution-Guided Mixup with Calibrated
Label Mixing [104.630875328668]
ミックスアップスキームは、強化されたトレーニングサンプルを作成するために、サンプルのペアを混ぜることを提案する。
両世界のベストを捉えた、斬新だがシンプルなミックスアップ版を提示する。
論文 参考訳(メタデータ) (2021-12-16T11:27:48Z) - SCEHR: Supervised Contrastive Learning for Clinical Risk Prediction
using Electronic Health Records [24.35874264767865]
我々は、縦断的電子健康記録(EHR)に基づく臨床リスク予測問題まで、教師付きコントラスト学習フレームワークを拡張した。
提案する損失関数は, 臨床リスク予測のためのベンチマークタスクにおける, 強力なベースラインの性能向上に有効であることを示す。
我々の損失関数は、既存の臨床予測モデルで採用されているクロスエントロピー損失(バイナリまたはマルチラベル)を置き換えるのに容易に利用できる。
論文 参考訳(メタデータ) (2021-10-11T00:32:17Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Stochastic Gradient Descent Meets Distribution Regression [0.0]
勾配降下(SGD)は、幅広い機械学習問題を解決するためのシンプルで効率的な方法である。
本稿では,2段階のサンプリングを含む分布回帰(DR)に注目した。
論文 参考訳(メタデータ) (2020-10-24T09:03:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。