論文の概要: A generative recommender system with GMM prior for cancer drug
generation and sensitivity prediction
- arxiv url: http://arxiv.org/abs/2206.03555v1
- Date: Tue, 7 Jun 2022 20:13:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-10 05:55:01.942421
- Title: A generative recommender system with GMM prior for cancer drug
generation and sensitivity prediction
- Title(参考訳): GMMを用いたがん薬物産生と感受性予測のための遺伝子レコメンデーションシステム
- Authors: Krzysztof Koras, Marcin Mo\.zejko, Paulina Szymczak, Eike Staub, and
Ewa Szczurek
- Abstract要約: 本稿では,変分オートエンコーダを用いた薬物効率評価推薦システムであるVADEERSについて述べる。
化合物の生成は、半教師付きガウス混合モデル(GMM)による新しい変分オートエンコーダによって実行される。
VADEERSは、薬物と細胞株の性質とそれらの関係の包括的モデルを提供し、新規化合物を誘導する。
- 参考スコア(独自算出の注目度): 1.0128447823756244
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent emergence of high-throughput drug screening assays sparkled an
intensive development of machine learning methods, including models for
prediction of sensitivity of cancer cell lines to anti-cancer drugs, as well as
methods for generation of potential drug candidates. However, a concept of
generation of compounds with specific properties and simultaneous modeling of
their efficacy against cancer cell lines has not been comprehensively explored.
To address this need, we present VADEERS, a Variational Autoencoder-based Drug
Efficacy Estimation Recommender System. The generation of compounds is
performed by a novel variational autoencoder with a semi-supervised Gaussian
Mixture Model (GMM) prior. The prior defines a clustering in the latent space,
where the clusters are associated with specific drug properties. In addition,
VADEERS is equipped with a cell line autoencoder and a sensitivity prediction
network. The model combines data for SMILES string representations of
anti-cancer drugs, their inhibition profiles against a panel of protein
kinases, cell lines biological features and measurements of the sensitivity of
the cell lines to the drugs. The evaluated variants of VADEERS achieve a high
r=0.87 Pearson correlation between true and predicted drug sensitivity
estimates. We train the GMM prior in such a way that the clusters in the latent
space correspond to a pre-computed clustering of the drugs by their inhibitory
profiles. We show that the learned latent representations and new generated
data points accurately reflect the given clustering. In summary, VADEERS offers
a comprehensive model of drugs and cell lines properties and relationships
between them, as well as a guided generation of novel compounds.
- Abstract(参考訳): 近年の高スループット薬物スクリーニングアッセイの出現は、がん細胞株の抗がん剤感受性の予測モデルや、潜在的な薬物候補の生成方法など、機械学習手法の集中的な開発に拍車を掛けた。
しかし、特定の性質を持つ化合物の生成と癌細胞株に対する効果の同時モデリングという概念は、包括的に検討されていない。
このニーズに対処するために,変分オートエンコーダを用いた薬物効率評価推薦システムであるVADEERSを提案する。
化合物の生成は、半教師付きガウス混合モデル(GMM)による新しい変分オートエンコーダによって実行される。
前者は、クラスタが特定の薬物特性に関連付けられる潜在空間におけるクラスタリングを定義する。
さらに、VADEERSはセルラインオートエンコーダと感度予測ネットワークを備える。
このモデルは、抗がん剤のSMILES文字列表現のデータ、プロテインキナーゼのパネルに対するそれらの阻害プロファイル、細胞株の生物学的特徴、および薬剤に対する細胞株の感受性の測定を組み合わせる。
評価されたVADEERSの変種は、真と予測される薬剤感受性の推定値の間の高いr=0.87ピアソン相関が得られる。
我々は、潜伏空間のクラスターがその阻害プロファイルによって予め計算された薬物のクラスター化に対応するように、GMMを事前訓練する。
学習された潜在表現と新たなデータポイントが,与えられたクラスタリングを正確に反映していることを示す。
まとめると、VADEERSは薬物と細胞株の性質とそれらの関係の包括的モデルを提供し、新規化合物を誘導する。
関連論文リスト
- DrugImproverGPT: A Large Language Model for Drug Optimization with Fine-Tuning via Structured Policy Optimization [53.27954325490941]
大規模言語モデル(LLM)の微調整は、特定の目的に向けて結果を生成するために不可欠である。
本研究は,薬物最適化LSMに基づく生成モデルを微調整するための新しい強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-11T04:00:21Z) - Accelerating Drug Safety Assessment using Bidirectional-LSTM for SMILES Data [0.0]
Bi-Directional Long Short Term Memory (BiLSTM) は、入力分子配列を処理するリカレントニューラルネットワーク(RNN)の変種である。
提案した研究は、SMILES文字列にコードされたシーケンシャルパターンを理解することを目的としており、それによって分子の毒性を予測する。
論文 参考訳(メタデータ) (2024-07-08T18:12:11Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - drGAT: Attention-Guided Gene Assessment of Drug Response Utilizing a Drug-Cell-Gene Heterogeneous Network [9.637695046701493]
drGATは、薬物に対する感受性を予測するグラフ深層学習モデルである。
drGATは既存のモデルよりも優れた性能を示し、精度は78%、F1スコアは76%、DNA損傷物質は269である。
本手法は薬剤感受性を正確に予測するために有用であり,がん患者の治療に関するバイオマーカーの同定に有用である。
論文 参考訳(メタデータ) (2024-05-14T22:16:52Z) - Enhancing drug and cell line representations via contrastive learning
for improved anti-cancer drug prioritization [0.7070726553564699]
本稿では,学習薬物や細胞株の表現を改善するために,対照的な学習法を提案する。
我々の学習した表現は、予測を行う際、薬物および細胞由来の特徴によりバランスがとれることが分かりました。
論文 参考訳(メタデータ) (2023-10-20T04:18:47Z) - Precision Anti-Cancer Drug Selection via Neural Ranking [0.342658286826597]
薬物および細胞株の潜伏表現を学習する2つのニューラルリストワイドランキング法を提案し,その表現を用いて各細胞株の薬物を学習可能なスコアリング機能を介してスコアリングする。
以上の結果から,List-Allはテストセルの50%に対して, hit@20で最大8.6%の大幅な改善を達成して,最高のベースラインを達成できた。
論文 参考訳(メタデータ) (2023-06-30T16:23:25Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Tailoring Molecules for Protein Pockets: a Transformer-based Generative
Solution for Structured-based Drug Design [133.1268990638971]
標的タンパク質の構造に基づくデノボ薬物の設計は、新規な薬物候補を提供することができる。
そこで本研究では,特定のターゲットに対して,対象薬物をスクラッチから直接生成できるTamGentという生成ソリューションを提案する。
論文 参考訳(メタデータ) (2022-08-30T09:32:39Z) - MOOMIN: Deep Molecular Omics Network for Anti-Cancer Drug Combination
Therapy [2.446672595462589]
本稿では,がん治療における薬物併用の相乗効果を予測できるマルチモーダルグラフニューラルネットワークを提案する。
本モデルでは,薬物とタンパク質の相互作用ネットワークとメタデータに基づいて,薬物のコンテキストを複数スケールで表現する。
このモデルが癌細胞株の組織を広範囲にわたって高い品質で予測できることを実証した。
論文 参考訳(メタデータ) (2021-10-28T13:10:25Z) - Ensemble Transfer Learning for the Prediction of Anti-Cancer Drug
Response [49.86828302591469]
本稿では,抗がん剤感受性の予測にトランスファーラーニングを適用した。
我々は、ソースデータセット上で予測モデルをトレーニングし、ターゲットデータセット上でそれを洗練する古典的な転送学習フレームワークを適用した。
アンサンブル転送学習パイプラインは、LightGBMと異なるアーキテクチャを持つ2つのディープニューラルネットワーク(DNN)モデルを使用して実装されている。
論文 参考訳(メタデータ) (2020-05-13T20:29:48Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。