論文の概要: Objective-Agnostic Enhancement of Molecule Properties via Multi-Stage
VAE
- arxiv url: http://arxiv.org/abs/2308.13066v2
- Date: Sun, 10 Sep 2023 00:52:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 18:50:21.410423
- Title: Objective-Agnostic Enhancement of Molecule Properties via Multi-Stage
VAE
- Title(参考訳): 多段VAEによる分子特性の客観的向上
- Authors: Chenghui Zhou, Barnabas Poczos
- Abstract要約: 変異オートエンコーダ(VAE)は医薬品発見の一般的な方法であり、その性能を改善するために様々なアーキテクチャやパイプラインが提案されている。
VAEアプローチは、データが高次元の周囲空間に埋め込まれた低次元多様体上にあるとき、多様体の回復不良に悩まされることが知られている。
本稿では, 合成データセット上での多様体回復を向上する多段階VAEアプローチを創薬分野に適用することを検討する。
- 参考スコア(独自算出の注目度): 1.3597551064547502
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Variational autoencoder (VAE) is a popular method for drug discovery and
various architectures and pipelines have been proposed to improve its
performance. However, VAE approaches are known to suffer from poor manifold
recovery when the data lie on a low-dimensional manifold embedded in a higher
dimensional ambient space [Dai and Wipf, 2019]. The consequences of it in drug
discovery are somewhat under-explored. In this paper, we explore applying a
multi-stage VAE approach, that can improve manifold recovery on a synthetic
dataset, to the field of drug discovery. We experimentally evaluate our
multi-stage VAE approach using the ChEMBL dataset and demonstrate its ability
to improve the property statistics of generated molecules substantially from
pre-existing methods without incorporating property predictors into the
training pipeline. We further fine-tune our models on two curated and much
smaller molecule datasets that target different proteins. Our experiments show
an increase in the number of active molecules generated by the multi-stage VAE
in comparison to their one-stage equivalent. For each of the two tasks, our
baselines include methods that use learned property predictors to incorporate
target metrics directly into the training objective and we discuss
complications that arise with this methodology.
- Abstract(参考訳): 変異オートエンコーダ(VAE)は医薬品発見の一般的な方法であり、その性能を改善するために様々なアーキテクチャやパイプラインが提案されている。
しかし,高次元空間に埋め込まれた低次元多様体(Dai and Wipf, 2019)上にデータを埋め込んだ場合,VAE法は粗悪な多様体回復に悩まされることが知られている。
薬物発見におけるその影響は、幾らか未発見である。
本稿では,合成データセット上の多様体の回復を改善する多段階的VAEアプローチを創薬分野に適用することを検討する。
我々は,chemblデータセットを用いた多段階vae手法を実験的に評価し,その特性予測器をトレーニングパイプラインに組み込むことなく,既存の手法から実質的に生成分子の性質統計を改善する能力を示す。
我々はさらに、異なるタンパク質をターゲットとした2つのキュレートされた、はるかに小さな分子データセットでモデルを微調整する。
実験の結果, 多段階のVAEが生成する活性分子数は, 1段階の等価分子に比べて増加した。
これら2つの課題のそれぞれに対して,学習対象の指標を直接学習対象に組み込むための学習特性予測器を用いた手法が基本となる。
関連論文リスト
- Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - Improving Molecular Properties Prediction Through Latent Space Fusion [9.912768918657354]
本稿では,最先端の化学モデルから導出した潜在空間を組み合わせた多視点手法を提案する。
分子構造をグラフとして表現するMHG-GNNの埋め込みと、化学言語に根ざしたMoLFormerの埋め込みである。
本稿では,既存の最先端手法と比較して,提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-10-20T20:29:32Z) - Machine Learning Small Molecule Properties in Drug Discovery [44.62264781248437]
我々は, 結合親和性, 溶解性, ADMET (吸収, 分布, 代謝, 排出, 毒性) を含む幅広い特性について検討する。
化学指紋やグラフベースニューラルネットワークなど,既存の一般的な記述子や埋め込みについて論じる。
最後に、モデル予測の理解を提供する技術、特に薬物発見における重要な意思決定について評価する。
論文 参考訳(メタデータ) (2023-08-02T22:18:41Z) - Learning Better with Less: Effective Augmentation for Sample-Efficient
Visual Reinforcement Learning [57.83232242068982]
データ拡張(DA)は、ビジュアル強化学習(RL)アルゴリズムのサンプル効率を高める重要な手法である。
サンプル効率のよい視覚的RLを実現する上で, DAのどの属性が有効かは明らかになっていない。
本研究は,DAの属性が有効性に与える影響を評価するための総合的な実験を行う。
論文 参考訳(メタデータ) (2023-05-25T15:46:20Z) - ALMERIA: Boosting pairwise molecular contrasts with scalable methods [0.0]
ALMERIAは、一対の分子コントラストに基づく化合物の類似性と活性予測を推定するためのツールである。
大量のデータを利用するスケーラブルなソフトウェアと手法を使って実装されている。
分子活性予測の最先端性能を示す実験を行った。
論文 参考訳(メタデータ) (2023-04-28T16:27:06Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Improving Molecule Properties Through 2-Stage VAE [0.0]
変異オートエンコーダ(VAE)は、薬物発見の一般的な方法である。
VAEモデルは、高次元空間に埋め込まれた低次元多様体上にデータを置くと、多様体の回復不良のような欠陥に悩まされる。
本稿では,2段階のVAEによる多様体復元を改良し,VAEとトレーニングデータセットによるデータの類似性を改善する方法について検討する。
論文 参考訳(メタデータ) (2022-12-06T04:41:48Z) - Multiple Similarity Drug-Target Interaction Prediction with Random Walks
and Matrix Factorization [16.41618129467975]
我々は、異なるレイヤが薬物と標的の異なる類似度メトリクスに対応する、多層ネットワークの視点を捉えている。
複数のビューでキャプチャされたトポロジ情報を完全に活用するために,DTI予測のための最適化フレームワーク MDMF を開発した。
このフレームワークは、すべての超分子層にまたがる高次近接を維持するだけでなく、内部積との相互作用を近似する薬物や標的のベクトル表現を学習する。
論文 参考訳(メタデータ) (2022-01-24T08:02:05Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。
本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。
実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文 参考訳(メタデータ) (2020-10-02T13:59:05Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。