Fugu-MT 論文翻訳(概要): Objective-Agnostic Enhancement of Molecule Properties via Multi-Stage VAE

論文の概要: Objective-Agnostic Enhancement of Molecule Properties via Multi-Stage VAE

arxiv url: http://arxiv.org/abs/2308.13066v2
Date: Sun, 10 Sep 2023 00:52:57 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-12 18:50:21.410423
Title: Objective-Agnostic Enhancement of Molecule Properties via Multi-Stage VAE
Title（参考訳）: 多段VAEによる分子特性の客観的向上
Authors: Chenghui Zhou, Barnabas Poczos
Abstract要約: 変異オートエンコーダ(VAE)は医薬品発見の一般的な方法であり、その性能を改善するために様々なアーキテクチャやパイプラインが提案されている。 VAEアプローチは、データが高次元の周囲空間に埋め込まれた低次元多様体上にあるとき、多様体の回復不良に悩まされることが知られている。本稿では, 合成データセット上での多様体回復を向上する多段階VAEアプローチを創薬分野に適用することを検討する。
参考スコア（独自算出の注目度）: 1.3597551064547502
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Variational autoencoder (VAE) is a popular method for drug discovery and various architectures and pipelines have been proposed to improve its performance. However, VAE approaches are known to suffer from poor manifold recovery when the data lie on a low-dimensional manifold embedded in a higher dimensional ambient space [Dai and Wipf, 2019]. The consequences of it in drug discovery are somewhat under-explored. In this paper, we explore applying a multi-stage VAE approach, that can improve manifold recovery on a synthetic dataset, to the field of drug discovery. We experimentally evaluate our multi-stage VAE approach using the ChEMBL dataset and demonstrate its ability to improve the property statistics of generated molecules substantially from pre-existing methods without incorporating property predictors into the training pipeline. We further fine-tune our models on two curated and much smaller molecule datasets that target different proteins. Our experiments show an increase in the number of active molecules generated by the multi-stage VAE in comparison to their one-stage equivalent. For each of the two tasks, our baselines include methods that use learned property predictors to incorporate target metrics directly into the training objective and we discuss complications that arise with this methodology.
Abstract（参考訳）: 変異オートエンコーダ(VAE)は医薬品発見の一般的な方法であり、その性能を改善するために様々なアーキテクチャやパイプラインが提案されている。しかし,高次元空間に埋め込まれた低次元多様体(Dai and Wipf, 2019)上にデータを埋め込んだ場合,VAE法は粗悪な多様体回復に悩まされることが知られている。薬物発見におけるその影響は、幾らか未発見である。本稿では,合成データセット上の多様体の回復を改善する多段階的VAEアプローチを創薬分野に適用することを検討する。我々は,chemblデータセットを用いた多段階vae手法を実験的に評価し,その特性予測器をトレーニングパイプラインに組み込むことなく,既存の手法から実質的に生成分子の性質統計を改善する能力を示す。我々はさらに、異なるタンパク質をターゲットとした2つのキュレートされた、はるかに小さな分子データセットでモデルを微調整する。実験の結果, 多段階のVAEが生成する活性分子数は, 1段階の等価分子に比べて増加した。これら2つの課題のそれぞれに対して,学習対象の指標を直接学習対象に組み込むための学習特性予測器を用いた手法が基本となる。

関連論文リスト

InversionGNN: A Dual Path Network for Multi-Property Molecular Optimization [77.79862482208326]
InversionGNNは、多目的薬物発見のための有効だがサンプル効率のよいデュアルパスグラフニューラルネットワーク(GNN)である。関数群の最適組み合わせに関する知識を得るために,マルチプロパティ予測のためのモデルを訓練する。そして、学習された化学知識は、インバージョン生成経路が要求される性質を持つ分子を生成するのに役立つ。
論文参考訳（メタデータ） (2025-03-03T12:53:36Z)
Pullback Flow Matching on Data Manifolds [10.187244125099479]
プルバックフローマッチング(Pullback Flow Matching、PFM)は、データ多様体上の生成モデリングのためのフレームワークである。 PFMの有効性を、合成、データダイナミクス、タンパク質配列データに適用し、特定の性質を持つ新規なタンパク質を生成することによって実証する。本手法は, 創薬・材料科学に強い可能性を示し, 特定の性質を持つ新規試料の生成に大きな関心を寄せている。
論文参考訳（メタデータ） (2024-10-06T16:41:26Z)
Learning Feature Inversion for Multi-class Anomaly Detection under General-purpose COCO-AD Benchmark [101.23684938489413]
異常検出(AD)は、しばしば産業品質検査や医学的病変検査のための異常の検出に焦点が当てられている。この研究はまず、COCOをADフィールドに拡張することにより、大規模で汎用的なCOCO-ADデータセットを構築する。セグメンテーション分野のメトリクスにインスパイアされた我々は、より実用的なしきい値に依存したAD固有のメトリクスをいくつか提案する。
論文参考訳（メタデータ） (2024-04-16T17:38:26Z)
Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文参考訳（メタデータ） (2023-10-22T04:06:44Z)
Improving Molecular Properties Prediction Through Latent Space Fusion [9.912768918657354]
本稿では,最先端の化学モデルから導出した潜在空間を組み合わせた多視点手法を提案する。分子構造をグラフとして表現するMHG-GNNの埋め込みと、化学言語に根ざしたMoLFormerの埋め込みである。本稿では,既存の最先端手法と比較して,提案手法の優れた性能を示す。
論文参考訳（メタデータ） (2023-10-20T20:29:32Z)
Machine Learning Small Molecule Properties in Drug Discovery [44.62264781248437]
我々は, 結合親和性, 溶解性, ADMET (吸収, 分布, 代謝, 排出, 毒性) を含む幅広い特性について検討する。化学指紋やグラフベースニューラルネットワークなど,既存の一般的な記述子や埋め込みについて論じる。最後に、モデル予測の理解を提供する技術、特に薬物発見における重要な意思決定について評価する。
論文参考訳（メタデータ） (2023-08-02T22:18:41Z)
Learning Better with Less: Effective Augmentation for Sample-Efficient Visual Reinforcement Learning [57.83232242068982]
データ拡張(DA)は、ビジュアル強化学習(RL)アルゴリズムのサンプル効率を高める重要な手法である。サンプル効率のよい視覚的RLを実現する上で, DAのどの属性が有効かは明らかになっていない。本研究は,DAの属性が有効性に与える影響を評価するための総合的な実験を行う。
論文参考訳（メタデータ） (2023-05-25T15:46:20Z)
ALMERIA: Boosting pairwise molecular contrasts with scalable methods [0.0]
ALMERIAは、一対の分子コントラストに基づく化合物の類似性と活性予測を推定するためのツールである。大量のデータを利用するスケーラブルなソフトウェアと手法を使って実装されている。分子活性予測の最先端性能を示す実験を行った。
論文参考訳（メタデータ） (2023-04-28T16:27:06Z)
Drug Synergistic Combinations Predictions via Large-Scale Pre-Training and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文参考訳（メタデータ） (2023-01-14T15:07:43Z)
Improving Molecule Properties Through 2-Stage VAE [0.0]
変異オートエンコーダ(VAE)は、薬物発見の一般的な方法である。 VAEモデルは、高次元空間に埋め込まれた低次元多様体上にデータを置くと、多様体の回復不良のような欠陥に悩まされる。本稿では,2段階のVAEによる多様体復元を改良し,VAEとトレーニングデータセットによるデータの類似性を改善する方法について検討する。
論文参考訳（メタデータ） (2022-12-06T04:41:48Z)
DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文参考訳（メタデータ） (2020-10-02T13:59:05Z)
A Systematic Approach to Featurization for Cancer Drug Sensitivity Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。 RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文参考訳（メタデータ） (2020-04-30T20:42:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。