論文の概要: Improving Molecular Design by Stochastic Iterative Target Augmentation
- arxiv url: http://arxiv.org/abs/2002.04720v3
- Date: Sun, 15 Aug 2021 18:40:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 02:05:08.084430
- Title: Improving Molecular Design by Stochastic Iterative Target Augmentation
- Title(参考訳): 確率的反復的ターゲット増強による分子設計の改善
- Authors: Kevin Yang, Wengong Jin, Kyle Swanson, Regina Barzilay, Tommi Jaakkola
- Abstract要約: 分子設計における生成モデルは、豊かにパラメータ化され、データハングリーなニューラルモデルである。
分子標的を反復的に生成するための驚くほど効果的な自己学習手法を提案する。
我々の手法は、条件分子設計におけるこれまでの最先端技術よりも10%以上の絶対ゲインを達成している。
- 参考スコア(独自算出の注目度): 38.44457632751997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative models in molecular design tend to be richly parameterized,
data-hungry neural models, as they must create complex structured objects as
outputs. Estimating such models from data may be challenging due to the lack of
sufficient training data. In this paper, we propose a surprisingly effective
self-training approach for iteratively creating additional molecular targets.
We first pre-train the generative model together with a simple property
predictor. The property predictor is then used as a likelihood model for
filtering candidate structures from the generative model. Additional targets
are iteratively produced and used in the course of stochastic EM iterations to
maximize the log-likelihood that the candidate structures are accepted. A
simple rejection (re-weighting) sampler suffices to draw posterior samples
since the generative model is already reasonable after pre-training. We
demonstrate significant gains over strong baselines for both unconditional and
conditional molecular design. In particular, our approach outperforms the
previous state-of-the-art in conditional molecular design by over 10% in
absolute gain. Finally, we show that our approach is useful in other domains as
well, such as program synthesis.
- Abstract(参考訳): 分子設計における生成モデルは、複雑な構造化オブジェクトを出力として作成する必要があるため、リッチなパラメータ化、データハングリーニューラルモデルである傾向がある。
このようなモデルをデータから推定するのは、十分なトレーニングデータがないため難しい場合があります。
本稿では,分子標的を反復的に生成するための驚くほど効果的な自己学習手法を提案する。
まず、単純な特性予測器とともに生成モデルを事前学習する。
プロパティ予測器は、生成モデルから候補構造をフィルタリングする可能性モデルとして使用される。
追加のターゲットは確率的EMイテレーションの過程で反復生成され、候補構造が受け入れられるログライクな範囲を最大化するために使用される。
単純な拒絶(再重み付け)サンプラーは、事前訓練後の生成モデルが既に妥当であるため、後方のサンプルを描画するのに十分である。
非条件分子設計と条件分子設計の両方において,強いベースラインに対して有意な向上を示す。
特に,条件分子設計におけるこれまでの最先端の手法を絶対ゲインで10%以上上回っている。
最後に,本手法はプログラム合成など他の分野でも有用であることを示す。
関連論文リスト
- Self-Consuming Generative Models with Curated Data Provably Optimize Human Preferences [20.629333587044012]
本研究では,データキュレーションが生成モデルの反復的再学習に与える影響について検討する。
報奨モデルに従ってデータをキュレートすると、反復的再訓練手順の期待報酬が最大になることを示す。
論文 参考訳(メタデータ) (2024-06-12T21:28:28Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - Self-Supervised Dataset Distillation for Transfer Learning [77.4714995131992]
ラベルなしデータセットを、効率的な自己教師付き学習(SSL)のための小さな合成サンプル群に蒸留する新しい問題を提案する。
両レベル最適化におけるSSL目標に対する合成サンプルの勾配は、データ拡張やマスキングから生じるランダム性から、テキストバイアスを受けていることを最初に証明する。
転送学習を含む様々な応用における本手法の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2023-10-10T10:48:52Z) - Variational Autoencoding Molecular Graphs with Denoising Diffusion
Probabilistic Model [0.0]
本稿では,階層構造を確率論的潜在ベクトルに組み込んだ新しい深層生成モデルを提案する。
本モデルは,物理特性と活性に関する小さなデータセットを用いて,分子特性予測のための有効な分子潜在ベクトルを設計できることを実証する。
論文 参考訳(メタデータ) (2023-07-02T17:29:41Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Score-Based Generative Models for Molecule Generation [0.8808021343665321]
我々は、ZINCデータセットから150万のサンプルを表現したTransformerベースのスコア関数をトレーニングする。
私たちは、Mosesベンチマークフレームワークを使用して、一連のメトリクスで生成されたサンプルを評価します。
論文 参考訳(メタデータ) (2022-03-07T13:46:02Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。