論文の概要: Active Learning Enables Extrapolation in Molecular Generative Models
- arxiv url: http://arxiv.org/abs/2501.02059v1
- Date: Fri, 03 Jan 2025 19:07:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:05:25.171648
- Title: Active Learning Enables Extrapolation in Molecular Generative Models
- Title(参考訳): 分子生成モデルにおける外挿を可能にするアクティブラーニング
- Authors: Evan R. Antoniuk, Peggy Li, Nathan Keilbart, Stephen Weitzner, Bhavya Kailkhura, Anna M. Hiszpanski,
- Abstract要約: 分子生成モデルのための能動的学習・閉ループ分子生成パイプラインを作成する。
他の生成モデルアプローチと比較して、我々のアクティブな学習アプローチだけがトレーニングデータを超える性質を持つ分子を生成する。
生成する安定分子の割合は、次のベストモデルよりも3.5倍高い。
- 参考スコア(独自算出の注目度): 11.234291560423943
- License:
- Abstract: Although generative models hold promise for discovering molecules with optimized desired properties, they often fail to suggest synthesizable molecules that improve upon the known molecules seen in training. We find that a key limitation is not in the molecule generation process itself, but in the poor generalization capabilities of molecular property predictors. We tackle this challenge by creating an active-learning, closed-loop molecule generation pipeline, whereby molecular generative models are iteratively refined on feedback from quantum chemical simulations to improve generalization to new chemical space. Compared against other generative model approaches, only our active learning approach generates molecules with properties that extrapolate beyond the training data (reaching up to 0.44 standard deviations beyond the training data range) and out-of-distribution molecule classification accuracy is improved by 79%. By conditioning molecular generation on thermodynamic stability data from the active-learning loop, the proportion of stable molecules generated is 3.5x higher than the next-best model.
- Abstract(参考訳): 生成モデルは、最適化された望ましい性質を持つ分子を発見することを約束するが、それらはしばしば、トレーニングで見られる既知の分子を改善する合成可能な分子を提案するのに失敗する。
分子生成過程自体に重要な制限があるのではなく、分子特性予測器の一般化能力の貧弱さにあることがわかった。
分子生成モデルは、量子化学シミュレーションのフィードバックに基づいて反復的に洗練され、新しい化学空間への一般化が向上する。
他の生成モデルと比較して、我々のアクティブな学習アプローチはトレーニングデータを超える性質を持つ分子(トレーニングデータ範囲を超える標準偏差0.44まで)を生成し、分布外分子分類精度を79%向上させる。
アクティブラーニングループからの熱力学的安定性データに分子生成を条件付けることにより、生成する安定分子の割合は、次のベストモデルよりも3.5倍高い。
関連論文リスト
- MolMiner: Transformer architecture for fragment-based autoregressive generation of molecular stories [7.366789601705544]
生成過程の化学的妥当性、解釈可能性、可変分子サイズへの柔軟性は、計算材料設計における生成モデルに残る課題の1つである。
本稿では,分子生成を離散的かつ解釈可能なステップの列に分解する自己回帰的手法を提案する。
この結果から,本モデルでは,提案した多目的目標目標に応じて,生成分布を効果的にバイアスすることができることがわかった。
論文 参考訳(メタデータ) (2024-11-10T22:00:55Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - Pre-training of Molecular GNNs via Conditional Boltzmann Generator [0.0]
分子配座のデータセットを用いた分子GNNの事前学習法を提案する。
本モデルは,既存の事前学習法よりも分子特性の予測性能がよいことを示す。
論文 参考訳(メタデータ) (2023-12-20T15:30:15Z) - STRIDE: Structure-guided Generation for Inverse Design of Molecules [0.24578723416255752]
$textbfSTRIDE$は、既知の分子によって誘導される無条件生成モデルを持つ新規分子を生成する生成分子ワークフローである。
生成分子は、平均21.7%低い合成アクセシビリティスコアを持ち、生成分子の5.9%のイオン化ポテンシャルを誘導する。
論文 参考訳(メタデータ) (2023-11-06T08:22:35Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - Generating stable molecules using imitation and reinforcement learning [0.0]
カルテシアン座標における分子生成のための強化学習手法を提案する。
我々は、GDB-11データベース上での模倣学習から基本的な化学規則を学び、初期モデルを作成する。
次に、強化学習環境において、特定の統計量で条件付けられたモデルの複数のコピーをデプロイする。
論文 参考訳(メタデータ) (2021-07-11T10:18:19Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。