論文の概要: Faster and more diverse de novo molecular optimization with double-loop
reinforcement learning using augmented SMILES
- arxiv url: http://arxiv.org/abs/2210.12458v1
- Date: Sat, 22 Oct 2022 14:36:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 21:26:24.770254
- Title: Faster and more diverse de novo molecular optimization with double-loop
reinforcement learning using augmented SMILES
- Title(参考訳): 拡張スマイルを用いた二重ループ強化学習によるより高速で多様なde novo分子最適化
- Authors: Esben Jannik Bjerrum, Christian Margreitter, Thomas Blaschke, Raquel
Lopez-Rios de Castro
- Abstract要約: 本稿では,分子線入力システム(SMILES)を簡略化した二重ループ強化学習を用いて,スコアリング計算をより効率的に行うことを提案する。
その結果,5~10倍の増量繰り返しは,ほとんどのスコアリング関数に対して安全であり,生成化合物の多様性も増大することがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular generation via deep learning models in combination with
reinforcement learning is a powerful way of generating proposed molecules with
desirable properties. By defining a multi-objective scoring function, it is
possible to generate thousands of ideas for molecules that scores well, which
makes the approach interesting for drug discovery or material science purposes.
However, if the scoring function is expensive regarding resources, such as time
or computation, the high number of function evaluations needed for feedback in
the reinforcement learning loop becomes a bottleneck. Here we propose to use
double-loop reinforcement learning with simplified molecular line entry system
(SMILES) augmentation to use scoring calculations more efficiently and arrive
at well scoring molecules faster. By adding an inner loop where the SMILES
strings generated are augmented to alternative non-canonical SMILES and used
for additional rounds of reinforcement learning, we can effectively reuse the
scoring calculations that are done on the molecular level. This approach speeds
up the learning process regarding scoring function calls, as well as it
protects moderately against mode collapse. We find that augmentation repeats
between 5-10x seem safe for most scoring functions and additionally increase
the diversity of the generated compounds, as well as making the sampling runs
of chemical space more reproducible
- Abstract(参考訳): 強化学習と組み合わせたディープラーニングモデルによる分子生成は、望ましい性質を持つ提案分子を生成する強力な方法である。
多目的スコアリング関数を定義することにより、よくスコアする分子に対する数千のアイデアを生成できるため、このアプローチは薬物発見や物質科学の目的のために興味深いものとなる。
しかし、時間や計算などの資源に関してスコアリング関数が高価であれば、強化学習ループでのフィードバックに必要な関数評価の数がボトルネックとなる。
本稿では,分子線入力システム(SMILES)を簡略化した二重ループ強化学習を用いて,スコアリング計算をより効率的に利用し,より高速なスコアリング分子に到達することを提案する。
SMILES文字列を生成する内部ループを他の非標準SMILESに拡張し、追加の強化学習ラウンドに使用することにより、分子レベルで行われるスコアリング計算を効果的に再利用することができる。
このアプローチは、スコアリング関数呼び出しに関する学習プロセスを高速化し、モード崩壊に対して適度に保護する。
5~10倍の増量繰り返しは、ほとんどのスコアリング機能にとって安全であり、生成する化合物の多様性を増し、化学空間のサンプリングを再現しやすくする。
関連論文リスト
- Generating $π$-Functional Molecules Using STGG+ with Active Learning [31.421181317988093]
この研究は、最先端の教師付き学習手法STGG+をアクティブな学習ループに統合する。
有機材料設計にSTGG+ALを適用する。
生成した分子は、時間依存密度汎関数理論で検証され、理化される。
論文 参考訳(メタデータ) (2025-02-20T18:52:42Z) - Diversity-Aware Reinforcement Learning for de novo Drug Design [2.356290293311623]
事前訓練された生成モデルの微調整は、有望な薬物分子の生成に優れた性能を示した。
報酬関数の適応的更新機構が生成分子の多様性にどのように影響するかは研究されていない。
我々の実験は、構造と予測に基づく手法を組み合わせることで、一般的に分子多様性の点でより良い結果が得られることを示した。
論文 参考訳(メタデータ) (2024-10-14T12:25:23Z) - Zero Shot Molecular Generation via Similarity Kernels [0.6597195879147557]
ゼロショット分子生成の新しい手法である類似性に基づく分子生成(SiMGen)を提案する。
SiMGenは時間依存の類似性カーネルと事前訓練された機械学習力場からの記述子を組み合わせて分子を生成する。
また、ユーザがSiMGenで構造をオンラインで生成できるインタラクティブなWebツールもリリースしました。
論文 参考訳(メタデータ) (2024-02-13T17:53:44Z) - Attention Based Molecule Generation via Hierarchical Variational Autoencoder [0.0]
ニューラルネットワークと畳み込みネットワークを階層的に組み合わせることで,SMILES文字列から自己回帰情報を抽出できることを示す。
これにより、既知の分子を再構成する際に95%のオーダーで非常に高い妥当性を持つ世代が生まれる。
論文 参考訳(メタデータ) (2024-01-18T21:45:12Z) - Utilizing Reinforcement Learning for de novo Drug Design [2.5740778707024305]
ド・ノボ薬物設計のための強化学習のための統一的な枠組みを開発する。
我々は、RNNベースのポリシーを学ぶために、様々なオン・オフ・ポリシー強化学習アルゴリズムとリプレイバッファについて研究する。
以上の結果から,少なくともトップスカラー分子とロースカラー分子の両方を用いる方が,ポリシー更新に有利であることが示唆された。
論文 参考訳(メタデータ) (2023-03-30T07:40:50Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Improving RNA Secondary Structure Design using Deep Reinforcement
Learning [69.63971634605797]
本稿では,RNA配列設計に強化学習を適用した新しいベンチマークを提案する。このベンチマークでは,目的関数を配列の二次構造における自由エネルギーとして定義する。
本稿では,これらのアルゴリズムに対して行うアブレーション解析の結果と,バッチ間でのアルゴリズムの性能を示すグラフを示す。
論文 参考訳(メタデータ) (2021-11-05T02:54:06Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。