論文の概要: Retrieval-based Controllable Molecule Generation
- arxiv url: http://arxiv.org/abs/2208.11126v1
- Date: Tue, 23 Aug 2022 17:01:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-25 13:21:38.316517
- Title: Retrieval-based Controllable Molecule Generation
- Title(参考訳): 検索に基づく制御可能な分子生成
- Authors: Zichao Wang, Weili Nie, Zhuoran Qiao, Chaowei Xiao, Richard Baraniuk,
Anima Anandkumar
- Abstract要約: 制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
- 参考スコア(独自算出の注目度): 63.44583084888342
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating new molecules with specified chemical and biological properties
via generative models has emerged as a promising direction for drug discovery.
However, existing methods require extensive training/fine-tuning with a large
dataset, often unavailable in real-world generation tasks. In this work, we
propose a new retrieval-based framework for controllable molecule generation.
We use a small set of exemplar molecules, i.e., those that (partially) satisfy
the design criteria, to steer the pre-trained generative model towards
synthesizing molecules that satisfy the given design criteria. We design a
retrieval mechanism that retrieves and fuses the exemplar molecules with the
input molecule, which is trained by a new self-supervised objective that
predicts the nearest neighbor of the input molecule. We also propose an
iterative refinement process to dynamically update the generated molecules and
retrieval database for better generalization. Our approach is agnostic to the
choice of generative models and requires no task-specific fine-tuning. On
various tasks ranging from simple design criteria to a challenging real-world
scenario for designing lead compounds that bind to the SARS-CoV-2 main
protease, we demonstrate our approach extrapolates well beyond the retrieval
database, and achieves better performance and wider applicability than previous
methods.
- Abstract(参考訳): 生成モデルによる特定の化学的および生物学的性質を持つ新規分子の生成は、薬物発見の有望な方向として現れている。
しかし、既存の手法では大規模なデータセットで広範なトレーニング/微調整が必要で、実世界の生成タスクでは利用できないことが多い。
本研究では,制御可能な分子生成のための新しい検索ベースフレームワークを提案する。
設計基準を満たす分子の小さな集合、すなわち(部分的に)設計基準を満たす分子を用いて、与えられた設計基準を満たす分子の合成に向けて事前訓練された生成モデルを操る。
入力分子を抽出・融合する検索機構を設計し, 入力分子に最も近い近傍を予測できる新たな自己制御的目的によって訓練する。
また, 生成分子と検索データベースを動的に更新し, さらなる一般化を実現するための反復的改良プロセスを提案する。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
簡単な設計基準からSARS-CoV-2主プロテアーゼに結合する鉛化合物を設計するための挑戦的な現実シナリオまで、様々なタスクにおいて、本手法は検索データベースをはるかに超越し、従来の手法よりも優れた性能と適用性を実現する。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - ControlMol: Adding Substruture Control To Molecule Diffusion Models [2.8372258697984627]
拡散モデルを用いた分子生成にサブ構造制御を加える制御Molを提案する。
本手法を2次元および3次元分子生成タスクに適用する。
論文 参考訳(メタデータ) (2024-04-22T14:36:19Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - CELLS: Cost-Effective Evolution in Latent Space for Goal-Directed
Molecular Generation [23.618366377098614]
本稿では,分子潜在表現ベクトルを最適化した遅延空間におけるコスト効率のよい進化戦略を提案する。
我々は、潜伏空間と観測空間をマッピングするために、事前訓練された分子生成モデルを採用する。
提案手法といくつかの高度な手法を比較した複数の最適化タスクについて広範な実験を行った。
論文 参考訳(メタデータ) (2021-11-30T11:02:18Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z) - Scaffold-constrained molecular generation [0.0]
SMILESをベースとしたリカレントニューラルネットワーク(Recurrent Neural Network, RNN)生成モデルを構築し, 足場制約付き生成を実現するため, サンプリング手法を改良した。
本稿では,様々なタスクにおいて足場制約付き生成を行う手法について紹介する。
論文 参考訳(メタデータ) (2020-09-15T15:41:18Z) - Learning To Navigate The Synthetically Accessible Chemical Space Using
Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。
このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。
本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-04-26T21:40:03Z) - The Synthesizability of Molecules Proposed by Generative Models [3.032184156362992]
機能性分子の発見は高価で時間を要するプロセスである。
初期の薬物発見への関心が高まる技術のひとつに、デ・ノボの分子生成と最適化がある。
これらの手法は、多目的関数の最大化を目的とした新しい分子構造を示唆することができる。
しかし、これらのアプローチの実用性は、合成可能性の無知によって汚される。
論文 参考訳(メタデータ) (2020-02-17T15:41:28Z) - Improving Molecular Design by Stochastic Iterative Target Augmentation [38.44457632751997]
分子設計における生成モデルは、豊かにパラメータ化され、データハングリーなニューラルモデルである。
分子標的を反復的に生成するための驚くほど効果的な自己学習手法を提案する。
我々の手法は、条件分子設計におけるこれまでの最先端技術よりも10%以上の絶対ゲインを達成している。
論文 参考訳(メタデータ) (2020-02-11T22:40:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。