論文の概要: Improving Small Molecule Generation using Mutual Information Machine
- arxiv url: http://arxiv.org/abs/2208.09016v2
- Date: Wed, 29 Mar 2023 21:20:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-31 18:09:10.889072
- Title: Improving Small Molecule Generation using Mutual Information Machine
- Title(参考訳): 相互情報マシンによる微小分子生成の改善
- Authors: Danny Reidenbach and Micha Livne and Rajesh K. Ilango and Michelle
Gill and Johnny Israeli
- Abstract要約: MolMIMは、小さな分子の薬物発見のための確率論的オートエンコーダである。
有効性, 特異性, 新規性の観点から, MolMIM の優れた世代を実証した。
次に,CMA-ES, ナイーブなブラックボックスと勾配自由探索アルゴリズムを, プロパティ誘導分子最適化のタスクとして, MolMIM の潜在空間上で利用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We address the task of controlled generation of small molecules, which
entails finding novel molecules with desired properties under certain
constraints (e.g., similarity to a reference molecule). Here we introduce
MolMIM, a probabilistic auto-encoder for small molecule drug discovery that
learns an informative and clustered latent space. MolMIM is trained with Mutual
Information Machine (MIM) learning, and provides a fixed length representation
of variable length SMILES strings. Since encoder-decoder models can learn
representations with ``holes'' of invalid samples, here we propose a novel
extension to the training procedure which promotes a dense latent space, and
allows the model to sample valid molecules from random perturbations of latent
codes. We provide a thorough comparison of MolMIM to several variable-size and
fixed-size encoder-decoder models, demonstrating MolMIM's superior generation
as measured in terms of validity, uniqueness, and novelty. We then utilize
CMA-ES, a naive black-box and gradient free search algorithm, over MolMIM's
latent space for the task of property guided molecule optimization. We achieve
state-of-the-art results in several constrained single property optimization
tasks as well as in the challenging task of multi-objective optimization,
improving over previous success rate SOTA by more than 5\% . We attribute the
strong results to MolMIM's latent representation which clusters similar
molecules in the latent space, whereas CMA-ES is often used as a baseline
optimization method. We also demonstrate MolMIM to be favourable in a compute
limited regime, making it an attractive model for such cases.
- Abstract(参考訳): 我々は、特定の制約下で望ましい性質を持つ新規な分子(例えば、参照分子との類似性)を見つけることを伴う、小さな分子の制御的生成のタスクに対処する。
ここでは,情報的かつクラスタ化された潜伏空間を学習する小型分子ドラッグ発見のための確率論的オートエンコーダであるMolMIMを紹介する。
MolMIMはMultual Information Machine (MIM)学習で訓練され、可変長SMILES文字列の固定長表現を提供する。
エンコーダ・デコーダモデルは不正なサンプルの ‘holes'' で表現を学習できるため, 密集した潜在空間を促進する訓練手順を新たに拡張し, 潜在コードのランダムな摂動から有効な分子をサンプリングする手法を提案する。
そこで本研究では,M MolMIM といくつかの可変サイズおよび固定サイズエンコーダデコーダモデルとの徹底的な比較を行い,妥当性,特異性,新規性の観点から,M MolMIM の優れた世代を実証する。
次に,CMA-ES, ナイーブなブラックボックスと勾配自由探索アルゴリズムを, プロパティ誘導分子最適化のタスクとして, MolMIM の潜在空間上で利用する。
本研究では,複数の制約付き単一特性最適化タスクと多目的最適化の課題により,これまでの成功率sotaを52%以上向上させた。
CMA-ES はベースライン最適化法としてよく用いられるが,本手法は遅延空間で類似分子をクラスター化する MolMIM の潜在表現に強く寄与する。
また,計算リミット方式では,M MolMIM が好適であることが示され,そのような場合の魅力的なモデルとなっている。
関連論文リスト
- Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [77.50732023411811]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
TransDLMは標準化された化学命名法を分子の意味表現として利用し、プロパティ要求をテキスト記述に暗黙的に埋め込む。
提案手法は, 分子構造類似性を最適化し, ベンチマークデータセットの化学的特性を向上するための最先端手法を超越した手法である。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - Generative Modeling of Molecular Dynamics Trajectories [12.255021091552441]
データからMDの柔軟なマルチタスクサロゲートモデルを学ぶためのパラダイムとして,分子軌道の生成モデルを提案する。
このような生成モデルは,前方シミュレーションや遷移経路サンプリング,軌道上アップサンプリングといった多様なタスクに適応可能であることを示す。
論文 参考訳(メタデータ) (2024-09-26T13:02:28Z) - MolX: Enhancing Large Language Models for Molecular Learning with A Multi-Modal Extension [34.586861881519134]
タスクハンドリング能力の強い大規模言語モデル(LLM)は、様々な分野において顕著な進歩を見せている。
本研究は、分子をマルチモーダルな外部モジュール、すなわちMollXに装備することで、分子の理解能力を高めることを目的とする。
特に,分子の表現にSMILES文字列を直接使用する代わりに,特定のエンコーダを用いて,SMILES文字列と2次元分子グラフ表現の両方から微細な特徴を抽出する。
論文 参考訳(メタデータ) (2024-06-10T20:25:18Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Accelerating Black-Box Molecular Property Optimization by Adaptively
Learning Sparse Subspaces [0.0]
提案手法は,様々なベンチマークや実世界の問題において,既存のMPO手法よりも大幅に優れていることを示す。
具体的には,100ドル未満のクエリで100ドル以上の代替品の集合から,ほぼ最適分子を定期的に見つけることができることを示す。
論文 参考訳(メタデータ) (2024-01-02T18:34:29Z) - Empowering Molecule Discovery for Molecule-Caption Translation with Large Language Models: A ChatGPT Perspective [53.300288393173204]
大規模言語モデル(LLM)は、様々なクロスモーダルタスクにおいて顕著なパフォーマンスを示している。
本研究では,分子カプセル翻訳のためのインコンテキストFew-Shot Molecule Learningパラダイムを提案する。
分子理解とテキストベースの分子生成を含む分子キャプション翻訳におけるMollReGPTの有効性を評価する。
論文 参考訳(メタデータ) (2023-06-11T08:16:25Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - t-SMILES: A Scalable Fragment-based Molecular Representation Framework for De Novo Molecule Generation [9.116670221263753]
本研究では, t-SMILESと呼ばれる, フレキシブル, フラグメントベース, マルチスケールな分子表現フレームワークを提案する。
フラグメント化された分子グラフから生成された全二分木上で幅優先探索を行うことにより得られるSMILES型文字列を用いて分子を記述する。
従来のSMILES、DeepSMILES、SELFIES、ベースラインモデルをゴール指向タスクで大幅に上回っている。
論文 参考訳(メタデータ) (2023-01-04T21:41:01Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。