論文の概要: Augmenting Molecular Deep Generative Models with Topological Data
Analysis Representations
- arxiv url: http://arxiv.org/abs/2106.04464v1
- Date: Tue, 8 Jun 2021 15:49:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-09 15:33:53.321289
- Title: Augmenting Molecular Deep Generative Models with Topological Data
Analysis Representations
- Title(参考訳): トポロジカルデータ解析を用いた分子深部生成モデルの拡張
- Authors: Yair Schiff, Vijil Chenthamarakshan, Samuel Hoffman, Karthikeyan
Natesan Ramamurthy, Payel Das
- Abstract要約: 分子のトポロジカルデータ解析(TDA)表現を付加したSMILES変分自動エンコーダ(VAE)を提案する。
実験の結果, このTDA拡張により, SMILES VAEは3次元幾何学と電子特性の複雑な関係を捉えることができることがわかった。
- 参考スコア(独自算出の注目度): 21.237758981760784
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep generative models have emerged as a powerful tool for learning
informative molecular representations and designing novel molecules with
desired properties, with applications in drug discovery and material design.
Deep generative auto-encoders defined over molecular SMILES strings have been a
popular choice for that purpose. However, capturing salient molecular
properties like quantum-chemical energies remains challenging and requires
sophisticated neural net models of molecular graphs or geometry-based
information. As a simpler and more efficient alternative, we present a SMILES
Variational Auto-Encoder (VAE) augmented with topological data analysis (TDA)
representations of molecules, known as persistence images. Our experiments show
that this TDA augmentation enables a SMILES VAE to capture the complex relation
between 3D geometry and electronic properties, and allows generation of novel,
diverse, and valid molecules with geometric features consistent with the
training data, which exhibit a varying range of global electronic structural
properties, such as a small HOMO-LUMO gap - a critical property for designing
organic solar cells. We demonstrate that our TDA augmentation yields better
success in downstream tasks compared to models trained without these
representations and can assist in targeted molecule discovery.
- Abstract(参考訳): 深層生成モデルは、情報的分子表現を学習し、望ましい性質を持つ新規分子を設計するための強力なツールとして登場し、薬物発見と材料設計に応用されている。
分子SMILES文字列上で定義された深い自己エンコーダは、その目的のために一般的な選択である。
しかし、量子化学エネルギーのような有能な分子特性を捉えることは依然として困難であり、分子グラフや幾何学に基づく情報の洗練されたニューラルネットモデルを必要とする。
SMILES変分自動エンコーダ (VAE) に, 永続画像として知られる分子のトポロジカルデータ解析 (TDA) 表現を付加する手法を提案する。
この実験により, SMILES VAEは3次元幾何学と電子物性の複雑な関係を捉えることができ, 有機太陽電池の設計における重要な特性であるHOMO-LUMOギャップなど, 様々なグローバル電子構造特性を示す, トレーニングデータと整合した幾何学的特徴を持つ新規, 多様性, 有効分子の生成を可能にした。
我々のTDA増強は、これらの表現なしで訓練されたモデルと比較して下流タスクにおいてより良い成功をもたらし、標的となる分子発見を支援することを実証する。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - SE3Set: Harnessing equivariant hypergraph neural networks for molecular representation learning [27.713870291922333]
分子表現学習に適したSE(3)同変ハイパーグラフニューラルネットワークアーキテクチャを開発した。
SE3Setは、小さな分子データセットのための最先端(SOTA)モデルと同等のパフォーマンスを示している。
MD22データセットを上回り、全ての分子で約20%の精度で顕著な改善を達成している。
論文 参考訳(メタデータ) (2024-05-26T10:43:16Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - Geometry-Complete Diffusion for 3D Molecule Generation and Optimization [3.8366697175402225]
3次元分子生成のための幾何-完全拡散モデル(GCDM)を導入する。
GCDMは、既存の3次元分子拡散モデルよりも条件および非条件設定間で大きなマージンで優れている。
また、GCDMの幾何学的特徴は、既存の3次元分子の幾何学的および化学組成を一貫して最適化するために再利用可能であることも示している。
論文 参考訳(メタデータ) (2023-02-08T20:01:51Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Dynamic Molecular Graph-based Implementation for Biophysical Properties
Prediction [9.112532782451233]
本稿では,タンパク質-リガンド相互作用の動的特徴を特徴付けるため,GNNを用いたトランスフォーマーモデルに基づく新しいアプローチを提案する。
我々のメッセージパッシングトランスフォーマーは、物理シミュレーションに基づく分子動力学データに基づいて事前訓練を行い、座標構成を学習し、結合確率と親和性予測を行う。
論文 参考訳(メタデータ) (2022-12-20T04:21:19Z) - Interpretable Molecular Graph Generation via Monotonic Constraints [19.401468196146336]
ディープグラフ生成モデルは、分子設計をグラフ生成問題として扱う。
既存のモデルには多くの欠点があり、解釈性や所望の分子特性に対する制御性が低い。
本稿では,分子生成の解釈可能なモデルと深層制御可能なモデルを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T08:35:56Z) - Learning Neural Generative Dynamics for Molecular Conformation
Generation [89.03173504444415]
分子グラフから分子コンフォメーション(つまり3d構造)を生成する方法を検討した。
分子グラフから有効かつ多様なコンフォーメーションを生成する新しい確率論的枠組みを提案する。
論文 参考訳(メタデータ) (2021-02-20T03:17:58Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。