論文の概要: Geometry-Complete Diffusion for 3D Molecule Generation and Optimization
- arxiv url: http://arxiv.org/abs/2302.04313v6
- Date: Fri, 24 May 2024 19:49:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 12:47:48.166525
- Title: Geometry-Complete Diffusion for 3D Molecule Generation and Optimization
- Title(参考訳): 3次元分子生成と最適化のための幾何-完備拡散
- Authors: Alex Morehead, Jianlin Cheng,
- Abstract要約: 3次元分子生成のための幾何-完全拡散モデル(GCDM)を導入する。
GCDMは、既存の3次元分子拡散モデルよりも条件および非条件設定間で大きなマージンで優れている。
また、GCDMの幾何学的特徴は、既存の3次元分子の幾何学的および化学組成を一貫して最適化するために再利用可能であることも示している。
- 参考スコア(独自算出の注目度): 3.8366697175402225
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Denoising diffusion probabilistic models (DDPMs) have pioneered new state-of-the-art results in disciplines such as computer vision and computational biology for diverse tasks ranging from text-guided image generation to structure-guided protein design. Along this latter line of research, methods have recently been proposed for generating 3D molecules using equivariant graph neural networks (GNNs) within a DDPM framework. However, such methods are unable to learn important geometric properties of 3D molecules, as they adopt molecule-agnostic and non-geometric GNNs as their 3D graph denoising networks, which notably hinders their ability to generate valid large 3D molecules. In this work, we address these gaps by introducing the Geometry-Complete Diffusion Model (GCDM) for 3D molecule generation, which outperforms existing 3D molecular diffusion models by significant margins across conditional and unconditional settings for the QM9 dataset and the larger GEOM-Drugs dataset, respectively, and generates more novel and unique unconditional 3D molecules for the QM9 dataset compared to previous methods. Importantly, we demonstrate that the geometry-complete denoising process of GCDM learned for 3D molecule generation enables the model to generate a significant proportion of valid and energetically-stable large molecules at the scale of GEOM-Drugs, whereas previous methods fail to do so with the features they learn. Additionally, we show that extensions of GCDM can not only effectively design 3D molecules for specific protein pockets but also that GCDM's geometric features can be repurposed to consistently optimize the geometry and chemical composition of existing 3D molecules for molecular stability and property specificity, demonstrating new versatility of molecular diffusion models. Our source code and data are freely available at https://github.com/BioinfoMachineLearning/Bio-Diffusion.
- Abstract(参考訳): 拡散確率モデル(DDPM)は、テキスト誘導画像生成から構造誘導タンパク質設計まで様々なタスクのためのコンピュータビジョンや計算生物学などの分野における新しい最先端の成果を開拓した。
この研究の後期の線に沿って、DDPMフレームワーク内で同変グラフニューラルネットワーク(GNN)を用いて3次元分子を生成する方法が最近提案されている。
しかし、これらの手法は分子に依存しない非幾何学的なGNNを3Dグラフの認知ネットワークとして採用しているため、重要な3D分子の幾何学的性質を習得することができない。
本研究では, 既存の3次元分子拡散モデルよりも, QM9データセットと大規模GEOM-Drugsデータセットの条件付きおよび非条件付き設定の差が大きい3次元分子拡散モデル(GCDM)を導入することにより, これらのギャップを解消し, 従来の方法と比較して, QM9データセットに対してより斬新でユニークな非条件付き3次元分子を生成する。
重要なことは、3次元分子生成のために学習されたGCDMの幾何完全分解過程により、GEOM-Drugsのスケールで有効でエネルギー的に安定な大分子のかなりの割合を生成できるのに対し、以前の手法は学習した特徴を達成できなかったことである。
さらに,GCDMの拡張は, 特定のタンパク質ポケットの3D分子を効果的に設計するだけでなく, 分子の安定性と特性特異性のために, 既存の3D分子の幾何学的および化学組成を常に最適化するためにGCDMの幾何学的特徴を再利用し, 分子拡散モデルの新たな汎用性を示す。
ソースコードとデータはhttps://github.com/BioinfoMachineLearning/Bio-Diffusion.comで無償公開しています。
関連論文リスト
- Diffusion Models in $\textit{De Novo}$ Drug Design [0.0]
拡散モデルは、特に3次元分子構造の文脈において、分子生成の強力なツールとして登場した。
本稿では,3次元分子生成に適した拡散モデルの技術的実装について述べる。
論文 参考訳(メタデータ) (2024-06-07T06:34:13Z) - Automated 3D Pre-Training for Molecular Property Prediction [54.15788181794094]
新たな3D事前学習フレームワーク(3D PGT)を提案する。
3D分子グラフのモデルを事前訓練し、3D構造のない分子グラフに微調整する。
提案した3次元PGTの精度, 効率, 一般化能力を示すために, 2次元分子グラフの大規模実験を行った。
論文 参考訳(メタデータ) (2023-06-13T14:43:13Z) - Geometric Latent Diffusion Models for 3D Molecule Generation [172.15028281732737]
生成モデル、特に拡散モデル(DM)は、特徴豊富な測地を生成する上で有望な結果を得た。
我々はGeoLDM(Geometric Latent Diffusion Models)と呼ばれる新しい3次元分子生成法を提案する。
論文 参考訳(メタデータ) (2023-05-02T01:07:22Z) - 3D Molecular Geometry Analysis with 2D Graphs [79.47097907673877]
分子の基底状態3次元ジオメトリは多くの分子解析タスクに必須である。
現代の量子力学的手法は正確な3次元幾何学を計算できるが、計算は禁じられている。
分子グラフから3次元幾何学を予測するための新しいディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-01T19:00:46Z) - MUDiff: Unified Diffusion for Complete Molecule Generation [104.7021929437504]
本稿では,原子の特徴,2次元離散分子構造,および3次元連続分子座標を含む分子の包括的表現を生成する新しいモデルを提案する。
拡散過程を認知するための新しいグラフトランスフォーマーアーキテクチャを提案する。
我々のモデルは、安定で多様な分子を設計するための有望なアプローチであり、分子モデリングの幅広いタスクに適用できる。
論文 参考訳(メタデータ) (2023-04-28T04:25:57Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - 3D Infomax improves GNNs for Molecular Property Prediction [1.9703625025720701]
本稿では,2次元分子グラフのみに与えられる分子の幾何学をモデル化するための事前学習モデルを提案する。
我々は,3次元事前学習が幅広い特性に対して大きな改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-08T13:30:49Z) - Augmenting Molecular Deep Generative Models with Topological Data
Analysis Representations [21.237758981760784]
分子のトポロジカルデータ解析(TDA)表現を付加したSMILES変分自動エンコーダ(VAE)を提案する。
実験の結果, このTDA拡張により, SMILES VAEは3次元幾何学と電子特性の複雑な関係を捉えることができることがわかった。
論文 参考訳(メタデータ) (2021-06-08T15:49:21Z) - GeoMol: Torsional Geometric Generation of Molecular 3D Conformer
Ensembles [60.12186997181117]
分子グラフからの分子の3Dコンホメーラーアンサンブルの予測は、化学情報学と薬物発見の領域において重要な役割を担っている。
既存の生成モデルは、重要な分子幾何学的要素のモデリングの欠如を含むいくつかの欠点がある。
エンド・ツー・エンド、非自己回帰、SE(3)不変の機械学習手法であるGeoMolを提案し、3Dコンバータを生成する。
論文 参考訳(メタデータ) (2021-06-08T14:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。