論文の概要: Navigating the Design Space of Equivariant Diffusion-Based Generative
Models for De Novo 3D Molecule Generation
- arxiv url: http://arxiv.org/abs/2309.17296v1
- Date: Fri, 29 Sep 2023 14:53:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-02 13:13:57.715310
- Title: Navigating the Design Space of Equivariant Diffusion-Based Generative
Models for De Novo 3D Molecule Generation
- Title(参考訳): 等変拡散に基づくデ・ノボ3次元分子生成モデルの設計空間の探索
- Authors: Tuan Le, Julian Cremer, Frank No\'e, Djork-Arn\'e Clevert, Kristof
Sch\"utt
- Abstract要約: 本稿では,QM9 と GEOM-Drugs データセット上で確立されたモデルの性能を大幅に上回る EQGAT-diff モデルを提案する。
限られたトレーニングデータに適用可能な拡散モデルをさらに強化するために,大規模なPubChem3DデータセットでトレーニングされたEQGAT-diffの転送可能性を検討する。
複雑な分子の小さなデータセットの生成モデルの精度が重要となる構造に基づく薬物設計の応用が期待できる。
- 参考スコア(独自算出の注目度): 1.3124513975412255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep generative diffusion models are a promising avenue for de novo 3D
molecular design in material science and drug discovery. However, their utility
is still constrained by suboptimal performance with large molecular structures
and limited training data. Addressing this gap, we explore the design space of
E(3) equivariant diffusion models, focusing on previously blank spots. Our
extensive comparative analysis evaluates the interplay between continuous and
discrete state spaces. Out of this investigation, we introduce the EQGAT-diff
model, which consistently surpasses the performance of established models on
the QM9 and GEOM-Drugs datasets by a large margin. Distinctively, EQGAT-diff
takes continuous atomic positions while chemical elements and bond types are
categorical and employ a time-dependent loss weighting that significantly
increases training convergence and the quality of generated samples. To further
strengthen the applicability of diffusion models to limited training data, we
examine the transferability of EQGAT-diff trained on the large PubChem3D
dataset with implicit hydrogens to target distributions with explicit
hydrogens. Fine-tuning EQGAT-diff for a couple of iterations further pushes
state-of-the-art performance across datasets. We envision that our findings
will find applications in structure-based drug design, where the accuracy of
generative models for small datasets of complex molecules is critical.
- Abstract(参考訳): 深部生成拡散モデル(deep generative diffusion model)は、物質科学と創薬におけるde novo 3d分子設計の有望な道である。
しかし、それらの実用性は、大きな分子構造と限られた訓練データを持つ最適以下の性能に制約されている。
このギャップに対処するため、前述した空白点に着目して、E(3)同変拡散モデルの設計空間を探索する。
我々は,連続状態空間と離散状態空間の相互作用を評価する。
本研究では,QM9 および GEOM-Drugs データセットにおける確立されたモデルの性能を常に上回る EQGAT-diff モデルを提案する。
比例的に、EQGAT-diffは、化学元素と結合タイプがカテゴリー的であり、トレーニング収束と生成サンプルの品質を著しく向上させる時間依存的な損失重み付けを用いる。
限られたトレーニングデータに対する拡散モデルの適用性をさらに高めるため,暗黙の水素を用いたPubChem3Dデータセット上でトレーニングされたEQGAT-diffの移動可能性について検討した。
数イテレーションの微調整EQGAT-diffは、データセット間の最先端のパフォーマンスをさらに押し上げる。
我々は、複雑な分子の小さなデータセットに対する生成モデルの精度が重要な構造に基づく薬物設計の応用を見出すことを期待している。
関連論文リスト
- Exploring Discrete Flow Matching for 3D De Novo Molecule Generation [0.0]
フローマッチングは、最近提案されたジェネレーティブモデリングフレームワークで、様々なタスクにおいて印象的なパフォーマンスを実現している。
本稿では,既存の手法よりも学習可能なパラメータが少ない3D de novo設計における技術性能の状態を達成した,オープンソースのFlowMol-CTMCを提案する。
論文 参考訳(メタデータ) (2024-11-25T18:27:39Z) - Bridging the Gap between Learning and Inference for Diffusion-Based Molecule Generation [18.936142688346816]
GapDiffは、トレーニングと推論の間のデータ分散の相違を緩和するトレーニングフレームワークである。
我々は,CrossDocked 2020データセット上で3次元分子生成モデルを用いて実験を行った。
論文 参考訳(メタデータ) (2024-11-08T10:53:39Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - Aligning Target-Aware Molecule Diffusion Models with Exact Energy Optimization [147.7899503829411]
AliDiffは、事前訓練されたターゲット拡散モデルと望ましい機能特性を整合させる新しいフレームワークである。
最先端の結合エネルギーを持つ分子を最大7.07 Avg. Vina Scoreで生成することができる。
論文 参考訳(メタデータ) (2024-07-01T06:10:29Z) - DecompDiff: Diffusion Models with Decomposed Priors for Structure-Based Drug Design [62.68420322996345]
既存の構造に基づく薬物設計法は、すべての配位子原子を等しく扱う。
腕と足場を分解した新しい拡散モデルDecompDiffを提案する。
提案手法は,高親和性分子の生成における最先端性能を実現する。
論文 参考訳(メタデータ) (2024-02-26T05:21:21Z) - Learning Joint 2D & 3D Diffusion Models for Complete Molecule Generation [32.66694406638287]
本研究では, 原子型, 正式な電荷, 結合情報, および3次元座標を持つ分子を生成する結合2Dおよび3D拡散モデル(JODO)を提案する。
我々のモデルは、単一または複数の量子特性をターゲットにした逆分子設計のために拡張することもできる。
論文 参考訳(メタデータ) (2023-05-21T04:49:53Z) - Structure-based Drug Design with Equivariant Diffusion Models [40.73626627266543]
本稿では,タンパク質ポケットに新しい条件を付加したSE(3)-同変拡散モデルDiffSBDDを提案する。
我々のサイリコ実験では、DiffSBDDが地上の真実データの統計を効果的に捉えていることが示されています。
これらの結果は、拡散モデルが従来の方法よりも正確に構造データの複雑な分布を表すという仮定を支持する。
論文 参考訳(メタデータ) (2022-10-24T15:51:21Z) - A Survey on Generative Diffusion Model [75.93774014861978]
拡散モデルは、深層生成モデルの新たなクラスである。
時間を要する反復生成過程や高次元ユークリッド空間への閉じ込めなど、いくつかの制限がある。
本調査では,拡散モデルの向上を目的とした高度な手法を多数提示する。
論文 参考訳(メタデータ) (2022-09-06T16:56:21Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z) - Equivariant Diffusion for Molecule Generation in 3D [74.289191525633]
この研究は、ユークリッド変換に同値な3次元の分子計算生成のための拡散モデルを導入する。
提案手法は, 従来の3次元分子生成法に比べて, 生成した試料の品質と訓練時の効率を著しく向上させる。
論文 参考訳(メタデータ) (2022-03-31T12:52:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。