論文の概要: Navigating the Design Space of Equivariant Diffusion-Based Generative
Models for De Novo 3D Molecule Generation
- arxiv url: http://arxiv.org/abs/2309.17296v2
- Date: Fri, 24 Nov 2023 16:08:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 03:15:26.594952
- Title: Navigating the Design Space of Equivariant Diffusion-Based Generative
Models for De Novo 3D Molecule Generation
- Title(参考訳): 等変拡散に基づくデ・ノボ3次元分子生成モデルの設計空間の探索
- Authors: Tuan Le, Julian Cremer, Frank No\'e, Djork-Arn\'e Clevert, Kristof
Sch\"utt
- Abstract要約: 深部生成拡散モデル(Deep Generative diffusion model)は、材料科学と薬物発見における3D de novo分子設計のための有望な道である。
E(3)-同変拡散モデルの設計空間を探索し、未探索領域に焦点をあてる。
本稿では,QM9データセットとGEOM-Drugsデータセットの確立したモデルよりも一貫して優れるEQGAT-diffモデルを提案する。
- 参考スコア(独自算出の注目度): 1.3124513975412255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep generative diffusion models are a promising avenue for 3D de novo
molecular design in materials science and drug discovery. However, their
utility is still limited by suboptimal performance on large molecular
structures and limited training data. To address this gap, we explore the
design space of E(3)-equivariant diffusion models, focusing on previously
unexplored areas. Our extensive comparative analysis evaluates the interplay
between continuous and discrete state spaces. From this investigation, we
present the EQGAT-diff model, which consistently outperforms established models
for the QM9 and GEOM-Drugs datasets. Significantly, EQGAT-diff takes continuous
atom positions, while chemical elements and bond types are categorical and uses
time-dependent loss weighting, substantially increasing training convergence,
the quality of generated samples, and inference time. We also showcase that
including chemically motivated additional features like hybridization states in
the diffusion process enhances the validity of generated molecules. To further
strengthen the applicability of diffusion models to limited training data, we
investigate the transferability of EQGAT-diff trained on the large PubChem3D
dataset with implicit hydrogen atoms to target different data distributions.
Fine-tuning EQGAT-diff for just a few iterations shows an efficient
distribution shift, further improving performance throughout data sets.
Finally, we test our model on the Crossdocked data set for structure-based de
novo ligand generation, underlining the importance of our findings showing
state-of-the-art performance on Vina docking scores.
- Abstract(参考訳): 深部生成拡散モデル(Deep Generative diffusion model)は、材料科学と薬物発見における3D de novo分子設計のための有望な道である。
しかし、その有用性は、大きな分子構造と限られたトレーニングデータに対する最適化性能によって制限されている。
このギャップに対処するため、E(3)-同変拡散モデルの設計空間を探索し、未探索領域に焦点をあてる。
我々は,連続状態空間と離散状態空間の相互作用を評価する。
本研究では,QM9データセットとGEOM-Drugsデータセットの確立したモデルよりも一貫して優れるEQGAT-diffモデルを提案する。
重要な点として、eqgat-diffは連続原子の位置を取るが、化学元素と結合タイプは分類され、時間依存の損失重み付け、トレーニング収束の大幅な増加、生成したサンプルの品質、推論時間を用いる。
また, 拡散過程におけるハイブリダイゼーション状態などの化学的特徴を含め, 生成分子の妥当性が向上することを示した。
限られたトレーニングデータに対する拡散モデルの適用性をさらに強化するため,暗黙の水素原子を用いたPubChem3DデータセットでトレーニングしたEQGAT-diffの転送可能性について検討した。
ほんの数イテレーションの微調整EQGAT-diffは、効率的な分散シフトを示し、データセット全体のパフォーマンスをさらに向上させる。
最後に,構造に基づくde novoリガンド生成のためのクロスドッキングデータセット上でのモデルテストを行い,vinaドッキングスコアの最先端性能を示す結果の重要性について概説した。
関連論文リスト
- Exploring Discrete Flow Matching for 3D De Novo Molecule Generation [0.0]
フローマッチングは、最近提案されたジェネレーティブモデリングフレームワークで、様々なタスクにおいて印象的なパフォーマンスを実現している。
本稿では,既存の手法よりも学習可能なパラメータが少ない3D de novo設計における技術性能の状態を達成した,オープンソースのFlowMol-CTMCを提案する。
論文 参考訳(メタデータ) (2024-11-25T18:27:39Z) - Bridging the Gap between Learning and Inference for Diffusion-Based Molecule Generation [18.936142688346816]
GapDiffは、トレーニングと推論の間のデータ分散の相違を緩和するトレーニングフレームワークである。
我々は,CrossDocked 2020データセット上で3次元分子生成モデルを用いて実験を行った。
論文 参考訳(メタデータ) (2024-11-08T10:53:39Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - Aligning Target-Aware Molecule Diffusion Models with Exact Energy Optimization [147.7899503829411]
AliDiffは、事前訓練されたターゲット拡散モデルと望ましい機能特性を整合させる新しいフレームワークである。
最先端の結合エネルギーを持つ分子を最大7.07 Avg. Vina Scoreで生成することができる。
論文 参考訳(メタデータ) (2024-07-01T06:10:29Z) - DecompDiff: Diffusion Models with Decomposed Priors for Structure-Based Drug Design [62.68420322996345]
既存の構造に基づく薬物設計法は、すべての配位子原子を等しく扱う。
腕と足場を分解した新しい拡散モデルDecompDiffを提案する。
提案手法は,高親和性分子の生成における最先端性能を実現する。
論文 参考訳(メタデータ) (2024-02-26T05:21:21Z) - Learning Joint 2D & 3D Diffusion Models for Complete Molecule Generation [32.66694406638287]
本研究では, 原子型, 正式な電荷, 結合情報, および3次元座標を持つ分子を生成する結合2Dおよび3D拡散モデル(JODO)を提案する。
我々のモデルは、単一または複数の量子特性をターゲットにした逆分子設計のために拡張することもできる。
論文 参考訳(メタデータ) (2023-05-21T04:49:53Z) - Structure-based Drug Design with Equivariant Diffusion Models [40.73626627266543]
本稿では,タンパク質ポケットに新しい条件を付加したSE(3)-同変拡散モデルDiffSBDDを提案する。
我々のサイリコ実験では、DiffSBDDが地上の真実データの統計を効果的に捉えていることが示されています。
これらの結果は、拡散モデルが従来の方法よりも正確に構造データの複雑な分布を表すという仮定を支持する。
論文 参考訳(メタデータ) (2022-10-24T15:51:21Z) - A Survey on Generative Diffusion Model [75.93774014861978]
拡散モデルは、深層生成モデルの新たなクラスである。
時間を要する反復生成過程や高次元ユークリッド空間への閉じ込めなど、いくつかの制限がある。
本調査では,拡散モデルの向上を目的とした高度な手法を多数提示する。
論文 参考訳(メタデータ) (2022-09-06T16:56:21Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z) - Equivariant Diffusion for Molecule Generation in 3D [74.289191525633]
この研究は、ユークリッド変換に同値な3次元の分子計算生成のための拡散モデルを導入する。
提案手法は, 従来の3次元分子生成法に比べて, 生成した試料の品質と訓練時の効率を著しく向上させる。
論文 参考訳(メタデータ) (2022-03-31T12:52:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。