論文の概要: Navigating the Design Space of Equivariant Diffusion-Based Generative
Models for De Novo 3D Molecule Generation
- arxiv url: http://arxiv.org/abs/2309.17296v2
- Date: Fri, 24 Nov 2023 16:08:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 03:15:26.594952
- Title: Navigating the Design Space of Equivariant Diffusion-Based Generative
Models for De Novo 3D Molecule Generation
- Title(参考訳): 等変拡散に基づくデ・ノボ3次元分子生成モデルの設計空間の探索
- Authors: Tuan Le, Julian Cremer, Frank No\'e, Djork-Arn\'e Clevert, Kristof
Sch\"utt
- Abstract要約: 深部生成拡散モデル(Deep Generative diffusion model)は、材料科学と薬物発見における3D de novo分子設計のための有望な道である。
E(3)-同変拡散モデルの設計空間を探索し、未探索領域に焦点をあてる。
本稿では,QM9データセットとGEOM-Drugsデータセットの確立したモデルよりも一貫して優れるEQGAT-diffモデルを提案する。
- 参考スコア(独自算出の注目度): 1.3124513975412255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep generative diffusion models are a promising avenue for 3D de novo
molecular design in materials science and drug discovery. However, their
utility is still limited by suboptimal performance on large molecular
structures and limited training data. To address this gap, we explore the
design space of E(3)-equivariant diffusion models, focusing on previously
unexplored areas. Our extensive comparative analysis evaluates the interplay
between continuous and discrete state spaces. From this investigation, we
present the EQGAT-diff model, which consistently outperforms established models
for the QM9 and GEOM-Drugs datasets. Significantly, EQGAT-diff takes continuous
atom positions, while chemical elements and bond types are categorical and uses
time-dependent loss weighting, substantially increasing training convergence,
the quality of generated samples, and inference time. We also showcase that
including chemically motivated additional features like hybridization states in
the diffusion process enhances the validity of generated molecules. To further
strengthen the applicability of diffusion models to limited training data, we
investigate the transferability of EQGAT-diff trained on the large PubChem3D
dataset with implicit hydrogen atoms to target different data distributions.
Fine-tuning EQGAT-diff for just a few iterations shows an efficient
distribution shift, further improving performance throughout data sets.
Finally, we test our model on the Crossdocked data set for structure-based de
novo ligand generation, underlining the importance of our findings showing
state-of-the-art performance on Vina docking scores.
- Abstract(参考訳): 深部生成拡散モデル(Deep Generative diffusion model)は、材料科学と薬物発見における3D de novo分子設計のための有望な道である。
しかし、その有用性は、大きな分子構造と限られたトレーニングデータに対する最適化性能によって制限されている。
このギャップに対処するため、E(3)-同変拡散モデルの設計空間を探索し、未探索領域に焦点をあてる。
我々は,連続状態空間と離散状態空間の相互作用を評価する。
本研究では,QM9データセットとGEOM-Drugsデータセットの確立したモデルよりも一貫して優れるEQGAT-diffモデルを提案する。
重要な点として、eqgat-diffは連続原子の位置を取るが、化学元素と結合タイプは分類され、時間依存の損失重み付け、トレーニング収束の大幅な増加、生成したサンプルの品質、推論時間を用いる。
また, 拡散過程におけるハイブリダイゼーション状態などの化学的特徴を含め, 生成分子の妥当性が向上することを示した。
限られたトレーニングデータに対する拡散モデルの適用性をさらに強化するため,暗黙の水素原子を用いたPubChem3DデータセットでトレーニングしたEQGAT-diffの転送可能性について検討した。
ほんの数イテレーションの微調整EQGAT-diffは、効率的な分散シフトを示し、データセット全体のパフォーマンスをさらに向上させる。
最後に,構造に基づくde novoリガンド生成のためのクロスドッキングデータセット上でのモデルテストを行い,vinaドッキングスコアの最先端性能を示す結果の重要性について概説した。
関連論文リスト
- Discrete Diffusion Modeling by Estimating the Ratios of the Data
Distribution [76.33705947080871]
離散空間に対するスコアマッチングを自然に拡張する新たな損失として,スコアエントロピーを提案する。
標準言語モデリングタスク上で,Score Entropy Discrete Diffusionモデルをテストする。
論文 参考訳(メタデータ) (2023-10-25T17:59:12Z) - Learning Joint 2D & 3D Diffusion Models for Complete Molecule Generation [32.66694406638287]
本研究では, 原子型, 正式な電荷, 結合情報, および3次元座標を持つ分子を生成する結合2Dおよび3D拡散モデル(JODO)を提案する。
我々のモデルは、単一または複数の量子特性をターゲットにした逆分子設計のために拡張することもできる。
論文 参考訳(メタデータ) (2023-05-21T04:49:53Z) - Geometric Latent Diffusion Models for 3D Molecule Generation [172.15028281732737]
生成モデル、特に拡散モデル(DM)は、特徴豊富な測地を生成する上で有望な結果を得た。
我々はGeoLDM(Geometric Latent Diffusion Models)と呼ばれる新しい3次元分子生成法を提案する。
論文 参考訳(メタデータ) (2023-05-02T01:07:22Z) - 3D Equivariant Diffusion for Target-Aware Molecule Generation and
Affinity Prediction [9.67574543046801]
標的薬物設計における3D構造の導入は、他の標的のないモデルよりも優れた性能を示す。
上記の課題を解決するために,3次元同変拡散モデルを開発した。
我々のモデルは、より現実的な3D構造とタンパク質標的に対する親和性を持つ分子を生成し、再学習することなく結合親和性ランキングと予測を改善することができる。
論文 参考訳(メタデータ) (2023-03-06T23:01:43Z) - Structure-based Drug Design with Equivariant Diffusion Models [43.12251246600906]
DiffSBDDを構造ベースドラッグデザインのための3次元条件生成問題として定式化する。
サイリコ実験の包括的理解は、競争力のあるドッキングを伴う新規で多様な薬物様のドッキングを生成する上で、DiffSBDDの有効性と有効性を示す。
さらに,薬品デザインキャンペーンにおける幅広いタスクに対する拡散フレームワークの柔軟性について検討する。
論文 参考訳(メタデータ) (2022-10-24T15:51:21Z) - A Survey on Generative Diffusion Model [75.93774014861978]
拡散モデルは、深層生成モデルの新たなクラスである。
時間を要する反復生成過程や高次元ユークリッド空間への閉じ込めなど、いくつかの制限がある。
本調査では,拡散モデルの向上を目的とした高度な手法を多数提示する。
論文 参考訳(メタデータ) (2022-09-06T16:56:21Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z) - Equivariant Diffusion for Molecule Generation in 3D [74.289191525633]
この研究は、ユークリッド変換に同値な3次元の分子計算生成のための拡散モデルを導入する。
提案手法は, 従来の3次元分子生成法に比べて, 生成した試料の品質と訓練時の効率を著しく向上させる。
論文 参考訳(メタデータ) (2022-03-31T12:52:25Z) - Augmenting Molecular Deep Generative Models with Topological Data
Analysis Representations [21.237758981760784]
分子のトポロジカルデータ解析(TDA)表現を付加したSMILES変分自動エンコーダ(VAE)を提案する。
実験の結果, このTDA拡張により, SMILES VAEは3次元幾何学と電子特性の複雑な関係を捉えることができることがわかった。
論文 参考訳(メタデータ) (2021-06-08T15:49:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。