論文の概要: Molecule3D: A Benchmark for Predicting 3D Geometries from Molecular
Graphs
- arxiv url: http://arxiv.org/abs/2110.01717v1
- Date: Thu, 30 Sep 2021 22:09:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-10 09:17:41.289756
- Title: Molecule3D: A Benchmark for Predicting 3D Geometries from Molecular
Graphs
- Title(参考訳): Molecule3D:分子グラフから3次元ジオメトリを予測するベンチマーク
- Authors: Zhao Xu, Youzhi Luo, Xuan Zhang, Xinyi Xu, Yaochen Xie, Meng Liu,
Kaleb Dickerson, Cheng Deng, Maho Nakata, Shuiwang Ji
- Abstract要約: 我々は、約400万分子の正確な基底状態のジオメトリーを持つデータセットを含むMolecule3Dと呼ばれるベンチマークを開発する。
我々は3次元空間における原子と原子の対距離を予測する2つのベースライン法を実装した。
本手法は予測精度に匹敵する精度を達成できるが,計算コストははるかに小さい。
- 参考スコア(独自算出の注目度): 79.06686274377009
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graph neural networks are emerging as promising methods for modeling
molecular graphs, in which nodes and edges correspond to atoms and chemical
bonds, respectively. Recent studies show that when 3D molecular geometries,
such as bond lengths and angles, are available, molecular property prediction
tasks can be made more accurate. However, computing of 3D molecular geometries
requires quantum calculations that are computationally prohibitive. For
example, accurate calculation of 3D geometries of a small molecule requires
hours of computing time using density functional theory (DFT). Here, we propose
to predict the ground-state 3D geometries from molecular graphs using machine
learning methods. To make this feasible, we develop a benchmark, known as
Molecule3D, that includes a dataset with precise ground-state geometries of
approximately 4 million molecules derived from DFT. We also provide a set of
software tools for data processing, splitting, training, and evaluation, etc.
Specifically, we propose to assess the error and validity of predicted
geometries using four metrics. We implement two baseline methods that either
predict the pairwise distance between atoms or atom coordinates in 3D space.
Experimental results show that, compared with generating 3D geometries with
RDKit, our method can achieve comparable prediction accuracy but with much
smaller computational costs. Our Molecule3D is available as a module of the
MoleculeX software library (https://github.com/divelab/MoleculeX).
- Abstract(参考訳): グラフニューラルネットワークは、ノードとエッジがそれぞれ原子と化学結合に対応する分子グラフをモデル化するための有望な手法として登場している。
最近の研究では、結合長や角度などの3次元分子ジオメトリが利用可能である場合、分子特性予測タスクをより正確にすることができる。
しかし、3次元分子幾何学の計算には計算的に禁止される量子計算が必要である。
例えば、小さな分子の3dジオメトリの正確な計算には、密度汎関数理論(dft)を用いた数時間の計算時間を必要とする。
本稿では,機械学習を用いて分子グラフから基底状態3次元ジオメトリを予測することを提案する。
これを実現するために,DFT由来の約400万分子の精密な基底状態測地データを含むMolecule3Dというベンチマークを開発した。
データ処理、分割、トレーニング、評価などのための一連のソフトウェアツールも提供しています。
具体的には,4つの指標を用いて予測された測地値の誤差と妥当性を評価する。
3次元空間における原子間対距離または原子座標を予測する2つのベースライン法を実装した。
実験の結果,RDKitを用いた3次元ジオメトリの生成と比較すると,予測精度は同等だが計算コストははるかに小さいことがわかった。
molecule3d は molecularx software library (https://github.com/divelab/moleculex) のモジュールとして利用可能です。
関連論文リスト
- Geometry Informed Tokenization of Molecules for Language Model Generation [85.80491667588923]
言語モデル(LM)を用いた三次元空間における分子生成の検討
分子グラフのトークン化は存在するが、3次元幾何学では、ほとんど探索されていない。
分子幾何学を$SE(3)$-invariant 1D離散配列に変換するGeo2Seqを提案する。
論文 参考訳(メタデータ) (2024-08-19T16:09:59Z) - Automated 3D Pre-Training for Molecular Property Prediction [54.15788181794094]
新たな3D事前学習フレームワーク(3D PGT)を提案する。
3D分子グラフのモデルを事前訓練し、3D構造のない分子グラフに微調整する。
提案した3次元PGTの精度, 効率, 一般化能力を示すために, 2次元分子グラフの大規模実験を行った。
論文 参考訳(メタデータ) (2023-06-13T14:43:13Z) - 3D Molecular Geometry Analysis with 2D Graphs [79.47097907673877]
分子の基底状態3次元ジオメトリは多くの分子解析タスクに必須である。
現代の量子力学的手法は正確な3次元幾何学を計算できるが、計算は禁じられている。
分子グラフから3次元幾何学を予測するための新しいディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-01T19:00:46Z) - Geometry-Complete Diffusion for 3D Molecule Generation and Optimization [3.8366697175402225]
3次元分子生成のための幾何-完全拡散モデル(GCDM)を導入する。
GCDMは、既存の3次元分子拡散モデルよりも条件および非条件設定間で大きなマージンで優れている。
また、GCDMの幾何学的特徴は、既存の3次元分子の幾何学的および化学組成を一貫して最適化するために再利用可能であることも示している。
論文 参考訳(メタデータ) (2023-02-08T20:01:51Z) - Unified 2D and 3D Pre-Training of Molecular Representations [237.36667670201473]
統合された2次元および3次元事前学習に基づく新しい表現学習法を提案する。
原子座標と原子間距離は符号化され、グラフニューラルネットワークを介して原子表現と融合する。
提案手法は10タスクの最先端化を実現し、2Dのみのタスクの平均改善率は8.3%である。
論文 参考訳(メタデータ) (2022-07-14T11:36:56Z) - 3D Infomax improves GNNs for Molecular Property Prediction [1.9703625025720701]
本稿では,2次元分子グラフのみに与えられる分子の幾何学をモデル化するための事前学習モデルを提案する。
我々は,3次元事前学習が幅広い特性に対して大きな改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-08T13:30:49Z) - GeoMol: Torsional Geometric Generation of Molecular 3D Conformer
Ensembles [60.12186997181117]
分子グラフからの分子の3Dコンホメーラーアンサンブルの予測は、化学情報学と薬物発見の領域において重要な役割を担っている。
既存の生成モデルは、重要な分子幾何学的要素のモデリングの欠如を含むいくつかの欠点がある。
エンド・ツー・エンド、非自己回帰、SE(3)不変の機械学習手法であるGeoMolを提案し、3Dコンバータを生成する。
論文 参考訳(メタデータ) (2021-06-08T14:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。