論文の概要: QMe14S, A Comprehensive and Efficient Spectral Dataset for Small Organic Molecules
- arxiv url: http://arxiv.org/abs/2501.18876v1
- Date: Fri, 31 Jan 2025 04:12:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-03 13:58:17.151154
- Title: QMe14S, A Comprehensive and Efficient Spectral Dataset for Small Organic Molecules
- Title(参考訳): 有機分子の包括的で効率的なスペクトルデータセットQMe14S
- Authors: Mingzhi Yuan, Zihan Zou, Wei Hu,
- Abstract要約: 14元素を含む186,102個の有機分子からなるQMe14Sデータセットを紹介する。
我々は、エネルギー、原子電荷、原子間力、双極子モーメント、四極子モーメント、偏光性、オクタポールモーメント、第1超分極性、ヘッセンなどの計算特性を最適化した。
我々は、QMe14Sでトレーニングされたモデルは、分子スペクトルのシミュレーションにおいて、以前に開発されたQM9Sデータセットでトレーニングされたモデルよりも優れていることを示した。
- 参考スコア(独自算出の注目度): 10.076287990554901
- License:
- Abstract: Developing machine learning protocols for molecular simulations requires comprehensive and efficient datasets. Here we introduce the QMe14S dataset, comprising 186,102 small organic molecules featuring 14 elements (H, B, C, N, O, F, Al, Si, P, S, Cl, As, Se, Br) and 47 functional groups. Using density functional theory at the B3LYP/TZVP level, we optimized the geometries and calculated properties including energy, atomic charge, atomic force, dipole moment, quadrupole moment, polarizability, octupole moment, first hyperpolarizability, and Hessian. At the same level, we obtained the harmonic IR, Raman and NMR spectra. Furthermore, we conducted ab initio molecular dynamics simulations to generate dynamic configurations and extract nonequilibrium properties, including energy, forces, and Hessians. By leveraging our E(3)-equivariant message-passing neural network (DetaNet), we demonstrated that models trained on QMe14S outperform those trained on the previously developed QM9S dataset in simulating molecular spectra. The QMe14S dataset thus serves as a comprehensive benchmark for molecular simulations, offering valuable insights into structure-property relationships.
- Abstract(参考訳): 分子シミュレーションのための機械学習プロトコルの開発には、包括的で効率的なデータセットが必要である。
ここでは,14個の元素(H, B, C, N, O, F, Al, Si, P, S, Cl, As, Se, Br)と47個の官能基からなる186,102個の有機分子からなるQMe14Sデータセットを紹介する。
B3LYP/TZVPレベルでの密度汎関数理論を用いて、エネルギー、原子電荷、原子間力、双極子モーメント、四極子モーメント、偏光性、オクタポールモーメント、第1超分極性、ヘッセンなどの計算特性を最適化した。
同じレベルで、高調波IR、ラマン、NMRスペクトルを得た。
さらに, エネルギー, 力, ヘッセンを含む非平衡特性を抽出するため, 分子動力学シミュレーションを行った。
E(3)-equivariant message-passing neural network(DetaNet)を利用して、以前に開発されたQM9Sデータセットでトレーニングされたモデルよりも、QMe14Sでトレーニングされたモデルの方が、分子スペクトルをシミュレートできることを示した。
したがって、QMe14Sデータセットは分子シミュレーションの包括的なベンチマークとして機能し、構造-プロパティ関係に関する貴重な洞察を提供する。
関連論文リスト
- Data-Driven Parametrization of Molecular Mechanics Force Fields for Expansive Chemical Space Coverage [16.745564099126575]
我々は、薬物様分子のアンバー互換力場であるByteFFを開発した。
本モデルでは, 薬物様分子のすべての結合および非結合MM力場パラメータを, 広い化学空間にわたって同時に予測する。
論文 参考訳(メタデータ) (2024-08-23T03:37:06Z) - Multi-task learning for molecular electronic structure approaching coupled-cluster accuracy [9.81014501502049]
金標準CCSD(T)計算をトレーニングデータとして,有機分子の電子構造を統一した機械学習手法を開発した。
炭化水素分子を用いたモデルでは, 計算コストと様々な量子化学特性の予測精度において, 広範に用いられているハイブリッド関数と二重ハイブリッド関数でDFTより優れていた。
論文 参考訳(メタデータ) (2024-05-09T19:51:27Z) - SE(3)-Invariant Multiparameter Persistent Homology for Chiral-Sensitive
Molecular Property Prediction [1.534667887016089]
多パラメータ持続ホモロジー(MPPH)を用いた新しい分子指紋生成法を提案する。
この技術は、正確な分子特性予測が不可欠である薬物発見と材料科学において、かなりの重要性を持っている。
分子特性の予測における既存の最先端手法よりも優れた性能を示し,MoleculeNetベンチマークで広範囲な評価を行った。
論文 参考訳(メタデータ) (2023-12-12T09:33:54Z) - QH9: A Quantum Hamiltonian Prediction Benchmark for QM9 Molecules [69.25826391912368]
QH9と呼ばれる新しい量子ハミルトンデータセットを生成し、999または2998の分子動力学軌道に対して正確なハミルトン行列を提供する。
現在の機械学習モデルでは、任意の分子に対するハミルトン行列を予測する能力がある。
論文 参考訳(メタデータ) (2023-06-15T23:39:07Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Molecular Geometry-aware Transformer for accurate 3D Atomic System
modeling [51.83761266429285]
本稿では,ノード(原子)とエッジ(結合と非結合の原子対)を入力とし,それらの相互作用をモデル化するトランスフォーマーアーキテクチャを提案する。
MoleformerはOC20の緩和エネルギー予測の初期状態の最先端を実現し、QM9では量子化学特性の予測に非常に競争力がある。
論文 参考訳(メタデータ) (2023-02-02T03:49:57Z) - SPICE, A Dataset of Drug-like Molecules and Peptides for Training
Machine Learning Potentials [1.7044177326714558]
SPICEデータセットは、タンパク質と相互作用する薬物のような小さな分子のシミュレーションに関連するポテンシャルをトレーニングするための新しい量子化学データセットである。
この構造は、小さな分子、二量体、ジペプチド、および溶存アミノ酸の様々な集合に対する1100万以上のコンフォメーションを含んでいる。
15個の元素、荷電および非荷電分子、および幅広い共有結合および非共有結合相互作用を含む。
機械学習のポテンシャルのセットをトレーニングし、化学空間の広い領域にわたって化学的精度を達成できることを実証する。
論文 参考訳(メタデータ) (2022-09-21T23:02:59Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z) - GEOM: Energy-annotated molecular conformations for property prediction
and molecular generation [0.0]
我々は、高度サンプリングと半経験的密度汎関数理論を用いて、45万以上の分子に対して3700万の分子配座を生成する。
データセットには、QM9の133,000種と、生物物理学、生理学、物理化学に関する実験データを含む317,000種が含まれている。
論文 参考訳(メタデータ) (2020-06-09T22:14:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。