論文の概要: Beyond MD17: the reactive xxMD dataset
- arxiv url: http://arxiv.org/abs/2308.11155v3
- Date: Wed, 6 Mar 2024 02:21:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 18:15:45.789643
- Title: Beyond MD17: the reactive xxMD dataset
- Title(参考訳): MD17を超えて - リアクティブxxMDデータセット
- Authors: Zihan Pengmei, Junyu Liu, Yinan Shu
- Abstract要約: システム特異的神経力場(NFF)は、計算化学において人気を博している。
NFFsモデルを開発するためのベンチアームとして最も一般的なデータセットの1つは、MD17データセットである。
拡張励起状態分子ダイナミクス(xxMD)データセットと呼ばれる新しいデータセットを導入する。
- 参考スコア(独自算出の注目度): 6.3403707560721845
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: System specific neural force fields (NFFs) have gained popularity in
computational chemistry. One of the most popular datasets as a bencharmk to
develop NFFs models is the MD17 dataset and its subsequent extension. These
datasets comprise geometries from the equilibrium region of the ground
electronic state potential energy surface, sampled from direct adiabatic
dynamics. However, many chemical reactions involve significant molecular
geometrical deformations, for example, bond breaking. Therefore, MD17 is
inadequate to represent a chemical reaction. To address this limitation in
MD17, we introduce a new dataset, called Extended Excited-state Molecular
Dynamics (xxMD) dataset. The xxMD dataset involves geometries sampled from
direct non-adiabatic dynamics, and the energies are computed at both
multireference wavefunction theory and density functional theory. We show that
the xxMD dataset involves diverse geometries which represent chemical
reactions. Assessment of NFF models on xxMD dataset reveals significantly
higher predictive errors than those reported for MD17 and its variants. This
work underscores the challenges faced in crafting a generalizable NFF model
with extrapolation capability.
- Abstract(参考訳): システム特異的神経力場(NFF)は、計算化学において人気がある。
NFFsモデルを開発するためのベンチアームとして最も一般的なデータセットの1つは、MD17データセットとその拡張である。
これらのデータセットは、直接断熱力学からサンプリングされた基底電子状態ポテンシャルエネルギー表面の平衡領域からジオメトリを構成する。
しかし、多くの化学反応は、例えば結合破壊のような重要な分子幾何学的変形を含む。
したがって、MD17は化学反応を示すには不十分である。
MD17におけるこの制限に対処するため、拡張励起状態分子ダイナミクス(xxMD)データセットと呼ばれる新しいデータセットを導入する。
xxMDデータセットは直接非断熱力学からサンプリングされたジオメトリを含み、エネルギーは多重参照波動関数理論と密度汎関数理論の両方で計算される。
xxMDデータセットは化学反応を表す多様なジオメトリを含むことを示す。
xxMDデータセット上のNFFモデルの評価では、MD17とその変種と比較して予測誤差が著しく高い。
この研究は、外挿能力を備えた一般化可能なNFFモデルを構築する際に直面する課題を浮き彫りにする。
関連論文リスト
- Equivariant Graph Network Approximations of High-Degree Polynomials for Force Field Prediction [62.05532524197309]
同変深部モデルでは、分子動力学シミュレーションにおいて原子ポテンシャルと力場を正確に予測できることが示されている。
本研究では、同変アーキテクチャの同変関数を解析し、PACEと呼ばれる新しい同変ネットワークを導入する。
一般的なベンチマークで実験されたように、PACEは原子エネルギーと力場の予測における最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-11-06T19:34:40Z) - Data-Driven Parametrization of Molecular Mechanics Force Fields for Expansive Chemical Space Coverage [16.745564099126575]
我々は、薬物様分子のアンバー互換力場であるByteFFを開発した。
本モデルでは, 薬物様分子のすべての結合および非結合MM力場パラメータを, 広い化学空間にわたって同時に予測する。
論文 参考訳(メタデータ) (2024-08-23T03:37:06Z) - $\nabla^2$DFT: A Universal Quantum Chemistry Dataset of Drug-Like Molecules and a Benchmark for Neural Network Potentials [35.949502493236146]
この研究は、nablaDFTをベースにした$nabla2$DFTと呼ばれる新しいデータセットとベンチマークを提示している。
分子構造の2倍、コンフォーメーションの3倍、新しいデータタイプとタスク、最先端のモデルを含んでいる。
$nabla2$DFTは、大量の薬物様分子の緩和軌道を含む最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-20T14:14:59Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - A Score-based Geometric Model for Molecular Dynamics Simulations [33.158796937777886]
分子配座のログ密度の勾配を推定する新しいモデルScoreMDを提案する。
複数のアーキテクチャの改善により、MD17とC7O2H10の異性体において最先端のベースラインよりも優れています。
この研究は、新しい物質の加速と薬物発見に関する新たな洞察を提供する。
論文 参考訳(メタデータ) (2022-04-19T05:13:46Z) - Coupled and Uncoupled Dynamic Mode Decomposition in Multi-Compartmental
Systems with Applications to Epidemiological and Additive Manufacturing
Problems [58.720142291102135]
非線形問題に適用した場合,動的分解(DMD)は強力なツールである可能性が示唆された。
特に,Covid-19に対する連続遅延SIRDモデルに対する興味深い数値的応用を示す。
論文 参考訳(メタデータ) (2021-10-12T21:42:14Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z) - Diffusion Earth Mover's Distance and Distribution Embeddings [61.49248071384122]
拡散は$tildeo(n)$ timeで計算でき、ツリーベースのような同様の高速アルゴリズムよりも正確である。
拡散は完全微分可能であり、深層ニューラルネットワークのような勾配拡散フレームワークの将来の使用に適している。
論文 参考訳(メタデータ) (2021-02-25T13:18:32Z) - A Universal Framework for Featurization of Atomistic Systems [0.0]
物理や機械学習に基づく反応力場は、時間と長さのスケールのギャップを埋めるために使うことができる。
本稿では,原子周囲の電子密度の物理的に関連する多極展開を利用するガウス多極(GMP)デデュール化スキームを紹介する。
我々は,GMPに基づくモデルがQM9データセットの化学的精度を達成できることを示し,新しい要素を外挿してもその精度は妥当であることを示した。
論文 参考訳(メタデータ) (2021-02-04T03:11:00Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - Embedded-physics machine learning for coarse-graining and collective
variable discovery without data [3.222802562733787]
基礎となる物理を一貫して組み込む新しい学習フレームワークを提案する。
原子間力場の形で利用可能な物理学を完全に組み込んだ逆クルバック・リーブラー分岐に基づく新しい目的を提案する。
本研究は,バイモーダルポテンシャルエネルギー関数とアラニンジペプチドに対するCVの予測能力および物理的意義の観点からアルゴリズムの進歩を実証する。
論文 参考訳(メタデータ) (2020-02-24T10:28:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。