論文の概要: Transition1x -- a Dataset for Building Generalizable Reactive Machine
Learning Potentials
- arxiv url: http://arxiv.org/abs/2207.12858v1
- Date: Mon, 25 Jul 2022 07:30:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-27 13:25:13.881866
- Title: Transition1x -- a Dataset for Building Generalizable Reactive Machine
Learning Potentials
- Title(参考訳): transition1x -- 汎用的なリアクティブ機械学習ポテンシャルを構築するためのデータセット
- Authors: Mathias Schreiner, Arghya Bhowmik, Tejs Vegge, Jonas Busk, Ole Winther
- Abstract要約: 960万の密度汎関数理論(DFT)計算を含むデータセットトランジション1xを提案する。
MLモデルは、人気のあるベンチマークデータセットをトレーニングすることでのみ、遷移状態領域の機能を学習できないことを示す。
- 参考スコア(独自算出の注目度): 7.171984408392421
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine Learning (ML) models have, in contrast to their usefulness in
molecular dynamics studies, had limited success as surrogate potentials for
reaction barrier search. It is due to the scarcity of training data in relevant
transition state regions of chemical space. Currently, available datasets for
training ML models on small molecular systems almost exclusively contain
configurations at or near equilibrium. In this work, we present the dataset
Transition1x containing 9.6 million Density Functional Theory (DFT)
calculations of forces and energies of molecular configurations on and around
reaction pathways at the wB97x/6-31G(d) level of theory. The data was generated
by running Nudged Elastic Band (NEB) calculations with DFT on 10k reactions
while saving intermediate calculations. We train state-of-the-art equivariant
graph message-passing neural network models on Transition1x and cross-validate
on the popular ANI1x and QM9 datasets. We show that ML models cannot learn
features in transition-state regions solely by training on hitherto popular
benchmark datasets. Transition1x is a new challenging benchmark that will
provide an important step towards developing next-generation ML force fields
that also work far away from equilibrium configurations and reactive systems.
- Abstract(参考訳): 機械学習(ML)モデルは、分子動力学研究において有用であるのとは対照的に、反応障壁探索のサロゲートポテンシャルとして成功した。
これは、化学空間の関連する遷移状態領域におけるトレーニングデータの不足に起因する。
現在、小さな分子システム上でMLモデルをトレーニングするためのデータセットは、ほぼ平衡に近い構成を含んでいる。
本稿では, wb97x/6-31g(d)理論における反応経路とその周辺における分子配置の力とエネルギーの9.6億倍の密度汎関数理論(dft)を含むデータセットtransition1xを提案する。
データは、中間計算を節約しながら10k反応でdftを用いたヌッジ弾性バンド(neb)計算を実行して生成された。
我々は,人気のani1xおよびqm9データセット上でtransition1xおよびcross-validate上で,最先端の等価グラフメッセージパッシングニューラルネットワークモデルをトレーニングする。
MLモデルは、人気のあるベンチマークデータセットをトレーニングすることでのみ、遷移状態領域の機能を学習できないことを示す。
transition1xは新しい挑戦的なベンチマークで、平衡構成やリアクティブシステムから遠く離れた、次世代のMLフォースフィールドの開発に向けた重要なステップを提供する。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Cascade of phase transitions in the training of Energy-based models [9.945465034701288]
原型エネルギーベース生成モデルBernoulli-Bernoulli RBMの特徴符号化過程について検討した。
本研究は、その特異値分解によるモデルの重み行列の進化をトラックする。
我々はBernoulli-Bernoulli RBMを実データ集合上でトレーニングすることで理論的結果を検証する。
論文 参考訳(メタデータ) (2024-05-23T15:25:56Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Assessing Neural Network Representations During Training Using
Noise-Resilient Diffusion Spectral Entropy [55.014926694758195]
ニューラルネットワークにおけるエントロピーと相互情報は、学習プロセスに関する豊富な情報を提供する。
データ幾何を利用して基礎となる多様体にアクセスし、これらの情報理論測度を確実に計算する。
本研究は,高次元シミュレーションデータにおける固有次元と関係強度の耐雑音性の測定結果である。
論文 参考訳(メタデータ) (2023-12-04T01:32:42Z) - Evaluating the Transferability of Machine-Learned Force Fields for
Material Property Modeling [2.494740426749958]
本稿では,機械学習力場の伝達性を評価するため,より包括的なベンチマークテストを提案する。
我々は、OpenMMパッケージと結合したグラフニューラルネットワーク(GNN)ベースの力場を用いて、ArgonのMDシミュレーションを実行する。
実験結果から, モデルが固体相の挙動を正確に把握できるのは, 固体相の構成がトレーニングデータセットに含まれる場合のみであることがわかった。
論文 参考訳(メタデータ) (2023-01-10T00:25:48Z) - Transfer learning for chemically accurate interatomic neural network
potentials [0.0]
密度汎関数計算から得られたデータに基づいてネットワークパラメータを事前学習することにより、より正確なab-initioデータに基づいてトレーニングされたモデルのサンプル効率が向上することを示す。
ANI-1x および ANI-1ccx データセット上で事前訓練および微調整されたGM-NN電位を提供する。
論文 参考訳(メタデータ) (2022-12-07T19:21:01Z) - NeuralNEB -- Neural Networks can find Reaction Paths Fast [7.7365628406567675]
密度汎関数理論 (DFT) のような量子力学的手法は、反応系の運動学を研究するための効率的な探索アルゴリズムと共に大きな成功を収めている。
機械学習(ML)モデルは、小さな分子DFT計算の優れたエミュレータであることが判明し、そのようなタスクでDFTを置き換える可能性がある。
本稿では、Transition1xデータセットから約10万の初等反応に基づいて、アート同変グラフニューラルネットワーク(GNN)に基づくモデルの状態を訓練する。
論文 参考訳(メタデータ) (2022-07-20T15:29:45Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z) - Equivariant vector field network for many-body system modeling [65.22203086172019]
Equivariant Vector Field Network (EVFN) は、新しい同変層と関連するスカラー化およびベクトル化層に基づいて構築されている。
シミュレーションされたニュートン力学系の軌跡を全観測データと部分観測データで予測する手法について検討した。
論文 参考訳(メタデータ) (2021-10-26T14:26:25Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z) - Automated discovery of a robust interatomic potential for aluminum [4.6028828826414925]
機械学習(ML)ベースのポテンシャルは、量子力学(QM)計算の忠実なエミュレーションを、計算コストを大幅に削減することを目的としている。
アクティブラーニング(AL)の原理を用いたデータセット構築のための高度に自動化されたアプローチを提案する。
アルミニウム(ANI-Al)のMLポテンシャル構築によるこのアプローチの実証
転写性を示すために、1.3M原子衝撃シミュレーションを行い、非平衡力学から採取した局所原子環境上でのDFT計算とANI-Al予測がよく一致することを示す。
論文 参考訳(メタデータ) (2020-03-10T19:06:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。