論文の概要: Multi-Fidelity Machine Learning for Excited State Energies of Molecules
- arxiv url: http://arxiv.org/abs/2305.11292v1
- Date: Thu, 18 May 2023 20:21:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-22 17:18:31.038497
- Title: Multi-Fidelity Machine Learning for Excited State Energies of Molecules
- Title(参考訳): 分子の励起状態エネルギーに対する多要素機械学習
- Authors: Vivin Vinod, Sayan Maity, Peter Zaspel, Ulrich Kleinekath\"ofer
- Abstract要約: 高速な学習データのみに基づいて構築された機械学習モデルと同一の精度を達成できることが示されている。
これらのベンチマークテスト計算で得られた数値利得は30以上であったが、精度の高いデータでは間違いなくはるかに高い値となる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The accurate but fast calculation of molecular excited states is still a very
challenging topic. For many applications, detailed knowledge of the energy
funnel in larger molecular aggregates is of key importance requiring highly
accurate excited state energies. To this end, machine learning techniques can
be an extremely useful tool though the cost of generating highly accurate
training datasets still remains a severe challenge. To overcome this hurdle,
this work proposes the use of multi-fidelity machine learning where very little
training data from high accuracies is combined with cheaper and less accurate
data to achieve the accuracy of the costlier level. In the present study, the
approach is employed to predict the first excited state energies for three
molecules of increasing size, namely, benzene, naphthalene, and anthracene. The
energies are trained and tested for conformations stemming from classical
molecular dynamics simulations and from real-time density functional
tight-binding calculations. It can be shown that the multi-fidelity machine
learning model can achieve the same accuracy as a machine learning model built
only on high cost training data while having a much lower computational effort
to generate the data. The numerical gain observed in these benchmark test
calculations was over a factor of 30 but certainly can be much higher for high
accuracy data.
- Abstract(参考訳): 分子励起状態の正確かつ高速な計算は、いまだに非常に難しいトピックである。
多くの応用において、より大きな分子集合体におけるエネルギーファンネルの詳細な知識は、高精度の励起状態エネルギーを必要とする重要な重要性である。
この目的のために、機械学習技術は極めて有用なツールであるが、高精度なトレーニングデータセットを生成するコストは依然として厳しい課題である。
このハードルを克服するため,本研究では,高い精度のトレーニングデータと安価で精度の低いデータを組み合わせることで,高コストレベルの精度を実現するマルチ忠実度機械学習の利用を提案する。
本研究は, ベンゼン, ナフタレン, アントラセンの3つの分子について, 初めて励起状態エネルギーを予測する手法である。
エネルギーは、古典的分子動力学シミュレーションやリアルタイム密度汎関数的タイト結合計算から生じるコンフォメーションのために訓練され、テストされる。
マルチフィデリティ機械学習モデルは、高コストトレーニングデータのみに基づいて構築された機械学習モデルと同等の精度を実現できると同時に、データ生成のための計算労力がはるかに少ないことを示すことができる。
これらのベンチマークテスト計算で得られた数値利得は30以上であったが、精度の高いデータでは間違いなくはるかに高い。
関連論文リスト
- QH9: A Quantum Hamiltonian Prediction Benchmark for QM9 Molecules [72.73126947400603]
我々は、999の分子動力学軌道に対して正確なハミルトン行列を提供するために、QH9と名付けられた新しい量子ハミルトンデータセットを生成する。
現在の機械学習モデルでは、任意の分子に対するハミルトン行列を予測する能力がある。
論文 参考訳(メタデータ) (2023-06-15T23:39:07Z) - On the Interplay of Subset Selection and Informed Graph Neural Networks [3.091456764812509]
この研究は、QM9データセットにおける分子の原子化エネルギーの予測に焦点を当てている。
トレーニングセット選択過程における分子多様性の最大化は,線形回帰法および非線形回帰法のロバスト性を高めることを示す。
また、モデルに依存しない説明器を用いて、グラフニューラルネットワークによる予測の信頼性を確認する。
論文 参考訳(メタデータ) (2023-06-15T09:09:27Z) - Machine Learning Force Fields with Data Cost Aware Training [94.78998399180519]
分子動力学(MD)シミュレーションを加速するために機械学習力場(MLFF)が提案されている。
最もデータ効率のよいMLFFであっても、化学精度に達するには数百フレームの力とエネルギーのラベルが必要になる。
我々は、安価な不正確なデータと高価な正確なデータの組み合わせを利用して、MLFFのデータコストを下げる多段階計算フレームワークASTEROIDを提案する。
論文 参考訳(メタデータ) (2023-06-05T04:34:54Z) - Transfer learning for chemically accurate interatomic neural network
potentials [0.0]
密度汎関数計算から得られたデータに基づいてネットワークパラメータを事前学習することにより、より正確なab-initioデータに基づいてトレーニングされたモデルのサンプル効率が向上することを示す。
ANI-1x および ANI-1ccx データセット上で事前訓練および微調整されたGM-NN電位を提供する。
論文 参考訳(メタデータ) (2022-12-07T19:21:01Z) - Synthetic data enable experiments in atomistic machine learning [0.0]
既存のMLポテンシャルモデルから,原子単位のエネルギーをラベル付けした大規模データセットの使用を実演する。
このプロセスの安価さは、量子力学の土台真実に比べれば、数百万のデータポイントを生成できる。
合成データラベルの学習は、後続の小さなデータセットの微調整に有用な事前学習タスクであることを示す。
論文 参考訳(メタデータ) (2022-11-29T18:17:24Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Quantum-tailored machine-learning characterization of a superconducting
qubit [50.591267188664666]
我々は,量子デバイスのダイナミクスを特徴付ける手法を開発し,デバイスパラメータを学習する。
このアプローチは、数値的に生成された実験データに基づいてトレーニングされた物理に依存しないリカレントニューラルネットワークより優れている。
このデモンストレーションは、ドメイン知識を活用することで、この特徴付けタスクの正確性と効率が向上することを示す。
論文 参考訳(メタデータ) (2021-06-24T15:58:57Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z) - Accelerating the screening of amorphous polymer electrolytes by learning
to reduce random and systematic errors in molecular dynamics simulations [0.8061216572215162]
本研究では,次世代リチウムイオン電池技術の候補となるアモルファス高分子電解質をスクリーニングすることを目的とする。
マルチタスクグラフニューラルネットワークは、大量のノイズの多い偏りのあるデータと少数の偏りのないデータから学ぶことができることを実証する。
従来の計算研究よりも桁違いに大きい6247個の高分子電解質をスクリーニングします。
論文 参考訳(メタデータ) (2021-01-13T20:46:24Z) - Simple and efficient algorithms for training machine learning potentials
to force data [2.924868086534434]
Ab initio量子シミュレーションのデータに基づいて訓練された機械学習モデルは、前例のない精度で分子動力学ポテンシャルを生み出している。
制限要因の1つは、利用可能なトレーニングデータの量であり、入手するのにコストがかかる。
有機化学およびバルクアルミニウムのための実世界のデータセットから力のトレーニングにより、その精度をベンチマークする。
論文 参考訳(メタデータ) (2020-06-09T19:36:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。