論文の概要: Assessing Non-Nested Configurations of Multifidelity Machine Learning for Quantum-Chemical Properties
- arxiv url: http://arxiv.org/abs/2407.17087v1
- Date: Wed, 24 Jul 2024 08:34:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-25 14:23:43.966280
- Title: Assessing Non-Nested Configurations of Multifidelity Machine Learning for Quantum-Chemical Properties
- Title(参考訳): 量子化学特性のための多要素機械学習の非重要構成評価
- Authors: Vivin Vinod, Peter Zaspel,
- Abstract要約: 量子化学(QC)特性に対するMFML(Multifidelity Machine Learning)は近年,強力な発展を遂げている。
本研究は,MFMLと最適化MFMLの2つの手法における非ネステッドトレーニングデータの利用を評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multifidelity machine learning (MFML) for quantum chemical (QC) properties has seen strong development in the recent years. The method has been shown to reduce the cost of generating training data for high-accuracy low-cost ML models. In such a set-up, the ML models are trained on molecular geometries and some property of interest computed at various computational chemistry accuracies, or fidelities. These are then combined in training the MFML models. In some multifidelity models, the training data is required to be nested, that is the same molecular geometries are included to calculate the property across all the fidelities. In these multifidelity models, the requirement of a nested configuration restricts the kind of sampling that can be performed while selection training samples at different fidelities. This work assesses the use of non-nested training data for two of these multifidelity methods, namely MFML and optimized MFML (o-MFML). The assessment is carried out for the prediction of ground state energies and first vertical excitation energies of a diverse collection of molecules of the CheMFi dataset. Results indicate that the MFML method still requires a nested structure of training data across the fidelities. However, the o-MFML method shows promising results for non-nested multifidelity training data with model errors comparable to the nested configurations.
- Abstract(参考訳): 量子化学(QC)特性に対するMFML(Multifidelity Machine Learning)は近年,強力な発展を遂げている。
この手法は,高精度な低コストMLモデルのトレーニングデータ生成コストを低減できることが示されている。
このようなセットアップでは、MLモデルは分子測地と、様々な計算化学の精度や忠実度で計算される関心の性質に基づいて訓練される。
これらはMFMLモデルのトレーニングで組み合わせられる。
いくつかの多重忠実度モデルでは、トレーニングデータはネストされる必要があり、全ての忠実度をまたいだ特性を計算するために同じ分子的ジオメトリーを含む。
これらの多重忠実度モデルでは、ネストされた構成の要求は、異なる忠実度でのサンプルの選択中に実行できるサンプリングの種類を制限する。
本研究は,MFMLと最適化MFML(o-MFML)の2つの手法の非ネステッドトレーニングデータの利用を評価する。
この評価は、CheMFiデータセットの多様な分子集合の基底状態エネルギーと最初の垂直励起エネルギーの予測のために行われる。
結果から,MFML法は依然としてトレーニングデータのネスト構造を必要とすることが示唆された。
しかし、o-MFML法は、ネストした構成に匹敵するモデル誤差を持つ非ネスト多重忠実度トレーニングデータに対して有望な結果を示す。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Investigating Data Hierarchies in Multifidelity Machine Learning for Excitation Energies [0.0]
本研究では,QeMFiベンチマークを用いた鉛直励起エネルギー予測におけるモデル効率と精度に対する$gamma$の修正の影響について検討した。
MFMLの新たな誤差距離、誤差輪郭は、各忠実度からのモデル誤差寄与の包括的ビューを提供するために提案される。
実験結果から, 対象忠実度が低い場合, 目標忠実度において2つのトレーニングサンプルのみを用いて, モデル精度を向上できることが示唆された。
論文 参考訳(メタデータ) (2024-10-15T08:35:00Z) - Benchmarking Data Efficiency in $Δ$-ML and Multifidelity Models for Quantum Chemistry [0.0]
この研究は、$Delta$-ML、MFML、最適化されたMFML(o-MFML)に関連するデータコストを比較する。
以上の結果から,マルチ忠実度法は,多くの予測を行う場合の標準$Delta$-ML手法を超えることが示唆された。
論文 参考訳(メタデータ) (2024-10-15T08:34:32Z) - QeMFi: A Multifidelity Dataset of Quantum Chemical Properties of Diverse Molecules [0.0]
本稿では,TD-DFT形式を用いて計算した5つの忠実度からなる量子化学マルチフィデリティ(QeMFi)データセットについて述べる。
STO-3G, 3-21G, 6-31G, def2-SVP, def2-TZVP。
論文 参考訳(メタデータ) (2024-06-20T09:43:36Z) - Multi-task learning for molecular electronic structure approaching coupled-cluster accuracy [9.81014501502049]
金標準CCSD(T)計算をトレーニングデータとして,有機分子の電子構造を統一した機械学習手法を開発した。
炭化水素分子を用いたモデルでは, 計算コストと様々な量子化学特性の予測精度において, 広範に用いられているハイブリッド関数と二重ハイブリッド関数でDFTより優れていた。
論文 参考訳(メタデータ) (2024-05-09T19:51:27Z) - MFBind: a Multi-Fidelity Approach for Evaluating Drug Compounds in
Practical Generative Modeling [17.689451879343014]
現在の創薬モデルでは、主に分子ドッキングを用いて生成物の品質を評価する。
本稿では,MFBind(Multi-fidelity Bind)を提案し,精度と計算コストの最適トレードオフを実現する。
論文 参考訳(メタデータ) (2024-02-16T00:48:20Z) - A Multi-Grained Symmetric Differential Equation Model for Learning Protein-Ligand Binding Dynamics [73.35846234413611]
薬物発見において、分子動力学(MD)シミュレーションは、結合親和性を予測し、輸送特性を推定し、ポケットサイトを探索する強力なツールを提供する。
我々は,数値MDを容易にし,タンパク質-リガンド結合ダイナミクスの正確なシミュレーションを提供する,最初の機械学習サロゲートであるNeuralMDを提案する。
従来の数値MDシミュレーションと比較して1K$times$ Speedupを実現することにより,NeuralMDの有効性と有効性を示す。
論文 参考訳(メタデータ) (2024-01-26T09:35:17Z) - Large-scale gradient-based training of Mixtures of Factor Analyzers [67.21722742907981]
本稿では,勾配降下による高次元学習を効果的に行うための理論解析と新しい手法の両立に寄与する。
MFAトレーニングと推論/サンプリングは,学習終了後の行列逆変換を必要としない精度行列に基づいて行うことができることを示す。
理論解析と行列の他に,SVHNやMNISTなどの画像データセットにMFAを適用し,サンプル生成と外乱検出を行う能力を示す。
論文 参考訳(メタデータ) (2023-08-26T06:12:33Z) - Multi-fidelity Hierarchical Neural Processes [79.0284780825048]
多要素代理モデリングは、異なるシミュレーション出力を融合させることで計算コストを削減する。
本稿では,多階層型階層型ニューラルネットワーク(MF-HNP)を提案する。
疫学および気候モデリングタスクにおけるMF-HNPの評価を行い、精度と不確実性評価の観点から競合性能を達成した。
論文 参考訳(メタデータ) (2022-06-10T04:54:13Z) - Prediction of liquid fuel properties using machine learning models with
Gaussian processes and probabilistic conditional generative learning [56.67751936864119]
本研究の目的は、代替燃料の物理的特性を予測するためのクロージャ方程式として機能する、安価で計算可能な機械学習モデルを構築することである。
これらのモデルは、MDシミュレーションのデータベースや、データ融合-忠実性アプローチによる実験的な測定を用いて訓練することができる。
その結果,MLモデルでは,広範囲の圧力および温度条件の燃料特性を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2021-10-18T14:43:50Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。