論文の概要: Efficient Chemical Space Exploration Using Active Learning Based on
Marginalized Graph Kernel: an Application for Predicting the Thermodynamic
Properties of Alkanes with Molecular Simulation
- arxiv url: http://arxiv.org/abs/2209.00514v1
- Date: Thu, 1 Sep 2022 14:59:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-02 14:19:51.659407
- Title: Efficient Chemical Space Exploration Using Active Learning Based on
Marginalized Graph Kernel: an Application for Predicting the Thermodynamic
Properties of Alkanes with Molecular Simulation
- Title(参考訳): Marginalized Graph Kernelに基づく能動学習による効率的な化学空間探索:分子シミュレーションによるアルカンの熱力学特性予測への応用
- Authors: Yan Xiang, Yu-Hang Tang, Zheng Gong, Hongyi Liu, Liang Wu, Guang Lin,
Huai Sun
- Abstract要約: 分子動力学シミュレーションを用いてデータとグラフニューラルネットワーク(GNN)を生成して予測する。
具体的には、4から19個の炭素原子からなる251,728個のアルカン分子とその液体物性を標的としている。
検証の結果、313個の分子だけが正確なGNNモデルを訓練するのに十分であり、計算テストセットは$rm R2 > 0.99$、実験テストセットは$rm R2 > 0.94$であった。
- 参考スコア(独自算出の注目度): 10.339394156446982
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce an explorative active learning (AL) algorithm based on Gaussian
process regression and marginalized graph kernel (GPR-MGK) to explore chemical
space with minimum cost. Using high-throughput molecular dynamics simulation to
generate data and graph neural network (GNN) to predict, we constructed an
active learning molecular simulation framework for thermodynamic property
prediction. In specific, targeting 251,728 alkane molecules consisting of 4 to
19 carbon atoms and their liquid physical properties: densities, heat
capacities, and vaporization enthalpies, we use the AL algorithm to select the
most informative molecules to represent the chemical space. Validation of
computational and experimental test sets shows that only 313 (0.124\% of the
total) molecules were sufficient to train an accurate GNN model with $\rm R^2 >
0.99$ for computational test sets and $\rm R^2 > 0.94$ for experimental test
sets. We highlight two advantages of the presented AL algorithm: compatibility
with high-throughput data generation and reliable uncertainty quantification.
- Abstract(参考訳): 本稿では,gaussian process regression and marginalized graph kernel (gpr-mgk)に基づく探索的アクティブラーニング(al)アルゴリズムを導入し,最小コストで化学空間を探索する。
高出力分子動力学シミュレーションを用いてデータとグラフニューラルネットワーク(GNN)の予測を行い、熱力学特性予測のための能動的学習分子シミュレーションフレームワークを構築した。
具体的には, 4〜19個の炭素原子からなる251,728個のアルカン分子とその液体物性, 密度, 熱容量, 気化エンタルピーを対象とし, ALアルゴリズムを用いて化学空間を表す最も情報性の高い分子を選択する。
計算および実験用テストセットの検証では、計算用テストセットに$\rm R^2 > 0.99$、実験用テストセットに$\rm R^2 > 0.94$の正確なGNNモデルを訓練するのに十分な分子は313分子 (0.124 %) しかなかった。
高スループットデータ生成と信頼性の高い不確実性定量化の2つの利点を浮き彫りにした。
関連論文リスト
- QH9: A Quantum Hamiltonian Prediction Benchmark for QM9 Molecules [72.73126947400603]
我々は、999の分子動力学軌道に対して正確なハミルトン行列を提供するために、QH9と名付けられた新しい量子ハミルトンデータセットを生成する。
現在の機械学習モデルでは、任意の分子に対するハミルトン行列を予測する能力がある。
論文 参考訳(メタデータ) (2023-06-15T23:39:07Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Gibbs-Helmholtz Graph Neural Network: capturing the temperature
dependency of activity coefficients at infinite dilution [1.290382979353427]
我々は,Gibs-Helmholtz Graph Neural Network (GH-GNN) モデルを構築し,温度の異なる分子系の$ln gamma_ijinfty$を予測する。
本稿では,GH-GNNの性能を連続的かつ離散的に解析し,モデルの適用性領域と予測精度を示す。
論文 参考訳(メタデータ) (2022-12-02T14:25:58Z) - Predicting CO$_2$ Absorption in Ionic Liquids with Molecular Descriptors
and Explainable Graph Neural Networks [9.04563945965023]
液体(IL)は、温暖化を緩和するためにCO$$の捕獲と貯蔵のための有望なソリューションを提供する。
本研究では,指紋に基づく機械学習モデルとグラフニューラルネットワーク(GNN)の両方を開発し,ILにおけるCO$の予測を行う。
従来のMLモデルよりも精度が高い(MAEは0.0137,$R2$は0.9884)。
論文 参考訳(メタデータ) (2022-09-29T18:31:12Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - Symmetry-adapted graph neural networks for constructing molecular
dynamics force fields [10.820190246285122]
分子動力学シミュレーションのための力場を自動構築する対称性適応グラフニューラルネットワークフレームワークを開発した。
MDGNNは古典的分子動力学と第一原理分子動力学の両方の結果を正確に再現する。
論文 参考訳(メタデータ) (2021-01-08T09:32:24Z) - Supervised deep learning prediction of the formation enthalpy of the
full set of configurations in complex phases: the $\sigma-$phase as an
example [1.8369974607582582]
固体化学におけるいくつかの特性の予測に機械学習をどのように利用できるかを示す。
特に、与えられた複雑な結晶相の形成熱を予測するのに使用できる。
論文 参考訳(メタデータ) (2020-11-21T22:07:15Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。