論文の概要: Efficient Chemical Space Exploration Using Active Learning Based on
Marginalized Graph Kernel: an Application for Predicting the Thermodynamic
Properties of Alkanes with Molecular Simulation
- arxiv url: http://arxiv.org/abs/2209.00514v1
- Date: Thu, 1 Sep 2022 14:59:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-02 14:19:51.659407
- Title: Efficient Chemical Space Exploration Using Active Learning Based on
Marginalized Graph Kernel: an Application for Predicting the Thermodynamic
Properties of Alkanes with Molecular Simulation
- Title(参考訳): Marginalized Graph Kernelに基づく能動学習による効率的な化学空間探索:分子シミュレーションによるアルカンの熱力学特性予測への応用
- Authors: Yan Xiang, Yu-Hang Tang, Zheng Gong, Hongyi Liu, Liang Wu, Guang Lin,
Huai Sun
- Abstract要約: 分子動力学シミュレーションを用いてデータとグラフニューラルネットワーク(GNN)を生成して予測する。
具体的には、4から19個の炭素原子からなる251,728個のアルカン分子とその液体物性を標的としている。
検証の結果、313個の分子だけが正確なGNNモデルを訓練するのに十分であり、計算テストセットは$rm R2 > 0.99$、実験テストセットは$rm R2 > 0.94$であった。
- 参考スコア(独自算出の注目度): 10.339394156446982
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce an explorative active learning (AL) algorithm based on Gaussian
process regression and marginalized graph kernel (GPR-MGK) to explore chemical
space with minimum cost. Using high-throughput molecular dynamics simulation to
generate data and graph neural network (GNN) to predict, we constructed an
active learning molecular simulation framework for thermodynamic property
prediction. In specific, targeting 251,728 alkane molecules consisting of 4 to
19 carbon atoms and their liquid physical properties: densities, heat
capacities, and vaporization enthalpies, we use the AL algorithm to select the
most informative molecules to represent the chemical space. Validation of
computational and experimental test sets shows that only 313 (0.124\% of the
total) molecules were sufficient to train an accurate GNN model with $\rm R^2 >
0.99$ for computational test sets and $\rm R^2 > 0.94$ for experimental test
sets. We highlight two advantages of the presented AL algorithm: compatibility
with high-throughput data generation and reliable uncertainty quantification.
- Abstract(参考訳): 本稿では,gaussian process regression and marginalized graph kernel (gpr-mgk)に基づく探索的アクティブラーニング(al)アルゴリズムを導入し,最小コストで化学空間を探索する。
高出力分子動力学シミュレーションを用いてデータとグラフニューラルネットワーク(GNN)の予測を行い、熱力学特性予測のための能動的学習分子シミュレーションフレームワークを構築した。
具体的には, 4〜19個の炭素原子からなる251,728個のアルカン分子とその液体物性, 密度, 熱容量, 気化エンタルピーを対象とし, ALアルゴリズムを用いて化学空間を表す最も情報性の高い分子を選択する。
計算および実験用テストセットの検証では、計算用テストセットに$\rm R^2 > 0.99$、実験用テストセットに$\rm R^2 > 0.94$の正確なGNNモデルを訓練するのに十分な分子は313分子 (0.124 %) しかなかった。
高スループットデータ生成と信頼性の高い不確実性定量化の2つの利点を浮き彫りにした。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - $\nabla^2$DFT: A Universal Quantum Chemistry Dataset of Drug-Like Molecules and a Benchmark for Neural Network Potentials [35.949502493236146]
この研究は、nablaDFTをベースにした$nabla2$DFTと呼ばれる新しいデータセットとベンチマークを提示している。
分子構造の2倍、コンフォーメーションの3倍、新しいデータタイプとタスク、最先端のモデルを含んでいる。
$nabla2$DFTは、大量の薬物様分子の緩和軌道を含む最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-20T14:14:59Z) - Using GNN property predictors as molecule generators [16.34646723046073]
グラフニューラルネットワーク(GNN)は、物質や分子特性を正確に予測する強力なツールとして登場した。
本稿では、これらのニューラルネットワークの可逆性を利用して、所望の電子特性を持つ分子構造を直接生成する。
論文 参考訳(メタデータ) (2024-06-05T13:53:47Z) - QH9: A Quantum Hamiltonian Prediction Benchmark for QM9 Molecules [69.25826391912368]
QH9と呼ばれる新しい量子ハミルトンデータセットを生成し、999または2998の分子動力学軌道に対して正確なハミルトン行列を提供する。
現在の機械学習モデルでは、任意の分子に対するハミルトン行列を予測する能力がある。
論文 参考訳(メタデータ) (2023-06-15T23:39:07Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Gibbs-Helmholtz Graph Neural Network: capturing the temperature
dependency of activity coefficients at infinite dilution [1.290382979353427]
我々は,Gibs-Helmholtz Graph Neural Network (GH-GNN) モデルを構築し,温度の異なる分子系の$ln gamma_ijinfty$を予測する。
本稿では,GH-GNNの性能を連続的かつ離散的に解析し,モデルの適用性領域と予測精度を示す。
論文 参考訳(メタデータ) (2022-12-02T14:25:58Z) - Predicting CO$_2$ Absorption in Ionic Liquids with Molecular Descriptors
and Explainable Graph Neural Networks [9.04563945965023]
液体(IL)は、温暖化を緩和するためにCO$$の捕獲と貯蔵のための有望なソリューションを提供する。
本研究では,指紋に基づく機械学習モデルとグラフニューラルネットワーク(GNN)の両方を開発し,ILにおけるCO$の予測を行う。
従来のMLモデルよりも精度が高い(MAEは0.0137,$R2$は0.9884)。
論文 参考訳(メタデータ) (2022-09-29T18:31:12Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。