論文の概要: Learning inducing points and uncertainty on molecular data
- arxiv url: http://arxiv.org/abs/2207.07654v1
- Date: Sat, 16 Jul 2022 10:41:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-20 07:50:42.093033
- Title: Learning inducing points and uncertainty on molecular data
- Title(参考訳): 分子データにおける点と不確かさの学習
- Authors: Mikhail Tsitsvero
- Abstract要約: 大規模なデータセットに対する不確実性制御とスケーラビリティは、ガウスプロセスモデルのデプロイにおける2つの主要な問題である。
高次元分子記述子空間における誘導点の変分学習は予測品質と不確実性の両方を著しく改善することを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Uncertainty control and scalability to large datasets are the two main issues
for the deployment of Gaussian Process models into the autonomous material and
chemical space exploration pipelines. One way to address both of these issues
is by introducing the latent inducing variables and choosing the right
approximation for the marginal log-likelihood objective. Here, we show that
variational learning of the inducing points in the high-dimensional molecular
descriptor space significantly improves both the prediction quality and
uncertainty estimates on test configurations from a sample molecular dynamics
dataset. Additionally, we show that inducing points can learn to represent the
configurations of the molecules of different types that were not present within
the initialization set of inducing points. Among several evaluated approximate
marginal log-likelihood objectives, we show that the predictive log-likelihood
provides both the predictive quality comparable to the exact Gaussian Process
model and excellent uncertainty control. Finally, we comment on whether
Gaussian Processes make predictions by interpolating the molecular
configurations in high-dimensional descriptor space. We show that despite our
intuition, even for densely sampled molecular datasets, most of the predictions
are performed in the extrapolation regime.
- Abstract(参考訳): 不確実性制御と大規模データセットへのスケーラビリティは、ガウス過程モデルを自律材料と化学空間探査パイプラインに展開するための2つの主要な問題である。
これら2つの問題に対処する一つの方法は、潜在変数の導入と、限界ログライクな目的に対する正しい近似の選択である。
本稿では, 高次元分子ディスクリプタ空間における誘導点の変分学習が, サンプル分子動力学データセットによる試験構成の予測品質と不確実性評価の両方を著しく改善することを示す。
さらに,誘導点が誘導点の初期化集合には存在しない異なるタイプの分子の構成を表現できることを示した。
予測的ログ類似性はガウス過程モデルに匹敵する予測的品質と優れた不確実性制御をもたらすことを示した。
最後に、ガウス過程が高次元ディスクリプタ空間の分子配置を補間して予測するかどうかについて述べる。
我々の直感にもかかわらず、密集した分子データセットであっても、ほとんどの予測は外挿系で行われる。
関連論文リスト
- Stacked ensemble\-based mutagenicity prediction model using multiple modalities with graph attention network [0.9736758288065405]
変異原性は、様々なネガティブな結果をもたらす遺伝子変異と関連しているため、懸念される。
本研究では,新しいアンサンブルに基づく変異原性予測モデルを提案する。
論文 参考訳(メタデータ) (2024-09-03T09:14:21Z) - Enhanced sampling of robust molecular datasets with uncertainty-based
collective variables [0.0]
化学関連データポイントの取得を導くために,不確実性を集合変数(CV)として活用する手法を提案する。
このアプローチでは、1つのモデルからのガウス混合モデルに基づく不確実性測定を、偏りのある分子動力学シミュレーションのためのCVとして採用する。
論文 参考訳(メタデータ) (2024-02-06T06:42:51Z) - Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - Variational Autoencoding Molecular Graphs with Denoising Diffusion
Probabilistic Model [0.0]
本稿では,階層構造を確率論的潜在ベクトルに組み込んだ新しい深層生成モデルを提案する。
本モデルは,物理特性と活性に関する小さなデータセットを用いて,分子特性予測のための有効な分子潜在ベクトルを設計できることを実証する。
論文 参考訳(メタデータ) (2023-07-02T17:29:41Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Uncertainty quantification for predictions of atomistic neural networks [0.0]
本稿では、量子化学参照データに基づくトレーニングニューラルネットワーク(NN)の予測における不確かさの定量化値について検討する。
PhysNet NN のアーキテクチャを好適に修正し,キャリブレーションの定量化,予測品質,予測誤差と予測不確かさの相関性を評価した。
論文 参考訳(メタデータ) (2022-07-14T13:39:43Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z) - GeoDiff: a Geometric Diffusion Model for Molecular Conformation
Generation [102.85440102147267]
分子配座予測のための新しい生成モデルGeoDiffを提案する。
GeoDiffは、既存の最先端のアプローチよりも優れているか、あるいは同等であることを示す。
論文 参考訳(メタデータ) (2022-03-06T09:47:01Z) - Prediction of liquid fuel properties using machine learning models with
Gaussian processes and probabilistic conditional generative learning [56.67751936864119]
本研究の目的は、代替燃料の物理的特性を予測するためのクロージャ方程式として機能する、安価で計算可能な機械学習モデルを構築することである。
これらのモデルは、MDシミュレーションのデータベースや、データ融合-忠実性アプローチによる実験的な測定を用いて訓練することができる。
その結果,MLモデルでは,広範囲の圧力および温度条件の燃料特性を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2021-10-18T14:43:50Z) - Calibrated Uncertainty for Molecular Property Prediction using Ensembles
of Message Passing Neural Networks [11.47132155400871]
我々は、分子や物質の特性を予測するために特別に設計されたメッセージパッシングニューラルネットワークを拡張した。
その結果,分子生成エネルギーのキャリブレーションの不確実性を考慮した予測モデルが得られた。
論文 参考訳(メタデータ) (2021-07-13T13:28:11Z) - Learning Neural Generative Dynamics for Molecular Conformation
Generation [89.03173504444415]
分子グラフから分子コンフォメーション(つまり3d構造)を生成する方法を検討した。
分子グラフから有効かつ多様なコンフォーメーションを生成する新しい確率論的枠組みを提案する。
論文 参考訳(メタデータ) (2021-02-20T03:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。