論文の概要: Accurate Molecular-Orbital-Based Machine Learning Energies via
Unsupervised Clustering of Chemical Space
- arxiv url: http://arxiv.org/abs/2204.09831v1
- Date: Thu, 21 Apr 2022 00:56:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-22 14:54:35.800491
- Title: Accurate Molecular-Orbital-Based Machine Learning Energies via
Unsupervised Clustering of Chemical Space
- Title(参考訳): 化学空間の教師なしクラスタリングによる正確な分子軌道ベース機械学習エネルギー
- Authors: Lixue Cheng, Jiace Sun, Thomas F. Miller III
- Abstract要約: 分子軌道ベース機械学習(MOB-ML)を用いたエネルギー予測におけるトレーニング効率と精度の向上を目的とした教師なしクラスタリングアルゴリズムを提案する。
この研究は、ガウス混合モデル(GMM)を介して完全に自動でクラスタを決定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce an unsupervised clustering algorithm to improve training
efficiency and accuracy in predicting energies using molecular-orbital-based
machine learning (MOB-ML). This work determines clusters via the Gaussian
mixture model (GMM) in an entirely automatic manner and simplifies an earlier
supervised clustering approach [J. Chem. Theory Comput., 15, 6668 (2019)] by
eliminating both the necessity for user-specified parameters and the training
of an additional classifier. Unsupervised clustering results from GMM have the
advantage of accurately reproducing chemically intuitive groupings of frontier
molecular orbitals and having improved performance with an increasing number of
training examples. The resulting clusters from supervised or unsupervised
clustering is further combined with scalable Gaussian process regression (GPR)
or linear regression (LR) to learn molecular energies accurately by generating
a local regression model in each cluster. Among all four combinations of
regressors and clustering methods, GMM combined with scalable exact Gaussian
process regression (GMM/GPR) is the most efficient training protocol for
MOB-ML. The numerical tests of molecular energy learning on thermalized
datasets of drug-like molecules demonstrate the improved accuracy,
transferability, and learning efficiency of GMM/GPR over not only other
training protocols for MOB-ML, i.e., supervised regression-clustering combined
with GPR(RC/GPR) and GPR without clustering. GMM/GPR also provide the best
molecular energy predictions compared with the ones from literature on the same
benchmark datasets. With a lower scaling, GMM/GPR has a 10.4-fold speedup in
wall-clock training time compared with scalable exact GPR with a training size
of 6500 QM7b-T molecules.
- Abstract(参考訳): 分子軌道ベース機械学習(MOB-ML)を用いたエネルギー予測において,教師なしクラスタリングアルゴリズムを導入する。
本研究は, ガウス混合モデル (GMM) によるクラスタを完全自動で決定し, ユーザ特定パラメータの必要性と追加分類器の訓練の両面を排除し, 従来のクラスタリング手法 (J. Chem. Theory Comput., 15, 6668 (2019)) を単純化する。
GMMによる教師なしクラスタリングの結果は、フロンティア分子軌道の化学的に直感的なグルーピングを正確に再現し、多くのトレーニング例で性能を向上する利点がある。
教師付きまたは教師なしのクラスタリングから得られたクラスタはさらにスケーラブルなガウス過程回帰(gpr)または線形回帰(lr)と組み合わせて、各クラスタに局所回帰モデルを生成して分子エネルギーを正確に学習する。
回帰器とクラスタリングの4つの組み合わせのうち、GMMとスケーラブルな正確なガウスプロセス回帰(GMM/GPR)を組み合わせることは、MOB-MLの最も効率的なトレーニングプロトコルである。
薬物様分子の熱的データセットにおける分子エネルギー学習の数値実験は、MOB-MLの他のトレーニングプロトコル、すなわち、クラスタリングなしでGPR(RC/GPR)とGPRを組み合わせた教師付き回帰クラスタリングよりも、GMM/GPRの精度、伝達性、学習効率が向上したことを示している。
GMM/GPRは、同じベンチマークデータセットの文献と比較すると、最高の分子エネルギー予測を提供する。
低スケールでは、GMM/GPRは6500QM7b-T分子のスケーラブルな正確なGPRと比較して、ウォールクロックのトレーニング時間において10.4倍のスピードアップがある。
関連論文リスト
- Hierarchical Matrix Completion for the Prediction of Properties of Binary Mixtures [3.0478550046333965]
データ駆動モデルを改善するための新しいジェネリックアプローチを導入する。
化学のクラスに同じように振る舞うコンポーネントを持ち込み、それらを共同でモデル化します。
クラスタリングを使用すると、クラスタリングなしのCMに比べて予測が大幅に改善される。
論文 参考訳(メタデータ) (2024-10-08T14:04:30Z) - Bellman Diffusion: Generative Modeling as Learning a Linear Operator in the Distribution Space [72.52365911990935]
本稿では,MDPの線形性を維持する新しいDGMフレームワークであるBellman Diffusionを紹介する。
この結果から,ベルマン拡散は分布RLタスクにおける従来のヒストグラムベースベースラインよりも1.5倍高速に収束し,精度の高い画像生成装置であることがわかった。
論文 参考訳(メタデータ) (2024-10-02T17:53:23Z) - Understanding Reinforcement Learning-Based Fine-Tuning of Diffusion Models: A Tutorial and Review [63.31328039424469]
このチュートリアルは、下流の報酬関数を最適化するための微調整拡散モデルのための方法を網羅的に調査する。
PPO,微分可能最適化,報酬重み付きMLE,値重み付きサンプリング,経路整合性学習など,様々なRLアルゴリズムの適用について説明する。
論文 参考訳(メタデータ) (2024-07-18T17:35:32Z) - Adaptive Fuzzy C-Means with Graph Embedding [84.47075244116782]
ファジィクラスタリングアルゴリズムは、大まかに2つの主要なグループに分類できる: ファジィC平均法(FCM)と混合モデルに基づく方法。
本稿では,FCMを用いたクラスタリングモデルを提案する。
論文 参考訳(メタデータ) (2024-05-22T08:15:50Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Molecular-orbital-based Machine Learning for Open-shell and
Multi-reference Systems with Kernel Addition Gaussian Process Regression [0.0]
分子軌道ベース機械学習(MOB-ML)における新しい機械学習戦略であるカーネル加算ガウスプロセス回帰(KA-GPR)を導入する。
閉殻系および開殻系における一般的な電子構造理論の総相関エネルギーを機械学習戦略を導入して学習する。
MOB-ML(KA-GPR)の学習効率は、マルチ参照文字を持つ閉殻分子である最小クリージー分子のMOB-ML法と同じである。
論文 参考訳(メタデータ) (2022-07-17T23:20:19Z) - Molecular Dipole Moment Learning via Rotationally Equivariant Gaussian
Process Regression with Derivatives in Molecular-orbital-based Machine
Learning [0.0]
本研究は、分子軌道ベース機械学習(MOB-ML)の正確かつ伝達可能なアプローチを拡張した。
双極子モーメントの相関部の分子軌道ベース(MOB)対分解を適用する。
提案した問題設定,特徴設計,MLアルゴリズムは,高精度なモデルを提供する。
論文 参考訳(メタデータ) (2022-05-31T02:42:50Z) - Improving Molecular Contrastive Learning via Faulty Negative Mitigation
and Decomposed Fragment Contrast [17.142976840521264]
グラフニューラルネットワーク(GNN)を用いた表現の分子コントラスト学習の改善のためのiMolCLRを提案する。
実験の結果,提案手法はGNNモデルの性能を著しく向上させることがわかった。
iMolCLRは本質的に分子の類似性を推論できる足場や官能基を埋め込む。
論文 参考訳(メタデータ) (2022-02-18T18:33:27Z) - Molecular Energy Learning Using Alternative Blackbox Matrix-Matrix
Multiplication Algorithm for Exact Gaussian Process [0.0]
分子エネルギーのガウス過程(GP)トレーニングをスケールアップするために,ブラックボックス行列行列行列乗法(BBMM)アルゴリズムを適用した。
BBMM(AltBBMM)の別の実装も提案されている。
両アルゴリズムの精度と伝達性について, 重原子7と重原子13の有機分子のベンチマークで検討した。
論文 参考訳(メタデータ) (2021-09-20T19:59:06Z) - Continual Learning with Fully Probabilistic Models [70.3497683558609]
機械学習の完全確率的(または生成的)モデルに基づく継続的学習のアプローチを提案する。
生成器と分類器の両方に対してガウス混合モデル(GMM)インスタンスを用いた擬似リハーサル手法を提案する。
我々は,GMRが,クラス増分学習問題に対して,非常に競合的な時間とメモリの複雑さで,最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2021-04-19T12:26:26Z) - Cauchy-Schwarz Regularized Autoencoder [68.80569889599434]
変分オートエンコーダ(VAE)は、強力で広く使われている生成モデルのクラスである。
GMMに対して解析的に計算できるCauchy-Schwarz分散に基づく新しい制約対象を導入する。
本研究の目的は,密度推定,教師なしクラスタリング,半教師なし学習,顔分析における変分自動エンコーディングモデルの改善である。
論文 参考訳(メタデータ) (2021-01-06T17:36:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。