論文の概要: SPICE, A Dataset of Drug-like Molecules and Peptides for Training
Machine Learning Potentials
- arxiv url: http://arxiv.org/abs/2209.10702v1
- Date: Wed, 21 Sep 2022 23:02:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 14:54:14.879260
- Title: SPICE, A Dataset of Drug-like Molecules and Peptides for Training
Machine Learning Potentials
- Title(参考訳): SPICE, 薬物様分子とペプチドのデータセットによる機械学習の可能性の育成
- Authors: Peter Eastman, Pavan Kumar Behara, David L. Dotson, Raimondas
Galvelis, John E. Herr, Josh T. Horton, Yuezhi Mao, John D. Chodera, Benjamin
P. Pritchard, Yuanqing Wang, Gianni De Fabritiis, Thomas E. Markland
- Abstract要約: SPICEデータセットは、タンパク質と相互作用する薬物のような小さな分子のシミュレーションに関連するポテンシャルをトレーニングするための新しい量子化学データセットである。
この構造は、小さな分子、二量体、ジペプチド、および溶存アミノ酸の様々な集合に対する1100万以上のコンフォメーションを含んでいる。
15個の元素、荷電および非荷電分子、および幅広い共有結合および非共有結合相互作用を含む。
機械学習のポテンシャルのセットをトレーニングし、化学空間の広い領域にわたって化学的精度を達成できることを実証する。
- 参考スコア(独自算出の注目度): 1.7044177326714558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning potentials are an important tool for molecular simulation,
but their development is held back by a shortage of high quality datasets to
train them on. We describe the SPICE dataset, a new quantum chemistry dataset
for training potentials relevant to simulating drug-like small molecules
interacting with proteins. It contains over 1.1 million conformations for a
diverse set of small molecules, dimers, dipeptides, and solvated amino acids.
It includes 15 elements, charged and uncharged molecules, and a wide range of
covalent and non-covalent interactions. It provides both forces and energies
calculated at the {\omega}B97M-D3(BJ)/def2-TZVPPD level of theory, along with
other useful quantities such as multipole moments and bond orders. We train a
set of machine learning potentials on it and demonstrate that they can achieve
chemical accuracy across a broad region of chemical space. It can serve as a
valuable resource for the creation of transferable, ready to use potential
functions for use in molecular simulations.
- Abstract(参考訳): 機械学習のポテンシャルは分子シミュレーションの重要なツールであるが、それらの開発はそれらを訓練するための高品質なデータセットが不足していることに支えられている。
SPICEデータセットは、タンパク質と相互作用する薬物のような小さな分子のシミュレーションに関連するポテンシャルをトレーニングするための新しい量子化学データセットである。
それは、様々な小さな分子、二量体、ジペプチド、溶解アミノ酸の1.1百万以上のコンフォメーションを含んでいる。
15個の元素、荷電および非荷電分子、および幅広い共有結合および非共有結合相互作用を含む。
B97M-D3(BJ)/def2-TZVPPD理論で計算された力とエネルギー、および多重極モーメントやボンドオーダーなどの有用な量を提供する。
機械学習のポテンシャルのセットをトレーニングし、化学空間の広い領域にわたって化学的精度を達成できることを実証する。
トランスファー可能(transportable)を作成するための貴重な資源となり、分子シミュレーションで使用するために潜在的な機能を利用する準備ができている。
関連論文リスト
- Data-Driven Parametrization of Molecular Mechanics Force Fields for Expansive Chemical Space Coverage [16.745564099126575]
我々は、薬物様分子のアンバー互換力場であるByteFFを開発した。
本モデルでは, 薬物様分子のすべての結合および非結合MM力場パラメータを, 広い化学空間にわたって同時に予測する。
論文 参考訳(メタデータ) (2024-08-23T03:37:06Z) - $\nabla^2$DFT: A Universal Quantum Chemistry Dataset of Drug-Like Molecules and a Benchmark for Neural Network Potentials [35.949502493236146]
この研究は、nablaDFTをベースにした$nabla2$DFTと呼ばれる新しいデータセットとベンチマークを提示している。
分子構造の2倍、コンフォーメーションの3倍、新しいデータタイプとタスク、最先端のモデルを含んでいる。
$nabla2$DFTは、大量の薬物様分子の緩和軌道を含む最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-20T14:14:59Z) - Nutmeg and SPICE: Models and Data for Biomolecular Machine Learning [1.747623282473278]
SPICEデータセットは、機械学習ポテンシャルをトレーニングするための量子化学計算の集合である。
我々は、その上にNutmegと呼ばれるポテンシャルエネルギー関数のセットを訓練する。
論文 参考訳(メタデータ) (2024-06-18T23:54:21Z) - Machine-learned molecular mechanics force field for the simulation of
protein-ligand systems and beyond [33.54862439531144]
生体分子シミュレーションとコンピュータ支援薬物設計には, 信頼性および分子力学(MM)力場の開発が不可欠である。
本稿では、一般化された機械学習型MM力場、ttexttespaloma-0.3、およびグラフニューラルネットワークを用いたエンドツーエンドの微分可能なフレームワークを紹介する。
力場は、小さな分子、ペプチド、核酸を含む薬物発見に非常に関係した化学ドメインの量子化学エネルギー特性を再現する。
論文 参考訳(メタデータ) (2023-07-13T23:00:22Z) - QH9: A Quantum Hamiltonian Prediction Benchmark for QM9 Molecules [69.25826391912368]
QH9と呼ばれる新しい量子ハミルトンデータセットを生成し、999または2998の分子動力学軌道に対して正確なハミルトン行列を提供する。
現在の機械学習モデルでは、任意の分子に対するハミルトン行列を予測する能力がある。
論文 参考訳(メタデータ) (2023-06-15T23:39:07Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Computing molecular excited states on a D-Wave quantum annealer [52.5289706853773]
分子系の励起電子状態の計算にD波量子アニールを用いることを実証する。
これらのシミュレーションは、太陽光発電、半導体技術、ナノサイエンスなど、いくつかの分野で重要な役割を果たしている。
論文 参考訳(メタデータ) (2021-07-01T01:02:17Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z) - End-to-End Differentiable Molecular Mechanics Force Field Construction [0.5269923665485903]
化学環境を知覚するためにグラフニューラルネットワークを用いる別のアプローチを提案する。
プロセス全体がモジュール化されており、モデルパラメータに関してエンドツーエンドの差別化が可能である。
本手法は, 従来の原子型を再現するだけでなく, 既存の分子力学力場を正確に再現し, 拡張することができることを示す。
論文 参考訳(メタデータ) (2020-10-02T20:59:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。