論文の概要: SurGBSA: Learning Representations From Molecular Dynamics Simulations
- arxiv url: http://arxiv.org/abs/2509.03084v2
- Date: Wed, 10 Sep 2025 23:46:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-12 11:47:11.865652
- Title: SurGBSA: Learning Representations From Molecular Dynamics Simulations
- Title(参考訳): SurGBSA:分子動力学シミュレーションから学ぶ
- Authors: Derek Jones, Yue Yang, Felice C. Lightstone, Niema Moshiri, Jonathan E. Allen, Tajana S. Rosing,
- Abstract要約: 薬物のような化合物やタンパク質の静的構造からの自己教師付き事前学習は、強力な学習された特徴表現を可能にする。
MDに基づく表現学習のための新しいモデリング手法として,SURrogate mmGBSAを提案する。
物理インフォームド・プレトレーニングの利点を初めて示し,140万以上の3次元軌跡の集合体上で代理MMGBSAモデルを訓練した。
- 参考スコア(独自算出の注目度): 5.910755265815443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised pretraining from static structures of drug-like compounds and proteins enable powerful learned feature representations. Learned features demonstrate state of the art performance on a range of predictive tasks including molecular properties, structure generation, and protein-ligand interactions. The majority of approaches are limited by their use of static structures and it remains an open question, how best to use atomistic molecular dynamics (MD) simulations to develop more generalized models to improve prediction accuracy for novel molecular structures. We present SURrogate mmGBSA (SurGBSA) as a new modeling approach for MD-based representation learning, which learns a surrogate function of the Molecular Mechanics Generalized Born Surface Area (MMGBSA). We show for the first time the benefits of physics-informed pre-training to train a surrogate MMGBSA model on a collection of over 1.4 million 3D trajectories collected from MD simulations of the CASF-2016 benchmark. SurGBSA demonstrates a dramatic 27,927x speedup versus a traditional physics-based single-point MMGBSA calculation while nearly matching single-point MMGBSA accuracy on the challenging pose ranking problem for identification of the correct top pose (-0.4% difference). Our work advances the development of molecular foundation models by showing model improvements when training on MD simulations. Models, code and training data are made publicly available.
- Abstract(参考訳): 薬物のような化合物やタンパク質の静的構造からの自己教師付き事前学習は、強力な学習された特徴表現を可能にする。
学習された特徴は、分子特性、構造生成、タンパク質-リガンド相互作用を含む様々な予測タスクにおける最先端のパフォーマンスを示す。
大部分のアプローチは静的構造の使用によって制限されており、新しい分子構造に対する予測精度を改善するためにより一般化されたモデルを開発するために、原子論分子動力学(MD)シミュレーションをどのように使うのが最適かというオープンな疑問である。
MDに基づく表現学習のための新しいモデリング手法としてSURrogate mmGBSA(SurGBSA)を提案する。
本稿では,CASF-2016ベンチマークのMDシミュレーションから収集した140万点以上の3Dトラジェクトリを用いて,Surrogate MMGBSAモデルをトレーニングするための物理インフォームドプレトレーニングの利点を初めて示す。
SurGBSAは、従来の物理学ベースのシングルポイントMMGBSA計算と比較して劇的な27,927倍のスピードアップを示し、正しいトップポーズの識別に挑戦するポーズランキング問題(-0.4%の差)について、シングルポイントMMGBSAの精度とほぼ一致している。
本研究は,MDシミュレーションのトレーニングにおいて,モデル改良を示すことによって,分子基盤モデルの開発を進める。
モデル、コード、トレーニングデータは公開されています。
関連論文リスト
- Zatom-1: A Multimodal Flow Foundation Model for 3D Molecules and Materials [51.342983349686556]
汎用的な3Dケミカルモデリングは分子や材料を含み、生成能力と予測能力の両方を必要とする。
Zatom-1は、3D分子や材料の生成的および予測的学習を統一する、エンド・ツー・エンドの完全なオープンソース基盤モデルである。
論文 参考訳(メタデータ) (2026-02-24T20:52:39Z) - Foundation Models for Discovery and Exploration in Chemical Space [57.97784111110166]
MISTは、大規模なラベルなしデータセットに基づいて訓練された分子基盤モデルのファミリーである。
我々は、これらのモデルが化学空間をまたいだ現実世界の問題を解決する能力を実証する。
論文 参考訳(メタデータ) (2025-10-20T17:56:01Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Generative Modeling of Molecular Dynamics Trajectories [12.255021091552441]
データからMDの柔軟なマルチタスクサロゲートモデルを学ぶためのパラダイムとして,分子軌道の生成モデルを提案する。
このような生成モデルは,前方シミュレーションや遷移経路サンプリング,軌道上アップサンプリングといった多様なタスクに適応可能であることを示す。
論文 参考訳(メタデータ) (2024-09-26T13:02:28Z) - A Multi-Grained Symmetric Differential Equation Model for Learning Protein-Ligand Binding Dynamics [73.35846234413611]
薬物発見において、分子動力学(MD)シミュレーションは、結合親和性を予測し、輸送特性を推定し、ポケットサイトを探索する強力なツールを提供する。
我々は,数値MDを容易にし,タンパク質-リガンド結合ダイナミクスの正確なシミュレーションを提供する,最初の機械学習サロゲートであるNeuralMDを提案する。
従来の数値MDシミュレーションと比較して1K$times$ Speedupを実現することにより,NeuralMDの有効性と有効性を示す。
論文 参考訳(メタデータ) (2024-01-26T09:35:17Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Forces are not Enough: Benchmark and Critical Evaluation for Machine
Learning Force Fields with Molecular Simulations [5.138982355658199]
分子動力学(MD)シミュレーション技術は様々な自然科学応用に広く用いられている。
我々は、最先端(SOTA)ML FFモデルの集合をベンチマークし、特に、一般的にベンチマークされる力の精度が、関連するシミュレーション指標とうまく一致していないことを示す。
論文 参考訳(メタデータ) (2022-10-13T17:59:03Z) - From Static to Dynamic Structures: Improving Binding Affinity Prediction with Graph-Based Deep Learning [40.83037811977803]
Dynaformerは、タンパク質-リガンド結合親和性を予測するために開発されたグラフベースのディープラーニングモデルである。
CASF-2016ベンチマークデータセットでは、最先端のスコアとランキングの能力を示している。
熱ショックタンパク質90(HSP90)の仮想スクリーニングにおいて、20の候補を同定し、それらの結合親和性を実験的に検証する。
論文 参考訳(メタデータ) (2022-08-19T14:55:12Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - KNODE-MPC: A Knowledge-based Data-driven Predictive Control Framework
for Aerial Robots [5.897728689802829]
我々は、知識に基づくニューラル常微分方程式(KNODE)というディープラーニングツールを用いて、第一原理から得られたモデルを拡張する。
得られたハイブリッドモデルは、名目上の第一原理モデルと、シミュレーションまたは実世界の実験データから学習したニューラルネットワークの両方を含む。
閉ループ性能を改善するため、ハイブリッドモデルはKNODE-MPCとして知られる新しいMPCフレームワークに統合される。
論文 参考訳(メタデータ) (2021-09-10T12:09:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。