論文の概要: SurGBSA: Learning Representations From Molecular Dynamics Simulations
- arxiv url: http://arxiv.org/abs/2509.03084v2
- Date: Wed, 10 Sep 2025 23:46:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-12 11:47:11.865652
- Title: SurGBSA: Learning Representations From Molecular Dynamics Simulations
- Title(参考訳): SurGBSA:分子動力学シミュレーションから学ぶ
- Authors: Derek Jones, Yue Yang, Felice C. Lightstone, Niema Moshiri, Jonathan E. Allen, Tajana S. Rosing,
- Abstract要約: 薬物のような化合物やタンパク質の静的構造からの自己教師付き事前学習は、強力な学習された特徴表現を可能にする。
MDに基づく表現学習のための新しいモデリング手法として,SURrogate mmGBSAを提案する。
物理インフォームド・プレトレーニングの利点を初めて示し,140万以上の3次元軌跡の集合体上で代理MMGBSAモデルを訓練した。
- 参考スコア(独自算出の注目度): 5.910755265815443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised pretraining from static structures of drug-like compounds and proteins enable powerful learned feature representations. Learned features demonstrate state of the art performance on a range of predictive tasks including molecular properties, structure generation, and protein-ligand interactions. The majority of approaches are limited by their use of static structures and it remains an open question, how best to use atomistic molecular dynamics (MD) simulations to develop more generalized models to improve prediction accuracy for novel molecular structures. We present SURrogate mmGBSA (SurGBSA) as a new modeling approach for MD-based representation learning, which learns a surrogate function of the Molecular Mechanics Generalized Born Surface Area (MMGBSA). We show for the first time the benefits of physics-informed pre-training to train a surrogate MMGBSA model on a collection of over 1.4 million 3D trajectories collected from MD simulations of the CASF-2016 benchmark. SurGBSA demonstrates a dramatic 27,927x speedup versus a traditional physics-based single-point MMGBSA calculation while nearly matching single-point MMGBSA accuracy on the challenging pose ranking problem for identification of the correct top pose (-0.4% difference). Our work advances the development of molecular foundation models by showing model improvements when training on MD simulations. Models, code and training data are made publicly available.
- Abstract(参考訳): 薬物のような化合物やタンパク質の静的構造からの自己教師付き事前学習は、強力な学習された特徴表現を可能にする。
学習された特徴は、分子特性、構造生成、タンパク質-リガンド相互作用を含む様々な予測タスクにおける最先端のパフォーマンスを示す。
大部分のアプローチは静的構造の使用によって制限されており、新しい分子構造に対する予測精度を改善するためにより一般化されたモデルを開発するために、原子論分子動力学(MD)シミュレーションをどのように使うのが最適かというオープンな疑問である。
MDに基づく表現学習のための新しいモデリング手法としてSURrogate mmGBSA(SurGBSA)を提案する。
本稿では,CASF-2016ベンチマークのMDシミュレーションから収集した140万点以上の3Dトラジェクトリを用いて,Surrogate MMGBSAモデルをトレーニングするための物理インフォームドプレトレーニングの利点を初めて示す。
SurGBSAは、従来の物理学ベースのシングルポイントMMGBSA計算と比較して劇的な27,927倍のスピードアップを示し、正しいトップポーズの識別に挑戦するポーズランキング問題(-0.4%の差)について、シングルポイントMMGBSAの精度とほぼ一致している。
本研究は,MDシミュレーションのトレーニングにおいて,モデル改良を示すことによって,分子基盤モデルの開発を進める。
モデル、コード、トレーニングデータは公開されています。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Generative Modeling of Molecular Dynamics Trajectories [12.255021091552441]
データからMDの柔軟なマルチタスクサロゲートモデルを学ぶためのパラダイムとして,分子軌道の生成モデルを提案する。
このような生成モデルは,前方シミュレーションや遷移経路サンプリング,軌道上アップサンプリングといった多様なタスクに適応可能であることを示す。
論文 参考訳(メタデータ) (2024-09-26T13:02:28Z) - A Multi-Grained Symmetric Differential Equation Model for Learning Protein-Ligand Binding Dynamics [73.35846234413611]
薬物発見において、分子動力学(MD)シミュレーションは、結合親和性を予測し、輸送特性を推定し、ポケットサイトを探索する強力なツールを提供する。
我々は,数値MDを容易にし,タンパク質-リガンド結合ダイナミクスの正確なシミュレーションを提供する,最初の機械学習サロゲートであるNeuralMDを提案する。
従来の数値MDシミュレーションと比較して1K$times$ Speedupを実現することにより,NeuralMDの有効性と有効性を示す。
論文 参考訳(メタデータ) (2024-01-26T09:35:17Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - From Static to Dynamic Structures: Improving Binding Affinity Prediction with Graph-Based Deep Learning [40.83037811977803]
Dynaformerは、タンパク質-リガンド結合親和性を予測するために開発されたグラフベースのディープラーニングモデルである。
CASF-2016ベンチマークデータセットでは、最先端のスコアとランキングの能力を示している。
熱ショックタンパク質90(HSP90)の仮想スクリーニングにおいて、20の候補を同定し、それらの結合親和性を実験的に検証する。
論文 参考訳(メタデータ) (2022-08-19T14:55:12Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。