論文の概要: MarS-FM: Generative Modeling of Molecular Dynamics via Markov State Models
- arxiv url: http://arxiv.org/abs/2509.24779v1
- Date: Mon, 29 Sep 2025 13:42:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:20.010995
- Title: MarS-FM: Generative Modeling of Molecular Dynamics via Markov State Models
- Title(参考訳): MarS-FM:マルコフ状態モデルによる分子動力学の生成モデリング
- Authors: Kacper Kapuśniak, Cristian Gabellini, Michael Bronstein, Prudencio Tossou, Francesco Di Giovanni,
- Abstract要約: 我々は、マルコフ状態モデル(MSM)によって定義された離散状態の遷移をサンプル化する新しい生成モデル、MSMエミュレータを導入する。
本評価は, タンパク質ドメインに, 展開イベントを含む化学的, 構造的多様性を有し, 一般化を評価するために, トレーニングセットとテストセットの厳密な配列の相違を強制する。
- 参考スコア(独自算出の注目度): 4.818682161738301
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Molecular Dynamics (MD) is a powerful computational microscope for probing protein functions. However, the need for fine-grained integration and the long timescales of biomolecular events make MD computationally expensive. To address this, several generative models have been proposed to generate surrogate trajectories at lower cost. Yet, these models typically learn a fixed-lag transition density, causing the training signal to be dominated by frequent but uninformative transitions. We introduce a new class of generative models, MSM Emulators, which instead learn to sample transitions across discrete states defined by an underlying Markov State Model (MSM). We instantiate this class with Markov Space Flow Matching (MarS-FM), whose sampling offers more than two orders of magnitude speedup compared to implicit- or explicit-solvent MD simulations. We benchmark Mars-FM ability to reproduce MD statistics through structural observables such as RMSD, radius of gyration, and secondary structure content. Our evaluation spans protein domains (up to 500 residues) with significant chemical and structural diversity, including unfolding events, and enforces strict sequence dissimilarity between training and test sets to assess generalization. Across all metrics, MarS-FM outperforms existing methods, often by a substantial margin.
- Abstract(参考訳): 分子動力学(MD)はタンパク質の機能を調べるための強力な計算顕微鏡である。
しかし、微細な積分や生体分子イベントの長時間の時間スケールの必要性は、MDを計算的に高価にしている。
これを解決するために、サロゲート軌道を低コストで生成するいくつかの生成モデルが提案されている。
しかし、これらのモデルは通常固定ラグ遷移密度を学習し、トレーニング信号は頻繁だが非形式的な遷移によって支配される。
我々は、MSMエミュレータと呼ばれる新しい生成モデルのクラスを導入し、その代わりに、基礎となるマルコフ状態モデル(MSM)によって定義された離散状態の遷移をサンプル化する。
このクラスをマルコフ空間フローマッチング (MarS-FM) を用いてインスタンス化し, 暗黙的あるいは明示的解法MDシミュレーションと比較して2桁以上の精度でサンプリングを行う。
我々は、RMSD、ジャイレーション半径、二次構造含量などの構造観測物を通してMD統計を再現するMars-FM能力をベンチマークした。
本評価は, タンパク質ドメイン(最大500残基)に, 展開イベントを含む化学的および構造的多様性を有し, 一般化を評価するために, トレーニングセットとテストセットの厳密な配列の相違を強制する。
すべての指標において、MarS-FMは既存の手法よりも優れており、多くの場合かなりの差がある。
関連論文リスト
- SurGBSA: Learning Representations From Molecular Dynamics Simulations [5.910755265815443]
薬物のような化合物やタンパク質の静的構造からの自己教師付き事前学習は、強力な学習された特徴表現を可能にする。
MDに基づく表現学習のための新しいモデリング手法として,SURrogate mmGBSAを提案する。
物理インフォームド・プレトレーニングの利点を初めて示し,140万以上の3次元軌跡の集合体上で代理MMGBSAモデルを訓練した。
論文 参考訳(メタデータ) (2025-09-03T07:27:21Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Generative Modeling of Molecular Dynamics Trajectories [12.255021091552441]
データからMDの柔軟なマルチタスクサロゲートモデルを学ぶためのパラダイムとして,分子軌道の生成モデルを提案する。
このような生成モデルは,前方シミュレーションや遷移経路サンプリング,軌道上アップサンプリングといった多様なタスクに適応可能であることを示す。
論文 参考訳(メタデータ) (2024-09-26T13:02:28Z) - Masked Diffusion Models are Secretly Time-Agnostic Masked Models and Exploit Inaccurate Categorical Sampling [47.82616476928464]
仮面拡散モデル (MDM) は離散データの生成モデルとして人気がある。
我々はMDMのトレーニングとサンプリングの両方が理論的に時間変数から解放されていることを示す。
一般に使用されている32ビット浮動小数点精度においても,まず基礎となる数値問題を同定した。
論文 参考訳(メタデータ) (2024-09-04T17:48:19Z) - A Multi-Grained Symmetric Differential Equation Model for Learning Protein-Ligand Binding Dynamics [73.35846234413611]
薬物発見において、分子動力学(MD)シミュレーションは、結合親和性を予測し、輸送特性を推定し、ポケットサイトを探索する強力なツールを提供する。
我々は,数値MDを容易にし,タンパク質-リガンド結合ダイナミクスの正確なシミュレーションを提供する,最初の機械学習サロゲートであるNeuralMDを提案する。
従来の数値MDシミュレーションと比較して1K$times$ Speedupを実現することにより,NeuralMDの有効性と有効性を示す。
論文 参考訳(メタデータ) (2024-01-26T09:35:17Z) - Timewarp: Transferable Acceleration of Molecular Dynamics by Learning
Time-Coarsened Dynamics [24.13304926093212]
我々は,マルコフ連鎖モンテカルロ法において,正規化フローを提案分布として用いる改良されたサンプリング手法であるTimewarpを提案する。
フローはMDトラジェクトリ上でオフラインでトレーニングされ,105~106:textrmfs$の分子動力学をシミュレートして,大きなステップの時間化を学ぶ。
論文 参考訳(メタデータ) (2023-02-02T15:48:39Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。