論文の概要: Protein Language Model Embeddings Improve Generalization of Implicit Transfer Operators
- arxiv url: http://arxiv.org/abs/2602.11216v1
- Date: Wed, 11 Feb 2026 09:26:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.457739
- Title: Protein Language Model Embeddings Improve Generalization of Implicit Transfer Operators
- Title(参考訳): タンパク質言語モデル埋め込みによるインシシトトランスファーオペレータの一般化
- Authors: Panagiotis Antoniadis, Beatrice Pavesi, Simon Olsson, Ole Winther,
- Abstract要約: 分子動力学のための暗黙的伝達演算子のデータ効率と一般化を,補助的な情報源を組み込むことで向上できることを示す。
我々のアプローチであるPLaTITOは、非分布タンパク質系の平衡サンプリングベンチマークにおける最先端の性能を達成する。
- 参考スコア(独自算出の注目度): 10.025462072265706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecular dynamics (MD) is a central computational tool in physics, chemistry, and biology, enabling quantitative prediction of experimental observables as expectations over high-dimensional molecular distributions such as Boltzmann distributions and transition densities. However, conventional MD is fundamentally limited by the high computational cost required to generate independent samples. Generative molecular dynamics (GenMD) has recently emerged as an alternative, learning surrogates of molecular distributions either from data or through interaction with energy models. While these methods enable efficient sampling, their transferability across molecular systems is often limited. In this work, we show that incorporating auxiliary sources of information can improve the data efficiency and generalization of transferable implicit transfer operators (TITO) for molecular dynamics. We find that coarse-grained TITO models are substantially more data-efficient than Boltzmann Emulators, and that incorporating protein language model (pLM) embeddings further improves out-of-distribution generalization. Our approach, PLaTITO, achieves state-of-the-art performance on equilibrium sampling benchmarks for out-of-distribution protein systems, including fast-folding proteins. We further study the impact of additional conditioning signals -- such as structural embeddings, temperature, and large-language-model-derived embeddings -- on model performance.
- Abstract(参考訳): 分子動力学 (MD) は物理学、化学、生物学において中心的な計算ツールであり、ボルツマン分布や遷移密度のような高次元の分子分布に対する期待値として実験可観測物の定量的予測を可能にする。
しかし、従来のMDは、独立したサンプルを生成するのに必要な高い計算コストによって、基本的に制限されている。
生成分子動力学(GenMD)は、データまたはエネルギーモデルとの相互作用を通して、分子分布の代用として最近登場した。
これらの方法は効率的なサンプリングを可能にするが、分子系間での転送可能性はしばしば制限される。
本研究では,分子動力学におけるデータ効率の向上と移動可能な暗黙的伝達演算子(TITO)の一般化について述べる。
粗粒のTITOモデルはボルツマン・エミュレータよりもかなりデータ効率が良く,タンパク質言語モデル(pLM)を組み込むことで分布外一般化がさらに向上することがわかった。
我々のアプローチであるPLaTITOは、高速な折りたたみタンパク質を含む非分布タンパク質系に対する平衡サンプリングベンチマークの最先端性能を達成する。
さらに、構造埋め込み、温度、大言語モデル由来の埋め込みなどの追加条件信号がモデル性能に与える影響について検討する。
関連論文リスト
- Learning Inter-Atomic Potentials without Explicit Equivariance [24.438029202222555]
TransIP: Transformer-based Inter-Atomic Potentialsは、原子間ポテンシャルの新たなトレーニングパラダイムである。
提案手法は, 組込み空間における表現を最適化することにより, SO(3)-同変を学習するための汎用的非同変トランスフォーマーモデルである。
データ拡張ベースラインと比較して、TransIPはさまざまなOMol25データセットサイズで40%から60%のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-09-25T22:15:10Z) - Consistent Sampling and Simulation: Molecular Dynamics with Energy-Based Diffusion Models [50.77646970127369]
本稿では,Fokker-Planck由来の正規化項を用いたエネルギーベース拡散モデルを提案する。
高速折りたたみタンパク質を含む複数の生体分子系をサンプリング・シミュレートし,本手法を実証する。
論文 参考訳(メタデータ) (2025-06-20T16:38:29Z) - MDDM: A Molecular Dynamics Diffusion Model to Predict Particle Self-Assembly [0.7078672343881657]
分子動力学拡散モデルでは、与えられた入力対ポテンシャル関数の有効な出力を予測することができる。
このモデルは、非条件および条件付き生成タスクのベースライン点雲拡散モデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2025-01-28T22:21:45Z) - MING: A Functional Approach to Learning Molecular Generative Models [46.189683355768736]
本稿では,関数表現に基づく分子生成モデル学習のための新しいパラダイムを提案する。
本稿では,関数空間における分子分布を学習する拡散モデルである分子インプリシットニューラルジェネレーション(MING)を提案する。
論文 参考訳(メタデータ) (2024-10-16T13:02:02Z) - Analysis of Atom-level pretraining with Quantum Mechanics (QM) data for Graph Neural Networks Molecular property models [0.0]
量子力学(QM)データを用いた原子レベルの事前トレーニングは、トレーニングデータとテストデータ間の分布類似性に関する仮定違反を軽減することができることを示す。
隠れ状態の分子表現を解析し、QMデータに対する分子レベルと原子レベルの事前学習の効果を比較するのは、これが初めてである。
論文 参考訳(メタデータ) (2024-05-23T17:51:05Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Navigating protein landscapes with a machine-learned transferable
coarse-grained model [29.252004942896875]
同様の予測性能を持つ粗粒度(CG)モデルは、長年にわたる課題である。
ケミカルトランスポータビリティを持つボトムアップCG力場を開発し,新しい配列の分子動力学に利用することができる。
本モデルでは, 折り畳み構造, 中間体, メタスタブル折り畳み型および折り畳み型流域, 内在的に不規則なタンパク質のゆらぎの予測に成功している。
論文 参考訳(メタデータ) (2023-10-27T17:10:23Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Learning Neural Generative Dynamics for Molecular Conformation
Generation [89.03173504444415]
分子グラフから分子コンフォメーション(つまり3d構造)を生成する方法を検討した。
分子グラフから有効かつ多様なコンフォーメーションを生成する新しい確率論的枠組みを提案する。
論文 参考訳(メタデータ) (2021-02-20T03:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。