論文の概要: Performance of universal machine-learned potentials with explicit long-range interactions in biomolecular simulations
- arxiv url: http://arxiv.org/abs/2508.10841v1
- Date: Thu, 14 Aug 2025 17:08:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.425511
- Title: Performance of universal machine-learned potentials with explicit long-range interactions in biomolecular simulations
- Title(参考訳): 生体分子シミュレーションにおける明示的な長距離相互作用を持つ普遍機械学習電位の性能
- Authors: Viktor Zaverkin, Matheus Ferraz, Francesco Alesiani, Mathias Niepert,
- Abstract要約: 普遍的な機械学習ポテンシャルは、構成的および振動的自由度間で伝達可能な精度を約束する。
この研究は、SPICE-v2データセットで訓練された均質なメッセージパッシングアーキテクチャを、明示的な長距離分散と静電効果なしで体系的に評価する。
- 参考スコア(独自算出の注目度): 21.340102594388348
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Universal machine-learned potentials promise transferable accuracy across compositional and vibrational degrees of freedom, yet their application to biomolecular simulations remains underexplored. This work systematically evaluates equivariant message-passing architectures trained on the SPICE-v2 dataset with and without explicit long-range dispersion and electrostatics. We assess the impact of model size, training data composition, and electrostatic treatment across in- and out-of-distribution benchmark datasets, as well as molecular simulations of bulk liquid water, aqueous NaCl solutions, and biomolecules, including alanine tripeptide, the mini-protein Trp-cage, and Crambin. While larger models improve accuracy on benchmark datasets, this trend does not consistently extend to properties obtained from simulations. Predicted properties also depend on the composition of the training dataset. Long-range electrostatics show no systematic impact across systems. However, for Trp-cage, their inclusion yields increased conformational variability. Our results suggest that imbalanced datasets and immature evaluation practices currently challenge the applicability of universal machine-learned potentials to biomolecular simulations.
- Abstract(参考訳): 普遍的な機械学習ポテンシャルは、構成的および振動的自由度で伝達可能な精度を約束するが、生体分子シミュレーションへの応用は未解明のままである。
この研究は、SPICE-v2データセットで訓練された均質なメッセージパッシングアーキテクチャを、明示的な長距離分散と静電効果なしで体系的に評価する。
また, モデルサイズ, トレーニングデータ組成, 静電気処理の影響, および, バルク液, ナトリウム水溶液, 生体分子の分子シミュレーションを行った。
より大きなモデルではベンチマークデータセットの精度が向上するが、この傾向はシミュレーションから得られたプロパティに一貫して拡張されない。
予測プロパティはトレーニングデータセットの構成にも依存する。
長距離静電気はシステム全体に系統的な影響を示さない。
しかし, Trp-cageでは, 包接収率はコンフォメーションの多様性が増大した。
この結果から, 現在, 不均衡なデータセットと未熟な評価手法が, 生体分子シミュレーションへの普遍的な機械学習ポテンシャルの適用性に疑問を投げかけていることが示唆された。
関連論文リスト
- Protein Language Model Embeddings Improve Generalization of Implicit Transfer Operators [10.025462072265706]
分子動力学のための暗黙的伝達演算子のデータ効率と一般化を,補助的な情報源を組み込むことで向上できることを示す。
我々のアプローチであるPLaTITOは、非分布タンパク質系の平衡サンプリングベンチマークにおける最先端の性能を達成する。
論文 参考訳(メタデータ) (2026-02-11T09:26:12Z) - Equivariant Evidential Deep Learning for Interatomic Potentials [55.6997213490859]
不確かさの定量化は、分子動力学シミュレーションにおける機械学習の原子間ポテンシャルの信頼性を評価するために重要である。
既存のMLIPのUQアプローチは、高い計算コストや準最適性能によって制限されることが多い。
我々は,原子間ポテンシャルの定量的深層学習(texte2$IP)を提案する。
論文 参考訳(メタデータ) (2026-02-11T02:00:25Z) - Independent Component Discovery in Temporal Count Data [46.526610368455096]
本稿では、時間数データの独立成分分析のための生成フレームワークを導入し、レギュラー適応力学とポアソン対数正規放出を組み合わせた。
このモデルは、状態に依存したコントリビューションで絡み合ったコンポーネントを特定し、表現学習と摂動解析を可能にする。
論文 参考訳(メタデータ) (2026-01-29T13:30:10Z) - Surface Stability Modeling with Universal Machine Learning Interatomic Potentials: A Comprehensive Cleavage Energy Benchmarking Study [0.0]
機械学習の原子間ポテンシャル(MLIP)は計算材料科学に革命をもたらした。
これらの普遍的なMLIPがいかにエネルギーの切断を予測できるかを体系的な評価は行われていない。
クリーンエネルギー予測のための19種類の最先端のUMLIPのベンチマークを示す。
論文 参考訳(メタデータ) (2025-08-29T14:24:47Z) - Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - A predictive machine learning force field framework for liquid electrolyte development [11.463808946378743]
本稿では,分子動力学(MD)シミュレーションの予測フレームワークであるBAMBOOを紹介する。
我々は、量子力学シミュレーションから学ぶため、BAMBOOのバックボーンとして、物理に着想を得たグラフ同変変変圧器アーキテクチャを設計する。
また,アンサンブル知識蒸留手法を導入してMLFFに適用し,MDシミュレーションによる観測の変動を低減する。
論文 参考訳(メタデータ) (2024-04-10T17:31:49Z) - Enhanced sampling of robust molecular datasets with uncertainty-based
collective variables [0.0]
化学関連データポイントの取得を導くために,不確実性を集合変数(CV)として活用する手法を提案する。
このアプローチでは、1つのモデルからのガウス混合モデルに基づく不確実性測定を、偏りのある分子動力学シミュレーションのためのCVとして採用する。
論文 参考訳(メタデータ) (2024-02-06T06:42:51Z) - Evaluating the Transferability of Machine-Learned Force Fields for
Material Property Modeling [2.494740426749958]
本稿では,機械学習力場の伝達性を評価するため,より包括的なベンチマークテストを提案する。
我々は、OpenMMパッケージと結合したグラフニューラルネットワーク(GNN)ベースの力場を用いて、ArgonのMDシミュレーションを実行する。
実験結果から, モデルが固体相の挙動を正確に把握できるのは, 固体相の構成がトレーニングデータセットに含まれる場合のみであることがわかった。
論文 参考訳(メタデータ) (2023-01-10T00:25:48Z) - Conditional Generative Models for Simulation of EMG During Naturalistic
Movements [45.698312905115955]
本稿では、運動単位活性化電位波形を生成するために、逆向きに訓練された条件付き生成ニューラルネットワークを提案する。
本研究では,より少ない数の数値モデルの出力を高い精度で予測的に補間できることを実証する。
論文 参考訳(メタデータ) (2022-11-03T14:49:02Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Designing Machine Learning Surrogates using Outputs of Molecular
Dynamics Simulations as Soft Labels [0.0]
分子動力学シミュレーションの出力に関する統計的不確実性は、人工ニューラルネットワークのトレーニングに利用できることを示す。
推定平均出力量に不確かさを組み込むことにより,シミュレーション出力のソフトラベルを設計する。
このアプローチは、閉じ込められた電解質の分子動力学シミュレーションのためのサロゲートの設計で説明される。
論文 参考訳(メタデータ) (2021-10-27T19:00:40Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。