論文の概要: A Scalable and Quantum-Accurate Foundation Model for Biomolecular Force Field via Linearly Tensorized Quadrangle Attention
- arxiv url: http://arxiv.org/abs/2507.00884v1
- Date: Tue, 01 Jul 2025 15:52:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:14.783981
- Title: A Scalable and Quantum-Accurate Foundation Model for Biomolecular Force Field via Linearly Tensorized Quadrangle Attention
- Title(参考訳): リニアテンソル化四角形アテンションによる生体分子力場のためのスケーラブルかつ量子精度基礎モデル
- Authors: Qun Su, Kai Zhu, Qiaolin Gou, Jintu Zhang, Renling Hu, Yurong Li, Yongze Wang, Hui Zhang, Ziyi You, Linlong Jiang, Yu Kang, Jike Wang, Chang-Yu Hsieh, Tingjun Hou,
- Abstract要約: 我々は、原子性生体分子シミュレーションのための新しいAIベースの力場フレームワークLiTENを紹介する。
LiTENをベースとしたLiTEN-FFは、幅広い化学一般化のためのnablaDFTデータセットで事前訓練された堅牢なAIFF基盤モデルである。
LiTENは、rMD17、MD22、Chignolinのほとんどの評価サブセットでSOTA(State-of-the-art)のパフォーマンスを達成し、MACE、NequIP、EquiFormerといった主要なモデルよりも優れている。
- 参考スコア(独自算出の注目度): 6.749581549330875
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate atomistic biomolecular simulations are vital for disease mechanism understanding, drug discovery, and biomaterial design, but existing simulation methods exhibit significant limitations. Classical force fields are efficient but lack accuracy for transition states and fine conformational details critical in many chemical and biological processes. Quantum Mechanics (QM) methods are highly accurate but computationally infeasible for large-scale or long-time simulations. AI-based force fields (AIFFs) aim to achieve QM-level accuracy with efficiency but struggle to balance many-body modeling complexity, accuracy, and speed, often constrained by limited training data and insufficient validation for generalizability. To overcome these challenges, we introduce LiTEN, a novel equivariant neural network with Tensorized Quadrangle Attention (TQA). TQA efficiently models three- and four-body interactions with linear complexity by reparameterizing high-order tensor features via vector operations, avoiding costly spherical harmonics. Building on LiTEN, LiTEN-FF is a robust AIFF foundation model, pre-trained on the extensive nablaDFT dataset for broad chemical generalization and fine-tuned on SPICE for accurate solvated system simulations. LiTEN achieves state-of-the-art (SOTA) performance across most evaluation subsets of rMD17, MD22, and Chignolin, outperforming leading models such as MACE, NequIP, and EquiFormer. LiTEN-FF enables the most comprehensive suite of downstream biomolecular modeling tasks to date, including QM-level conformer searches, geometry optimization, and free energy surface construction, while offering 10x faster inference than MACE-OFF for large biomolecules (~1000 atoms). In summary, we present a physically grounded, highly efficient framework that advances complex biomolecular modeling, providing a versatile foundation for drug discovery and related applications.
- Abstract(参考訳): 正確な原子性生体分子シミュレーションは、疾患機構の理解、薬物発見、生体材料設計に欠かせないが、既存のシミュレーション手法には重大な限界がある。
古典的な力場は効率的であるが、遷移状態や多くの化学や生物学的プロセスにおいて重要な微細なコンフォメーション細部には正確性がない。
量子力学(Quantum Mechanics, QM)法は非常に正確であるが、大規模または長期のシミュレーションでは計算不可能である。
AIベースの力場(AIFF)は、QMレベルの精度を効率で達成することを目的としているが、多体モデリングの複雑さ、正確性、スピードのバランスをとるのに苦労している。
これらの課題を克服するために、テンソル化四角形注意(TQA)を持つ新しい同変ニューラルネットワークLiTENを紹介する。
TQAは、ベクトル演算により高次テンソル特徴を再パラメータ化し、コストのかかる球面調和を回避することで、線形複雑性を伴う3次元と4次元の相互作用を効率的にモデル化する。
LiTENをベースとしたLiTEN-FFはAIFF基盤モデルであり、幅広い化学一般化のためのnablaDFTデータセットで事前訓練され、正確な解法系シミュレーションのためにSPICEで微調整される。
LiTENは、rMD17、MD22、Chignolinのほとんどの評価サブセットでSOTA(State-of-the-art)のパフォーマンスを達成し、MACE、NequIP、EquiFormerといった主要なモデルよりも優れている。
LiTEN-FFは、QMレベルのコンバータ探索、幾何最適化、自由エネルギー表面構築を含む、これまでで最も包括的な下流の生体分子モデリング作業を可能にし、大きな生体分子(約1000原子)に対して、MACE-OFFよりも10倍高速な推論を提供する。
まとめると、複雑な生体分子モデリングを推進し、薬物発見と関連する応用のための汎用的な基盤を提供する物理基盤、高効率な枠組みを提示する。
関連論文リスト
- Iterative Distillation for Reward-Guided Fine-Tuning of Diffusion Models in Biomolecular Design [53.93023688824764]
生体分子設計における報酬誘導生成のための微調整拡散モデルの問題に対処する。
本稿では,拡散モデルによる任意の報酬関数の最適化を可能にする,反復蒸留に基づく微調整フレームワークを提案する。
KLの発散最小化と相まって,既存のRL法と比較してトレーニングの安定性とサンプル効率を向上させる。
論文 参考訳(メタデータ) (2025-07-01T05:55:28Z) - Machine learning surrogate models of many-body dispersion interactions in polymer melts [40.83978401377059]
本稿では,高分子融液中のMBD力を予測するための機械学習サロゲートモデルを提案する。
我々のモデルは、最も関連する原子結合を選択的に保持する、トリミングされたSchNetアーキテクチャに基づいている。
高計算効率で特徴付けられるサロゲートモデルにより、大規模な分子シミュレーションにMBD効果を実践的に組み込むことが可能となる。
論文 参考訳(メタデータ) (2025-03-19T12:15:35Z) - UniGenX: Unified Generation of Sequence and Structure with Autoregressive Diffusion [61.690978792873196]
既存のアプローチは自己回帰シーケンスモデルか拡散モデルのいずれかに依存している。
自己回帰的次トーケン予測と条件拡散モデルを組み合わせた統合フレームワークUniGenXを提案する。
材料および小分子生成タスクにおけるUniGenXの有効性を検証する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - BoostMD: Accelerating molecular sampling by leveraging ML force field features from previous time-steps [3.8214695776749013]
BoostMDは分子動力学シミュレーションを高速化するために設計されたサロゲートモデルアーキテクチャである。
実験の結果,BoostMDは参照モデルと比較して8倍のスピードアップを実現していることがわかった。
効率的な機能再利用と合理化されたアーキテクチャを組み合わせることで、BoostMDは大規模で長期の分子シミュレーションを行うための堅牢なソリューションを提供する。
論文 参考訳(メタデータ) (2024-12-21T20:52:36Z) - Data-Driven Parametrization of Molecular Mechanics Force Fields for Expansive Chemical Space Coverage [16.745564099126575]
我々は、薬物様分子のアンバー互換力場であるByteFFを開発した。
本モデルでは, 薬物様分子のすべての結合および非結合MM力場パラメータを, 広い化学空間にわたって同時に予測する。
論文 参考訳(メタデータ) (2024-08-23T03:37:06Z) - A Multi-Grained Symmetric Differential Equation Model for Learning Protein-Ligand Binding Dynamics [73.35846234413611]
薬物発見において、分子動力学(MD)シミュレーションは、結合親和性を予測し、輸送特性を推定し、ポケットサイトを探索する強力なツールを提供する。
我々は,数値MDを容易にし,タンパク質-リガンド結合ダイナミクスの正確なシミュレーションを提供する,最初の機械学習サロゲートであるNeuralMDを提案する。
従来の数値MDシミュレーションと比較して1K$times$ Speedupを実現することにより,NeuralMDの有効性と有効性を示す。
論文 参考訳(メタデータ) (2024-01-26T09:35:17Z) - Multi-fidelity Hierarchical Neural Processes [79.0284780825048]
多要素代理モデリングは、異なるシミュレーション出力を融合させることで計算コストを削減する。
本稿では,多階層型階層型ニューラルネットワーク(MF-HNP)を提案する。
疫学および気候モデリングタスクにおけるMF-HNPの評価を行い、精度と不確実性評価の観点から競合性能を達成した。
論文 参考訳(メタデータ) (2022-06-10T04:54:13Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z) - A Universal Framework for Featurization of Atomistic Systems [0.0]
物理や機械学習に基づく反応力場は、時間と長さのスケールのギャップを埋めるために使うことができる。
本稿では,原子周囲の電子密度の物理的に関連する多極展開を利用するガウス多極(GMP)デデュール化スキームを紹介する。
我々は,GMPに基づくモデルがQM9データセットの化学的精度を達成できることを示し,新しい要素を外挿してもその精度は妥当であることを示した。
論文 参考訳(メタデータ) (2021-02-04T03:11:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。