論文の概要: May the Force be with You: Unified Force-Centric Pre-Training for 3D
Molecular Conformations
- arxiv url: http://arxiv.org/abs/2308.14759v1
- Date: Thu, 24 Aug 2023 01:54:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-03 21:21:22.732878
- Title: May the Force be with You: Unified Force-Centric Pre-Training for 3D
Molecular Conformations
- Title(参考訳): 3d分子コンフォメーションのための統一された力中心事前トレーニング
- Authors: Rui Feng, Qi Zhu, Huan Tran, Binghong Chen, Aubrey Toland, Rampi
Ramprasad, Chao Zhang
- Abstract要約: 平衡データとオフ平衡データの両方をカバーする3次元分子配座のための力中心事前学習モデルを提案する。
平衡データに対しては, ゼロフォース正則化と強制的復調法を導入し, 近似平衡力について検討する。
実験により, 事前学習目標により, 未訓練の同変変変圧器モデルと比較して, 力の精度を約3倍に向上することを示した。
- 参考スコア(独自算出の注目度): 19.273404278711794
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent works have shown the promise of learning pre-trained models for 3D
molecular representation. However, existing pre-training models focus
predominantly on equilibrium data and largely overlook off-equilibrium
conformations. It is challenging to extend these methods to off-equilibrium
data because their training objective relies on assumptions of conformations
being the local energy minima. We address this gap by proposing a force-centric
pretraining model for 3D molecular conformations covering both equilibrium and
off-equilibrium data. For off-equilibrium data, our model learns directly from
their atomic forces. For equilibrium data, we introduce zero-force
regularization and forced-based denoising techniques to approximate
near-equilibrium forces. We obtain a unified pre-trained model for 3D molecular
representation with over 15 million diverse conformations. Experiments show
that, with our pre-training objective, we increase forces accuracy by around 3
times compared to the un-pre-trained Equivariant Transformer model. By
incorporating regularizations on equilibrium data, we solved the problem of
unstable MD simulations in vanilla Equivariant Transformers, achieving
state-of-the-art simulation performance with 2.45 times faster inference time
than NequIP. As a powerful molecular encoder, our pre-trained model achieves
on-par performance with state-of-the-art property prediction tasks.
- Abstract(参考訳): 近年の研究では、3次元分子表現のための事前学習モデルが期待されている。
しかし、既存の事前学習モデルは、主に平衡データに焦点を合わせ、主に非平衡コンフォメーションを見落としている。
これらの手法を非平衡データに拡張することは、その訓練目的が局所エネルギーミニマであるコンフォーメーションの仮定に依存するため困難である。
このギャップに対処するために、平衡データとオフ平衡データの両方をカバーする3次元分子配座のための力中心事前学習モデルを提案する。
オフバランスデータでは,モデルが原子間力から直接学習する。
平衡データに対して, ゼロフォース正則化法と強制制御法を導入し, 近平衡力を近似する。
我々は、1500万以上の多様なコンフォメーションを持つ3次元分子表現のための統一事前学習モデルを得る。
実験により, プレトレーニング目標により, プレトレーニングされた等変変圧器モデルと比較して, 力の精度が約3倍向上することを示した。
平衡データに正規化を組み込むことにより,バニラ等価変圧器における不安定MDシミュレーションの問題を解消し,NequIPの2.45倍の速度で最先端のシミュレーション性能を実現する。
分子エンコーダとして、我々の事前学習モデルは、最先端特性予測タスクでオンパー性能を達成する。
関連論文リスト
- Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - A Multi-Grained Symmetric Differential Equation Model for Learning
Protein-Ligand Binding Dynamics [74.93549765488103]
薬物発見において、分子動力学シミュレーションは、結合親和性を予測し、輸送特性を推定し、ポケットサイトを探索する強力なツールを提供する。
我々は,数値MDを容易にし,タンパク質-リガンド結合の正確なシミュレーションを提供する,最初の機械学習サロゲートであるNeuralMDを提案する。
我々は、標準的な数値MDシミュレーションよりも2000$times$のスピードアップを達成し、安定性の指標の下では、他のMLアプローチよりも最大80%高い効率で、NeuralMDの有効性と有効性を示す。
論文 参考訳(メタデータ) (2024-01-26T09:35:17Z) - Highly Accurate Quantum Chemical Property Prediction with Uni-Mol+ [36.61144345418364]
量子化学(QC)特性の予測を高速化するために,Uni-Mol+と呼ばれる新しい手法を提案する。
2トラックトランスフォーマーモデルバックボーンを導入し、QC特性予測タスクでトレーニングする。
ベンチマークの結果,提案したUni-Mol+はQC特性予測の精度を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-03-16T07:51:34Z) - 3D Equivariant Diffusion for Target-Aware Molecule Generation and
Affinity Prediction [9.67574543046801]
標的薬物設計における3D構造の導入は、他の標的のないモデルよりも優れた性能を示す。
上記の課題を解決するために,3次元同変拡散モデルを開発した。
我々のモデルは、より現実的な3D構造とタンパク質標的に対する親和性を持つ分子を生成し、再学習することなく結合親和性ランキングと予測を改善することができる。
論文 参考訳(メタデータ) (2023-03-06T23:01:43Z) - Stabilizing Machine Learning Prediction of Dynamics: Noise and
Noise-inspired Regularization [58.720142291102135]
近年、機械学習(ML)モデルはカオス力学系の力学を正確に予測するために訓練可能であることが示されている。
緩和技術がなければ、この技術は人工的に迅速にエラーを発生させ、不正確な予測と/または気候不安定をもたらす可能性がある。
トレーニング中にモデル入力に付加される多数の独立雑音実効化の効果を決定論的に近似する正規化手法であるLinearized Multi-Noise Training (LMNT)を導入する。
論文 参考訳(メタデータ) (2022-11-09T23:40:52Z) - Learning Physical Dynamics with Subequivariant Graph Neural Networks [99.41677381754678]
グラフニューラルネットワーク(GNN)は、物理力学を学習するための一般的なツールとなっている。
物理法則は、モデル一般化に必須な帰納バイアスである対称性に従属する。
本モデルは,RigidFall上でのPhysylonと2倍低ロールアウトMSEの8つのシナリオにおいて,平均3%以上の接触予測精度の向上を実現している。
論文 参考訳(メタデータ) (2022-10-13T10:00:30Z) - 3D Equivariant Molecular Graph Pretraining [42.957880677779556]
完全かつ新しい意味での3D分子プレトレーニングに取り組む。
まず,3次元空間の対称性を満たすことのメリットを享受する事前学習のバックボーンとして,同変エネルギーベースモデルを採用することを提案する。
大規模3DデータセットGEOM-QM9から事前学習したモデルを,MD17とQM9の2つの挑戦的な3Dベンチマークで評価した。
論文 参考訳(メタデータ) (2022-07-18T16:26:24Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z) - Uncertainty quantification and inverse modeling for subsurface flow in
3D heterogeneous formations using a theory-guided convolutional
encoder-decoder network [5.018057056965207]
複数の垂直生産井を有する動的3次元地下単相流問題に対する代理モデルを構築した。
代理モデルは任意のタイミングで全体の形成を効率的に推算する。
ウェル生産率またはボトムホール圧力はピースマンの公式に基づいて決定できる。
論文 参考訳(メタデータ) (2021-11-14T10:11:46Z) - Equivariant vector field network for many-body system modeling [65.22203086172019]
Equivariant Vector Field Network (EVFN) は、新しい同変層と関連するスカラー化およびベクトル化層に基づいて構築されている。
シミュレーションされたニュートン力学系の軌跡を全観測データと部分観測データで予測する手法について検討した。
論文 参考訳(メタデータ) (2021-10-26T14:26:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。