論文の概要: Distilling latent electrostatics from foundation machine learning interatomic potentials
- arxiv url: http://arxiv.org/abs/2606.15001v1
- Date: Fri, 12 Jun 2026 22:45:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:32.568899
- Title: Distilling latent electrostatics from foundation machine learning interatomic potentials
- Title(参考訳): 基礎的機械学習による原子間ポテンシャルからの潜在静電の希釈
- Authors: Xiaoyu Wang, Bingqing Cheng,
- Abstract要約: Latent Ewald Summation (LES) は密度汎関数理論エネルギーと力ラベルのみから潜時原子電荷と長距離静電エネルギーを学習する。
UMA, MACE, Orb, eSEN, GemNet-OC, PET, EquiformerV2など,幅広い基礎MLIPから抽出した学生モデルのベンチマークを行った。
LESに基づく蒸留は、基礎MLIPを効率よく電気応答性のあるモデルに変換するための実用的な経路を提供する。
- 参考スコア(独自算出の注目度): 4.208220582996209
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Foundation machine learning interatomic potentials (MLIPs) have enabled atomistic simulations across broad regions of chemical and materials space, but many remain computationally expensive and lack explicit electrostatics, limiting their use for systems governed by long-range interactions and electrical response. Previously, we introduced Latent Ewald Summation (LES), which learns latent atomic charges and long-range electrostatics from density functional theory (DFT) energy and force labels alone. Here, we use LES to extract electrostatics that are latent in foundation models: energies and forces predicted by a teacher model are used to train a lightweight LES-augmented student MLIP, with optional fine-tuning on additional DFT data. The resulting models reduce computational cost while providing access to Born effective charge tensors, and infrared spectra. We benchmark student models distilled from a broad set of foundation MLIPs, including UMA, MACE, Orb, eSEN, GemNet-OC, PET, and EquiformerV2-based models, against experimental infrared spectra for liquid water, concentrated hydrochloric acid, and the anatase TiO2(101)-water interface. Across these systems, electrostatic response can be extracted from most foundation MLIPs. The benchmark further shows that the underlying DFT level and dataset used to train the teacher model play a larger role than architecture in determining electrostatic and spectroscopic accuracy. For the TiO2-water interface, fine-tuning with a modest amount of higher-level DFT data improves structural and infrared predictions. LES-based distillation therefore provides a practical route for converting foundation MLIPs into efficient, electrically responsive models, while also testing the physical fidelity encoded in foundation models.
- Abstract(参考訳): 基礎となる機械学習原子間ポテンシャル(MLIP)は、化学や材料空間の広い領域で原子論シミュレーションを可能にしているが、その多くは計算に高価であり、明らかに静電気を欠いているため、長距離相互作用と電気応答によって支配されるシステムに対する使用が制限されている。
従来我々は、密度汎関数理論(DFT)エネルギーと力ラベルだけで潜時原子電荷と長距離静電を学習する潜時エワルド・サメーション(LES)を導入していた。
教師モデルによって予測されるエネルギーと力は、追加のDFTデータに基づいてオプションで微調整された軽量のLES強化学生MLIPの訓練に使用される。
結果として得られたモデルは、ボルン有効電荷テンソル、赤外スペクトルへのアクセスを提供しながら計算コストを低減させる。
UMA, MACE, Orb, eSEN, GemNet-OC, PET, EquiformerV2系モデルを含む幅広い基礎MLIPから抽出した学生モデルを, 液体水の実験的赤外スペクトル, 塩酸濃度, アナターゼTiO2(101)-水界面に対してベンチマークした。
これらの系全体では、ほとんどの基礎MLIPから静電気応答を抽出することができる。
ベンチマークでは、教師モデルのトレーニングに使用される基礎となるDFTレベルとデータセットが、静電気的および分光的精度を決定する上で、アーキテクチャよりも大きな役割を果たすことも示している。
TiO2-waterインタフェースでは、高レベルのDFTデータを適度に調整することで、構造的および赤外線予測が改善される。
したがって、LESベースの蒸留は基礎MLIPを効率よく電気的に応答するモデルに変換し、基礎モデルに符号化された物理的忠実度をテストするための実用的な経路を提供する。
関連論文リスト
- EFF-Grasp: Energy-Field Flow Matching for Physics-Aware Dexterous Grasp Generation [54.09734511705173]
EFF-Graspは、物理を意識したデクサラスグリップ生成のためのフローマッチング合成ベースのフレームワークである。
我々は、スムーズな確率フローによる効率的な安定な生成を可能にする決定論的常微分方程式(ODE)プロセスとして、グリップを再構成する。
EFF-Graspは、拡散ベースラインよりもサンプリングステップを著しく少なくしながら、把握品質と物理的実現性において優れた性能を実現する。
論文 参考訳(メタデータ) (2026-03-17T06:11:56Z) - From Static Spectra to Operando Infrared Dynamics: Physics Informed Flow Modeling and a Benchmark [67.29937933325849]
Operando IR Predictionは、1つの静的スペクトルからスペクトル指紋の時間分解進化を予測することを目的としている。
OpIRSpec-7Kは、10の異なるバッテリーシステムにわたる7,118の高品質なサンプルで構成されている。
ABCCは最先端の静的、シーケンシャル、および生成的ベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-02-20T18:58:43Z) - Foundation Models for Discovery and Exploration in Chemical Space [57.97784111110166]
MISTは、大規模なラベルなしデータセットに基づいて訓練された分子基盤モデルのファミリーである。
我々は、これらのモデルが化学空間をまたいだ現実世界の問題を解決する能力を実証する。
論文 参考訳(メタデータ) (2025-10-20T17:56:01Z) - A universal augmentation framework for long-range electrostatics in machine learning interatomic potentials [8.414405667524889]
静電相互作用, 分極, ボルン有効電荷(BECs)を推定する潜在エワルド置換法(LES)
短距離MLIPと互換性のあるスタンドアロンライブラリとしてLESを提示し、MACE、NequIP、CACE、CHGNetといったメソッドとの統合を実証する。
分子やクラスターを含むSPICEセット上でMACELES-OFFをトレーニングすることにより, LESを大規模かつ化学的に多様なデータに拡張する。
論文 参考訳(メタデータ) (2025-07-18T18:21:45Z) - Ensemble Knowledge Distillation for Machine Learning Interatomic Potentials [34.82692226532414]
機械学習の原子間ポテンシャル(MLIP)を改善するためのアンサンブル知識蒸留法(EKD)を提案する。
まず、複数の教師モデルはQCエネルギーに訓練され、次にデータセットのすべての構成に対して原子力を生成する。次に、学生MLIPは、教師モデルによって生成されたQCエネルギーと平均的な力の両方に訓練される。
得られた学生MLIPは、Compum6ベンチマークで新しい最先端の精度を達成し、分子動力学シミュレーションの安定性の向上を示す。
論文 参考訳(メタデータ) (2025-03-18T14:32:51Z) - Predicting ionic conductivity in solids from the machine-learned potential energy landscape [68.25662704255433]
本稿では, イオン伝導体の迅速かつ信頼性の高いスクリーニング手法として, 普遍的な原子間ポテンシャルの解析手法を提案する。
第一原理計算では,10種中8種が室温で超イオン性であることが確認された。
本手法は, 機械学習電位によって駆動される分子動力学と比較して約50倍の高速化係数を達成し, 第一原理分子動力学に比べて少なくとも3,000倍高速である。
論文 参考訳(メタデータ) (2024-11-11T09:01:36Z) - Multi-task learning for molecular electronic structure approaching coupled-cluster accuracy [9.81014501502049]
金標準CCSD(T)計算をトレーニングデータとして,有機分子の電子構造を統一した機械学習手法を開発した。
炭化水素分子を用いたモデルでは, 計算コストと様々な量子化学特性の予測精度において, 広範に用いられているハイブリッド関数と二重ハイブリッド関数でDFTより優れていた。
論文 参考訳(メタデータ) (2024-05-09T19:51:27Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。