論文の概要: Better without U: Impact of Selective Hubbard U Correction on Foundational MLIPs
- arxiv url: http://arxiv.org/abs/2601.21056v1
- Date: Wed, 28 Jan 2026 21:24:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.44126
- Title: Better without U: Impact of Selective Hubbard U Correction on Foundational MLIPs
- Title(参考訳): より良いU: 基本MLIPに対する選択的ハバードU補正の影響
- Authors: Thomas Warford, Fabian L. Thiemann, Gábor Csányi,
- Abstract要約: シミュレーションセルにO原子やF原子が存在する場合のみ、特定の遷移金属に適用されるハバードU補正の材料計画による選択的利用の不整合を示す。
この+Uの不整合の使用により、低エネルギーのGA曲面と高エネルギーのGA+U曲面の2つのポテンシャルエネルギー面(PES)が生成される。
両方で訓練すると、MLIPは相互に相互作用し、体系的なアンダーバインド、あるいはU補正金属と酸素またはフッ素を含む種の間の急激な反発を引き起こす。
- 参考スコア(独自算出の注目度): 2.24303609250571
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The training of foundational machine learning interatomic potentials (fMLIPs) relies on diverse databases with energies and forces calculated using ab initio methods. We show that fMLIPs trained on large datasets such as MPtrj, Alexandria, and OMat24 encode inconsistencies from the Materials Project's selective use of the Hubbard U correction, which is applied to certain transition metals only if O or F atoms are present in the simulation cell. This inconsistent use of +U creates two incompatible potential-energy surfaces (PES): a lower-energy GGA surface and a higher-energy GGA+U one. When trained on both, MLIPs interpolate between them, leading to systematic underbinding, or even spurious repulsion, between U-corrected metals and oxygen- or fluorine-containing species. Models such as MACE-OMAT and -MPA exhibit repulsion between U-corrected metals and their oxides, limiting their value for studying catalysis and oxidation. We link the severity of this pathology to the oxygen number density in U-corrected training configurations. This explains why OMAT-trained models are most affected and suggests the issue might worsen as expanding future datasets increasingly include configurations with low oxygen content, such as those generated through combinatorial exploration of multi-element or defect-containing systems. Our simple per-U-corrected-atom shift aligns PBE+U and PBE energies for identical structures, yielding a smoother PES compared to existing correction schemes, which target phase diagram accuracy. As a result, models trained on datasets with our shift applied exhibit smaller mean absolute errors for the adsorption energies of oxygen on U-corrected elemental slabs. Since datasets omitting +U entirely (e.g. MatPES, MP-ALOE) avoid these pathologies, we recommend excluding +U in future fMLIP datasets. For existing datasets, our post-hoc correction provides a low-cost improvement.
- Abstract(参考訳): 基礎的機械学習原子間ポテンシャル(fMLIP)のトレーニングは、ab initio法を用いて計算されたエネルギーと力を持つ多様なデータベースに依存している。
我々は,MPtrj,Alexandria,OMat24などの大規模データセットでトレーニングされたfMLIPが,シミュレーションセルにO原子やF原子が存在する場合にのみ特定の遷移金属に適用される,材料プロジェクトによるHubbard U補正の選択的使用から不整合を符号化していることを示す。
この+Uの不整合の使用は、低エネルギーのGA曲面と高エネルギーのGA+U曲面の2つの非互換なポテンシャルエネルギー曲面(PES)を生成する。
両方でトレーニングすると、MLIPはそれらの間にインターポーリングし、U補正された金属と酸素またはフッ素を含む種の間で体系的なアンダーバインド(あるいは刺激的な反発)を引き起こす。
MACE-OMAT(英語版)や-MPA(英語版)のようなモデルでは、U-補正金属とその酸化物間の反発を示し、触媒や酸化の研究の価値を制限している。
U-corrected training configurationの酸素数密度と、この病理の重症度を関連づける。
このことは、OMATでトレーニングされたモデルが最も影響を受けている理由を説明し、将来のデータセットは、多要素または欠陥を含むシステムの組合せ探索によって生成されたような、酸素含有量の少ない構成を徐々に含んでいるため、問題を悪化させる可能性があることを示唆している。
我々の単純なU補正原子シフトは、PBE+UとPBEのエネルギーを同じ構造に整列させ、位相図の精度を目標とする既存の補正方式に比べてスムーズなPSSを与える。
その結果、我々のシフトを応用したデータセットでトレーニングされたモデルでは、U補正された元素スラブ上での酸素吸着エネルギーの絶対誤差が小さくなった。
例えば、MatePESやMP-ALOEといった)+Uを完全に省略するデータセットは、これらの病理を回避するため、将来のfMLIPデータセットで+Uを除外することを推奨する。
既存のデータセットでは、ポストホック修正は低コストで改善します。
関連論文リスト
- ADAPT: Lightweight, Long-Range Machine Learning Force Fields Without Graphs [6.683253616106448]
第一原理法は、欠陥データベースのスケールを含む欠陥エネルギーと構造を計算するために広く使われている。
MLFFは計算コストが高く、機械学習力場(MLFF)は構造緩和を加速させる魅力的な代替品である。
既存のMLFFのほとんどはグラフニューラルネットワーク(GNN)をベースとしている。
本稿では,グラフ表現を空間内直接座標で置き換えるMLFFである ADAPT (Accelerated Deep Atomic Potential Transformer) を導入する。
論文 参考訳(メタデータ) (2025-09-28T23:18:57Z) - Learning Inter-Atomic Potentials without Explicit Equivariance [24.438029202222555]
TransIP: Transformer-based Inter-Atomic Potentialsは、原子間ポテンシャルの新たなトレーニングパラダイムである。
提案手法は, 組込み空間における表現を最適化することにより, SO(3)-同変を学習するための汎用的非同変トランスフォーマーモデルである。
データ拡張ベースラインと比較して、TransIPはさまざまなOMol25データセットサイズで40%から60%のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-09-25T22:15:10Z) - Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - Rao-Blackwell Gradient Estimators for Equivariant Denoising Diffusion [55.95767828747407]
分子やタンパク質の生成のようなドメインでは、物理系はモデルにとって重要な固有の対称性を示す。
学習のばらつきを低減し、確率的に低い分散勾配推定器を提供するフレームワークを提案する。
また,軌道拡散法(Orbit Diffusion)と呼ばれる手法を用いて,損失とサンプリングの手順を取り入れた推定器の実用的実装を提案する。
論文 参考訳(メタデータ) (2025-02-14T03:26:57Z) - Overcoming systematic softening in universal machine learning interatomic potentials by fine-tuning [3.321322648845526]
機械学習原子間ポテンシャル(MLIP)は原子シミュレーションの新しいパラダイムを導入した。
近年,多種多様な資料データセットで事前学習したユニバーサルMLIP(uMLIP)が出現している。
分布外の複雑な原子環境に対する外挿性能はいまだに不明である。
論文 参考訳(メタデータ) (2024-05-11T22:30:47Z) - Machine Learning Force Fields with Data Cost Aware Training [94.78998399180519]
分子動力学(MD)シミュレーションを加速するために機械学習力場(MLFF)が提案されている。
最もデータ効率のよいMLFFであっても、化学精度に達するには数百フレームの力とエネルギーのラベルが必要になる。
我々は、安価な不正確なデータと高価な正確なデータの組み合わせを利用して、MLFFのデータコストを下げる多段階計算フレームワークASTEROIDを提案する。
論文 参考訳(メタデータ) (2023-06-05T04:34:54Z) - Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。
CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。
睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-30T08:24:01Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z) - A Universal Framework for Featurization of Atomistic Systems [0.0]
物理や機械学習に基づく反応力場は、時間と長さのスケールのギャップを埋めるために使うことができる。
本稿では,原子周囲の電子密度の物理的に関連する多極展開を利用するガウス多極(GMP)デデュール化スキームを紹介する。
我々は,GMPに基づくモデルがQM9データセットの化学的精度を達成できることを示し,新しい要素を外挿してもその精度は妥当であることを示した。
論文 参考訳(メタデータ) (2021-02-04T03:11:00Z) - Targeted free energy estimation via learned mappings [66.20146549150475]
自由エネルギー摂動 (FEP) は60年以上前にズワンツィヒによって自由エネルギー差を推定する方法として提案された。
FEPは、分布間の十分な重複の必要性という厳しい制限に悩まされている。
目標自由エネルギー摂動(Targeted Free Energy Perturbation)と呼ばれるこの問題を緩和するための1つの戦略は、オーバーラップを増やすために構成空間の高次元マッピングを使用する。
論文 参考訳(メタデータ) (2020-02-12T11:10:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。