論文の概要: Projected Hessian Learning: Fast Curvature Supervision for Accurate Machine-Learning Interatomic Potentials
- arxiv url: http://arxiv.org/abs/2603.04523v1
- Date: Wed, 04 Mar 2026 19:09:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:10.933522
- Title: Projected Hessian Learning: Fast Curvature Supervision for Accurate Machine-Learning Interatomic Potentials
- Title(参考訳): 予測ヘッセン学習:精密機械学習型原子間ポテンシャルのための高速曲率スーパービジョン
- Authors: Austin Rodriguez, Justin S. Smith, Sakib Matin, Nicholas Lubbers, Kipton Barros, Jose L. Mendoza-Cortes,
- Abstract要約: Projected Hessian Learning (PHL)は、Hessian-vector製品(HVPs)のみを使用して曲率情報を注入するスケーラブルな2階学習フレームワークである。
我々は PHL を omegaB97XD/6-31G(d) で計算した化学多種多様な反応物質, 生成物遷移状態, 正常モードのサンプルジオメトリーのベンチマークを行った。
最小バッチ当たりのランダム化プローブでは、両方のHVPスキームはエネルギー、力、ヘッセンの精度のフルヘシアントレーニングと一致し、研究された小さな分子系に対して>24倍のスピードアップを提供する。
- 参考スコア(独自算出の注目度): 3.0325110391148264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Hessian matrix (second derivatives) encodes far richer local curvature of the potential energy surface than energies and forces alone. However, training machine-learning interatomic potentials (MLIPs) with full Hessians is often impractical because explicitly forming and storing Hessian matrices scales quadratically in cost and memory. We introduce Projected Hessian Learning (PHL), a scalable second-order training framework that injects curvature information using only Hessian-vector products (HVPs). Rather than constructing the Hessian, PHL projects curvature along stochastic probe directions and uses an unbiased stochastic trace-based loss with favorable system-size scaling, enabling curvature-informed training without quadratic memory growth. We benchmark PHL on a chemically diverse dataset of reactants, products, transition states, intrinsic reaction coordinates, and normal-mode sampled geometries computed at omegaB97XD/6-31G(d). We compare energy-force training (E-F), two HVP-based schemes (E-F-HVP with one-hot or randomized probes), and full energy-force-Hessian training (E-F-H). With randomized probes per minibatch, both HVP schemes match full-Hessian training in energy, force, and Hessian accuracy while delivering >24x epoch speedups for the small molecular systems studied. In a fixed-probe regime with one HVP per molecule, randomized projections consistently outperform one-column probing, especially for far-from-equilibrium geometries. Overall, PHL replaces explicit Hessian supervision with force-complexity curvature training, retaining most second-order accuracy gains while scaling to larger, more complex molecular systems.
- Abstract(参考訳): ヘッセン行列(二階微分)は、エネルギーや力のみよりも、ポテンシャルエネルギー表面のより豊かな局所曲率を符号化する。
しかしながら、フルヘッセンの機械学習原子間ポテンシャル(MLIP)をトレーニングすることは、しばしば非現実的である。
本稿では,Hessian-vector Product(HVPs)のみを用いて曲率情報を注入するスケーラブルな2階学習フレームワークであるProjected Hessian Learning(PHL)を紹介する。
PHLは、Hessianを構築するのではなく、確率的プローブ方向に沿って曲率を計画し、不偏の確率的トレースベースの損失を利用してシステムサイズを拡大し、二次記憶の成長を伴わずに曲率インフォームドトレーニングを可能にする。
我々はPHLを,オメガB97XD/6-31G(d)で計算した化学的に多様な反応物質,生成物,遷移状態,本質的な反応座標,正規モードのサンプルジオメトリのデータセットでベンチマークした。
エネルギー力トレーニング(E-F)とHVPに基づく2つのスキーム(E-F-HVPと1ホットまたはランダム化されたプローブ)、フルエネルギー力-ヘッセントレーニング(E-F-H)を比較した。
最小バッチ当たりのランダム化プローブでは、両方のHVPスキームはエネルギー、力、ヘッセンの精度のフルヘシアントレーニングと一致し、研究された小さな分子系に対して >24 倍のエポック・スピードアップを提供する。
分子1個につき1つのHVPを持つ固定プローブ系では、ランダム化されたプロジェクションは、特に遠方平衡測地において、1カラムのプローブよりも一貫して優れる。
全体として、PHLは明らかにヘッセンの監督を強制複雑度曲率トレーニングに置き換え、より大きく複雑な分子系にスケーリングしながら、2階目の精度を向上させる。
関連論文リスト
- Equivariant Evidential Deep Learning for Interatomic Potentials [55.6997213490859]
不確かさの定量化は、分子動力学シミュレーションにおける機械学習の原子間ポテンシャルの信頼性を評価するために重要である。
既存のMLIPのUQアプローチは、高い計算コストや準最適性能によって制限されることが多い。
我々は,原子間ポテンシャルの定量的深層学習(texte2$IP)を提案する。
論文 参考訳(メタデータ) (2026-02-11T02:00:25Z) - Capturing the Topological Phase Transition and Thermodynamics of the 2D XY Model via Manifold-Aware Score-Based Generative Modeling [0.0]
連続スピンシステムのための新しいスコアベース生成モデリングフレームワークを提案する。
提案手法は,標準拡散モデルよりも精度のよい理論ボルツマンスコアを推定する。
我々は、ゼロショットの一般化を未知の格子サイズに示し、リトレーニングなしで可変系スケールの物理を正確に回復する。
論文 参考訳(メタデータ) (2026-02-07T13:50:20Z) - Variational (Energy-Based) Spectral Learning: A Machine Learning Framework for Solving Partial Differential Equations [0.0]
偏微分方程式(PDE)を解くための機械学習フレームワークである変動スペクトル学習(VSL)を導入する。
VSLは変分PDE理論、スペクトルの離散化、現代の機械学習の実践の間に原則化された橋渡しを提供する。
論文 参考訳(メタデータ) (2026-01-05T19:03:58Z) - Disordered Dynamics in High Dimensions: Connections to Random Matrices and Machine Learning [52.26396748560348]
ランダム行列によって駆動される高次元力学系について概説する。
機械学習理論における学習と一般化の単純なモデルへの応用に焦点を当てる。
論文 参考訳(メタデータ) (2026-01-03T00:12:32Z) - Adaptive Probability Flow Residual Minimization for High-Dimensional Fokker-Planck Equations [14.22534820071447]
高次元のフォッカー・プランク方程式を解くことは、計算物理学と力学の課題である。
物理情報ニューラルネットワークのような既存のディープラーニングアプローチは、次元が増加するにつれて計算上の課題に直面している。
本稿では,適応確率フロー残差最小化法(A-PFRM)を提案する。
論文 参考訳(メタデータ) (2025-12-22T09:31:31Z) - Shoot from the HIP: Hessian Interatomic Potentials without derivatives [2.406669016462152]
ヘッセンは、システムサイズで計算し、スケールするのが高価である。
深層学習モデルから直接ヘッセンを予測できることを実証する。
これにより、HIP Hessianは、桁違いに高速で、より正確で、よりメモリ効率が良く、トレーニングが容易になり、システムサイズでより好ましいスケーリングを可能にします。
論文 参考訳(メタデータ) (2025-09-25T21:43:34Z) - From expNN to sinNN: automatic generation of sum-of-products models for potential energy surfaces in internal coordinates using neural networks and sparse grid sampling [0.0]
本研究の目的は,積の和形におけるポテンシャルエネルギー面を表す正弦波活性化関数を持つ単一層人工ニューラルネットワークの実現性を評価することである。
sinNNという名前のフィッティングアプローチはHONOのPSSをモデル化し、トランス異性体とシス異性体の両方をカバーする。
sinNN PESモデルは、利用可能な基本振動遷移エネルギーを17cm-1の根平均二乗誤差で再現することができた。
論文 参考訳(メタデータ) (2025-04-30T07:31:32Z) - Rao-Blackwell Gradient Estimators for Equivariant Denoising Diffusion [55.95767828747407]
分子やタンパク質の生成のようなドメインでは、物理系はモデルにとって重要な固有の対称性を示す。
学習のばらつきを低減し、確率的に低い分散勾配推定器を提供するフレームワークを提案する。
また,軌道拡散法(Orbit Diffusion)と呼ばれる手法を用いて,損失とサンプリングの手順を取り入れた推定器の実用的実装を提案する。
論文 参考訳(メタデータ) (2025-02-14T03:26:57Z) - Machine learning in and out of equilibrium [58.88325379746631]
我々の研究は、統計物理学から適応したフォッカー・プランク法を用いて、これらの平行線を探索する。
我々は特に、従来のSGDでは平衡が切れている長期的限界におけるシステムの定常状態に焦点を当てる。
本稿では,ミニバッチの置き換えを伴わない新しいランゲヴィンダイナミクス(SGLD)を提案する。
論文 参考訳(メタデータ) (2023-06-06T09:12:49Z) - Physics-informed machine learning with differentiable programming for
heterogeneous underground reservoir pressure management [64.17887333976593]
地下貯水池の過圧化を避けることは、CO2の沈殿や排水の注入といった用途に欠かせない。
地中における複雑な不均一性のため, 噴射・抽出制御による圧力管理は困難である。
過圧化防止のための流体抽出速度を決定するために、フル物理モデルと機械学習を用いた微分可能プログラミングを用いる。
論文 参考訳(メタデータ) (2022-06-21T20:38:13Z) - Dual Training of Energy-Based Models with Overparametrized Shallow
Neural Networks [41.702175127106784]
エネルギーベースモデル(英: Energy-based model、EBM)は、通常最大推定によって訓練される生成モデルである。
本稿では,データセットから引き出されたランダムなサンプルで粒子を再起動するEMMアルゴリズムの2つの定式化を提案し,その再起動が各ステップ毎にスコアに対応することを示す。
これらの結果は単純な数値実験で説明される。
論文 参考訳(メタデータ) (2021-07-11T21:43:18Z) - DiffPD: Differentiable Projective Dynamics with Contact [65.88720481593118]
DiffPDは、暗黙の時間積分を持つ効率的な微分可能なソフトボディシミュレータである。
我々はDiffPDの性能を評価し,様々な応用における標準ニュートン法と比較して4~19倍のスピードアップを観測した。
論文 参考訳(メタデータ) (2021-01-15T00:13:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。