論文の概要: From Regression to Classification: Exploring the Benefits of Categorical Representations of Energy in MLIPs
- arxiv url: http://arxiv.org/abs/2512.01160v1
- Date: Mon, 01 Dec 2025 00:36:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.613576
- Title: From Regression to Classification: Exploring the Benefits of Categorical Representations of Energy in MLIPs
- Title(参考訳): 回帰から分類へ:MLIPにおけるエネルギーのカテゴリー表現の利点を探る
- Authors: Ahmad Ali,
- Abstract要約: 密度汎関数理論 (DFT) は分子のエネルギーと挙動を推定するための広く用いられる計算法である。
機械学習原子間ポテンシャル(MLIPs)は、DFTレベルのエネルギーと力を劇的に低い計算コストで近似するよう訓練されたモデルである。
本研究では,エネルギー/力の値に対するカテゴリー分布を予測する多クラス分類の定式化について検討する。
- 参考スコア(独自算出の注目度): 1.0998907972211756
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Density Functional Theory (DFT) is a widely used computational method for estimating the energy and behavior of molecules. Machine Learning Interatomic Potentials (MLIPs) are models trained to approximate DFT-level energies and forces at dramatically lower computational cost. Many modern MLIPs rely on a scalar regression formulation; given information about a molecule, they predict a single energy value and corresponding forces while minimizing absolute error with DFT's calculations. In this work, we explore a multi-class classification formulation that predicts a categorical distribution over energy/force values, providing richer supervision through multiple targets. Most importantly, this approach offers a principled way to quantify model uncertainty. In particular, our method predicts a histogram of the energy/force distribution, converts scalar targets into histograms, and trains the model using cross-entropy loss. Our results demonstrate that this categorical formulation can achieve absolute error performance comparable to regression baselines. Furthermore, this representation enables the quantification of epistemic uncertainty through the entropy of the predicted distribution, offering a measure of model confidence absent in scalar regression approaches.
- Abstract(参考訳): 密度汎関数理論 (DFT) は分子のエネルギーと挙動を推定するための広く用いられる計算法である。
機械学習原子間ポテンシャル(MLIPs)は、DFTレベルのエネルギーと力を劇的に低い計算コストで近似するよう訓練されたモデルである。
多くの現代のMLIPはスカラー回帰の定式化に依存しており、分子に関する情報が与えられた場合、DFTの計算で絶対誤差を最小化しながら単一のエネルギー値と対応する力を予測する。
本研究では,エネルギー/力の値に対する分類的分布を予測し,複数の目標を通じてよりリッチな監視を行うマルチクラス分類の定式化について検討する。
最も重要なことは、このアプローチがモデルの不確実性を定量化する原則的な方法を提供することだ。
特に,エネルギー/力分布のヒストグラムを予測し,スカラーターゲットをヒストグラムに変換し,クロスエントロピー損失を用いてモデルを訓練する。
この分類式は回帰ベースラインに匹敵する絶対誤差性能が得られることを示す。
さらに、この表現は、予測分布のエントロピーを通じてててんかんの不確実性の定量化を可能にし、スカラー回帰アプローチに欠くモデルの信頼性の尺度を提供する。
関連論文リスト
- Extending machine learning model for implicit solvation to free energy calculations [37.65679407817425]
我々は、Lambda Solvation Neural Network(LSNN)と呼ばれるグラフニューラルネットワーク(GNN)に基づく暗黙の溶媒モデルを導入する。
LSNNは、明解アルケミカルシミュレーションに匹敵する精度で自由エネルギー予測を行う。
論文 参考訳(メタデータ) (2025-10-23T01:05:44Z) - Self-Refining Training for Amortized Density Functional Theory [5.5541132320126945]
そこで本稿では,自己修復学習戦略を導入することにより,大規模な事前コンパイルデータセットに対するアモータイズDFTソルバの依存性を低減する手法を提案する。
本手法は, 生成試料と基底状態エネルギーで定義される対象ボルツマン分布との差分を測定するKL偏差の変動上界の最小化として導出する。
論文 参考訳(メタデータ) (2025-06-02T00:32:32Z) - A theoretical framework for overfitting in energy-based modeling [5.1337384597700995]
相互作用ネットワークの同定を目的とした逆問題に対するペアワイズエネルギーベースモデルの学習における限られたデータの影響について検討する。
これらの時間スケールとトレーニングの初期条件との相互作用から早期停止の最適点が生じることを示す。
本稿では、スコアマッチングの下でのスコア関数のニューラルネットワークカーネルダイナミクスを導出することにより、任意のエネルギーベースモデルへの一般化を提案する。
論文 参考訳(メタデータ) (2025-01-31T14:21:02Z) - Scaling and renormalization in high-dimensional regression [72.59731158970894]
リッジ回帰に関する最近の結果について統一的な視点を提示する。
我々は、物理とディープラーニングの背景を持つ読者を対象に、ランダム行列理論と自由確率の基本的なツールを使用する。
我々の結果は拡張され、初期のスケーリング法則のモデルについて統一的な視点を提供する。
論文 参考訳(メタデータ) (2024-05-01T15:59:00Z) - Quantifying predictive uncertainty of aphasia severity in stroke patients with sparse heteroscedastic Bayesian high-dimensional regression [47.1405366895538]
高次元データに対する疎線型回帰法は、通常、残留物が一定の分散を持つと仮定するが、これは実際には破ることができる。
本稿では,ヘテロセダスティック分割経験的ベイズ期待条件最大化アルゴリズムを用いて,高次元ヘテロセダスティック線形回帰モデルを推定する。
論文 参考訳(メタデータ) (2023-09-15T22:06:29Z) - Energy Discrepancies: A Score-Independent Loss for Energy-Based Models [20.250792836049882]
本稿では,スコアの計算や高価なマルコフ連鎖モンテカルロの計算に頼らない新しい損失関数であるEnergy Discrepancy (ED)を提案する。
EDは明示的なスコアマッチングと負のログ類似損失に異なる限界でアプローチし,両者を効果的に補間することを示した。
論文 参考訳(メタデータ) (2023-07-12T19:51:49Z) - Pseudo-Spherical Contrastive Divergence [119.28384561517292]
エネルギーベースモデルの最大学習確率を一般化するために,擬球面コントラスト分散(PS-CD)を提案する。
PS-CDは難解な分割関数を避け、学習目的の一般化されたファミリーを提供する。
論文 参考訳(メタデータ) (2021-11-01T09:17:15Z) - Entropy Minimizing Matrix Factorization [102.26446204624885]
NMF(Nonnegative Matrix Factorization)は、広く使用されているデータ分析技術であり、多くの実際のタスクで印象的な結果をもたらしました。
本研究では,上述の問題に対処するために,EMMF (Entropy Minimizing Matrix Factorization framework) を開発した。
通常、外れ値が通常のサンプルよりもはるかに小さいことを考えると、行列分解のために新しいエントロピー損失関数が確立される。
論文 参考訳(メタデータ) (2021-03-24T21:08:43Z) - Training Deep Energy-Based Models with f-Divergence Minimization [113.97274898282343]
深部エネルギーベースモデル(EBM)は分布パラメトリゼーションにおいて非常に柔軟であるが、計算的に困難である。
所望のf偏差を用いてEMMを訓練するための、f-EBMと呼ばれる一般的な変分フレームワークを提案する。
実験の結果,F-EBMは対照的なばらつきよりも優れており,KL以外のf-divergencesを用いたEBMの訓練の利点も示された。
論文 参考訳(メタデータ) (2020-03-06T23:11:13Z) - Targeted free energy estimation via learned mappings [66.20146549150475]
自由エネルギー摂動 (FEP) は60年以上前にズワンツィヒによって自由エネルギー差を推定する方法として提案された。
FEPは、分布間の十分な重複の必要性という厳しい制限に悩まされている。
目標自由エネルギー摂動(Targeted Free Energy Perturbation)と呼ばれるこの問題を緩和するための1つの戦略は、オーバーラップを増やすために構成空間の高次元マッピングを使用する。
論文 参考訳(メタデータ) (2020-02-12T11:10:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。