論文の概要: Tensor Hypercontraction Error Correction Using Regression
- arxiv url: http://arxiv.org/abs/2602.23567v1
- Date: Fri, 27 Feb 2026 00:30:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.182634
- Title: Tensor Hypercontraction Error Correction Using Regression
- Title(参考訳): レグレッションを用いたテンソル過収縮誤差補正
- Authors: Ishna Satyarth, Eric C. Larson, Devin A. Matthews,
- Abstract要約: 主群化学データベース(MGCDB84)から観測されたTHC誤差の回帰モデルを学習する。
非線形回帰モデルにより, THC-と正準MP3間の根平均二乗誤差は, 全分子エネルギーは6-9$times$,反応エネルギーは2-3$times$と減少することがわかった。
- 参考スコア(独自算出の注目度): 3.359092200221619
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wavefunction-based quantum methods are some of the most accurate tools for predicting and analyzing the electronic structure of molecules, in particular for accounting for dynamical electron correlation. However, most methods of including dynamical correlation beyond the simple second-order Møller-Plesset perturbation theory (MP2) level are too computationally expensive to apply to large molecules. Approximations which reduce scaling with system size are a potential remedy, such as the tensor hyper-contraction (THC) technique of Hohenstein et al., but also result in additional sources of error. In this work, we correct errors in THC-approximated methods using machine learning. Specifically, we apply THC to third-order Møller-Plesset theory (MP3) as a simplified model for coupled cluster with single and double excitations (CCSD), and train several regression models on observed THC errors from the Main Group Chemistry Database (MGCDB84). We compare performance of multiple linear regression models and non-linear Kernel Ridge regression models. We also investigate correlation procedures using absolute and relative corrections and evaluate the corrections for both molecule and reaction energies. We discuss the potential for using regression techniques to correct THC-MP3 errors by comparing it to the "canonical" MP3 reference values and find the optimum technique based on accuracy. We find that non-linear regression models reduced root mean squared errors between THC- and canonical MP3 by a factor of 6-9$\times$ for total molecular energies and 2-3$\times$ for reaction energies.
- Abstract(参考訳): 波動関数に基づく量子法は、分子の電子構造を予測・解析するための最も正確な手法の1つである。
しかし、単純な二階Møller-Plesset摂動理論(MP2)レベルを超える動的相関を含むほとんどの方法は、大分子に適用するには計算に高すぎる。
システムサイズによるスケーリングを減らす近似は、ホーエンシュタインらによるテンソルハイパーコントラクション(THC)技術のような潜在的な対策である。
本研究では,機械学習を用いたTHC近似手法の誤差を補正する。
具体的には、3次Møller-Plesset理論(MP3)を単一励起と二重励起を結合したクラスタの簡易モデルとして適用し、主群化学データベース(MGCDB84)から観測されたTHC誤差の回帰モデルを訓練する。
複数の線形回帰モデルと非線形カーネルリッジ回帰モデルの性能を比較する。
また, 絶対的および相対的補正を用いた相関法について検討し, 分子および反応エネルギーの補正について検討した。
本稿では,THC-MP3誤差の補正にレグレッション手法を用いた場合の「標準」MP3基準値と比較し,精度に基づく最適手法を提案する。
非線形回帰モデルにより, THC-と正準MP3間の根平均二乗誤差は, 全分子エネルギーは6-9$\times$,反応エネルギーは2-3$\times$と減少することがわかった。
関連論文リスト
- From Regression to Classification: Exploring the Benefits of Categorical Representations of Energy in MLIPs [1.0998907972211756]
密度汎関数理論 (DFT) は分子のエネルギーと挙動を推定するための広く用いられる計算法である。
機械学習原子間ポテンシャル(MLIPs)は、DFTレベルのエネルギーと力を劇的に低い計算コストで近似するよう訓練されたモデルである。
本研究では,エネルギー/力の値に対するカテゴリー分布を予測する多クラス分類の定式化について検討する。
論文 参考訳(メタデータ) (2025-12-01T00:36:42Z) - Feynman-Kac Correctors in Diffusion: Annealing, Guidance, and Product of Experts [64.34482582690927]
事前学習したスコアベースモデルから得られた熱処理, 幾何平均, 製品分布の配列から, 効率的かつ原理的に抽出する方法を提供する。
本稿では,サンプリング品質を向上させるために,推論時間スケーリングを利用する逐次モンテカルロ(SMC)再サンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-03-04T17:46:51Z) - Many-body Expansion Based Machine Learning Models for Octahedral Transition Metal Complexes [0.0]
我々はオクタ遷移金属錯体(TMCs)のスピン状態依存性特性の機械学習における自己相関の修正を提案する。
新しい戦略は多体展開(MBE)に基づいており、MBEの切り離し順序を変化させることで、捕捉された立体異性体情報を調整することができる。
この新しいアプローチには電子構造理論からの洞察が組み込まれているため、これらのモデルは同素体から異性体への体系的な一般化を示す。
論文 参考訳(メタデータ) (2024-10-12T21:54:22Z) - Learning Equivariant Non-Local Electron Density Functionals [51.721844709174206]
等変グラフニューラルネットワーク(GNN)に基づく新しい非局所XC関数であるEquivariant Graph Exchange correlation (EG-XC)を導入する。
この点の雲に同変GNNを適用することにより、スケーラブルで正確な分子レンジ相互作用をキャプチャする。
EG-XCは、QM9上のデータ効率と分子サイズの外挿に優れ、5倍以上の分子で訓練された整合力場である。
論文 参考訳(メタデータ) (2024-10-10T14:31:45Z) - Scaling Laws in Linear Regression: Compute, Parameters, and Data [86.48154162485712]
無限次元線形回帰セットアップにおけるスケーリング法則の理論について検討する。
テストエラーの再現可能な部分は$Theta(-(a-1) + N-(a-1)/a)$であることを示す。
我々の理論は経験的ニューラルスケーリング法則と一致し、数値シミュレーションによって検証される。
論文 参考訳(メタデータ) (2024-06-12T17:53:29Z) - Scaling and renormalization in high-dimensional regression [72.59731158970894]
リッジ回帰に関する最近の結果について統一的な視点を提示する。
我々は、物理とディープラーニングの背景を持つ読者を対象に、ランダム行列理論と自由確率の基本的なツールを使用する。
我々の結果は拡張され、初期のスケーリング法則のモデルについて統一的な視点を提供する。
論文 参考訳(メタデータ) (2024-05-01T15:59:00Z) - Applications of flow models to the generation of correlated lattice QCD ensembles [69.18453821764075]
機械学習された正規化フローは、格子量子場理論の文脈で、異なる作用パラメータで格子ゲージ場の統計的に相関したアンサンブルを生成するために用いられる。
本研究は,これらの相関を可観測物の計算における分散低減に活用する方法を実証する。
論文 参考訳(メタデータ) (2024-01-19T18:33:52Z) - Quantifying predictive uncertainty of aphasia severity in stroke patients with sparse heteroscedastic Bayesian high-dimensional regression [47.1405366895538]
高次元データに対する疎線型回帰法は、通常、残留物が一定の分散を持つと仮定するが、これは実際には破ることができる。
本稿では,ヘテロセダスティック分割経験的ベイズ期待条件最大化アルゴリズムを用いて,高次元ヘテロセダスティック線形回帰モデルを推定する。
論文 参考訳(メタデータ) (2023-09-15T22:06:29Z) - Analysis of Interpolating Regression Models and the Double Descent
Phenomenon [3.883460584034765]
ノイズの多いトレーニングデータを補間するモデルは、一般化に乏しいと一般的に推測されている。
得られた最良のモデルは過度にパラメータ化され、テストエラーはモデル順序が増加するにつれて二重降下挙動を示す。
回帰行列の最小特異値の振舞いに基づいて、テスト誤差のピーク位置と二重降下形状をモデル順序の関数として説明する。
論文 参考訳(メタデータ) (2023-04-17T09:44:33Z) - Quantized Low-Rank Multivariate Regression with Random Dithering [23.81618208119832]
低ランク多変量回帰(LRMR)は重要な統計的学習モデルである。
基礎となる係数行列の推定に焦点をあてる。
我々は、ランダムディザリングを伴う均一な量子化、すなわち、量子化の前に適切なランダムノイズをデータに追加する。
制約付きラッソおよび正規化ラッソ推定器を提案し、非漸近誤差境界を導出する。
論文 参考訳(メタデータ) (2023-02-22T08:14:24Z) - GeoMol: Torsional Geometric Generation of Molecular 3D Conformer
Ensembles [60.12186997181117]
分子グラフからの分子の3Dコンホメーラーアンサンブルの予測は、化学情報学と薬物発見の領域において重要な役割を担っている。
既存の生成モデルは、重要な分子幾何学的要素のモデリングの欠如を含むいくつかの欠点がある。
エンド・ツー・エンド、非自己回帰、SE(3)不変の機械学習手法であるGeoMolを提案し、3Dコンバータを生成する。
論文 参考訳(メタデータ) (2021-06-08T14:17:59Z) - Surrogate-based variational data assimilation for tidal modelling [0.0]
データ同化(DA)は、物理知識と観測を結合するために広く用いられている。
気候変動の文脈では、古いキャリブレーションは必ずしも新しいシナリオに使用できない。
これにより、DA計算コストの問題が提起される。
複素モデルを代用する2つの方法が提案されている。
論文 参考訳(メタデータ) (2021-06-08T07:39:38Z) - Additive interaction modelling using I-priors [0.571097144710995]
相互作用を持つモデルのパプリミティブな仕様を導入し、その利点を2つ挙げる。
スケールパラメータの数を減らし、相互作用のあるモデルの推定を容易にする。
論文 参考訳(メタデータ) (2020-07-30T22:52:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。