論文の概要: Information theory unifies atomistic machine learning, uncertainty quantification, and materials thermodynamics
- arxiv url: http://arxiv.org/abs/2404.12367v1
- Date: Thu, 18 Apr 2024 17:50:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-19 11:52:23.151257
- Title: Information theory unifies atomistic machine learning, uncertainty quantification, and materials thermodynamics
- Title(参考訳): 情報理論は、原子論的機械学習、不確実性定量化、および材料熱力学を統一する
- Authors: Daniel Schwalbe-Koda, Sebastien Hamel, Babak Sadigh, Fei Zhou, Vincenzo Lordi,
- Abstract要約: 情報の正確な記述は、原子論モデリングにおける様々な問題に関係している。
本稿では, 位相変換, 運動事象, データセットの最適性, モデルなしUQの予測を原子シミュレーションから統一する情報理論フレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.59916193837551
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: An accurate description of information is relevant for a range of problems in atomistic modeling, such as sampling methods, detecting rare events, analyzing datasets, or performing uncertainty quantification (UQ) in machine learning (ML)-driven simulations. Although individual methods have been proposed for each of these tasks, they lack a common theoretical background integrating their solutions. Here, we introduce an information theoretical framework that unifies predictions of phase transformations, kinetic events, dataset optimality, and model-free UQ from atomistic simulations, thus bridging materials modeling, ML, and statistical mechanics. We first demonstrate that, for a proposed representation, the information entropy of a distribution of atom-centered environments is a surrogate value for thermodynamic entropy. Using molecular dynamics (MD) simulations, we show that information entropy differences from trajectories can be used to build phase diagrams, identify rare events, and recover classical theories of nucleation. Building on these results, we use this general concept of entropy to quantify information in datasets for ML interatomic potentials (IPs), informing compression, explaining trends in testing errors, and evaluating the efficiency of active learning strategies. Finally, we propose a model-free UQ method for MLIPs using information entropy, showing it reliably detects extrapolation regimes, scales to millions of atoms, and goes beyond model errors. This method is made available as the package QUESTS: Quick Uncertainty and Entropy via STructural Similarity, providing a new unifying theory for data-driven atomistic modeling and combining efforts in ML, first-principles thermodynamics, and simulations.
- Abstract(参考訳): 情報の正確な記述は、サンプリング方法、希少事象の検出、データセットの分析、機械学習(ML)駆動シミュレーションにおける不確実性定量化(UQ)の実行など、原子論モデリングにおける様々な問題に関係している。
これらのタスクごとに個別の手法が提案されているが、それらのソリューションを統合する共通の理論的背景は欠如している。
本稿では, 位相変換, 運動事象, データセットの最適性, モデルフリーなUQの予測を原子シミュレーションから統一する情報理論フレームワークを提案する。
まず、提案した表現に対して、原子中心環境の分布の情報エントロピーが熱力学エントロピーの代理値であることを示す。
分子動力学 (MD) シミュレーションを用いて, 軌道からの情報エントロピー差を位相図の作成, 希少事象の同定, 核生成の古典理論の復元に利用できることを示す。
これらの結果に基づいて、このエントロピーの一般的な概念を用いて、ML間ポテンシャル(IP)のデータセットの情報を定量化し、圧縮をインフォームし、テストエラーの傾向を説明し、アクティブな学習戦略の効率を評価する。
最後に,情報エントロピーを用いたMLIPのモデルフリーUQ手法を提案する。
この方法はQUESTSのパッケージとして利用できる: 構造的類似性によるクイック不確実性とエントロピーは、データ駆動原子論モデリングのための新しい統一理論を提供し、ML、第一原理熱力学、シミュレーションの取り組みを組み合わせたものである。
関連論文リスト
- Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Stochastic Thermodynamics of Learning Parametric Probabilistic Models [0.0]
本稿では,PPM(Parametric Probabilistic Models)の学習過程における情報の流れを追跡する,記憶情報(M-info)と学習情報(L-info)の2つの情報理論指標を紹介する。
本研究では,学習過程におけるL-infoの蓄積がエントロピー生成と関連し,パラメータが熱貯水池として機能し,M-infoの形で学習情報を収集することを示した。
論文 参考訳(メタデータ) (2023-10-04T01:32:55Z) - Accurate melting point prediction through autonomous physics-informed
learning [52.217497897835344]
NPTアンサンブルにおける共存シミュレーションから自律的に学習することで融点を計算するアルゴリズムを提案する。
固液共存進化の物理モデルを統合することで、アルゴリズムの精度が向上し、最適な意思決定が可能になることを実証する。
論文 参考訳(メタデータ) (2023-06-23T07:53:09Z) - Capturing dynamical correlations using implicit neural representations [85.66456606776552]
実験データから未知のパラメータを復元するために、モデルハミルトンのシミュレーションデータを模倣するために訓練されたニューラルネットワークと自動微分を組み合わせた人工知能フレームワークを開発する。
そこで本研究では, 実時間から多次元散乱データに適用可能な微分可能なモデルを1回だけ構築し, 訓練する能力について述べる。
論文 参考訳(メタデータ) (2023-04-08T07:55:36Z) - Modular machine learning-based elastoplasticity: generalization in the
context of limited data [0.0]
エラスト塑性の定式化のモジュラリティに頼って,データの変動量に対処できるハイブリッドフレームワークについて論じる。
発見された物質モデルは、よく補間できるだけでなく、トレーニングデータの領域外から熱力学的に一貫した方法で正確な外挿を可能にする。
論文 参考訳(メタデータ) (2022-10-15T17:35:23Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Prediction of liquid fuel properties using machine learning models with
Gaussian processes and probabilistic conditional generative learning [56.67751936864119]
本研究の目的は、代替燃料の物理的特性を予測するためのクロージャ方程式として機能する、安価で計算可能な機械学習モデルを構築することである。
これらのモデルは、MDシミュレーションのデータベースや、データ融合-忠実性アプローチによる実験的な測定を用いて訓練することができる。
その結果,MLモデルでは,広範囲の圧力および温度条件の燃料特性を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2021-10-18T14:43:50Z) - Learning Transport Processes with Machine Intelligence [0.0]
本稿では,輸送プロセスの研究に対処するための機械学習に基づくアプローチを提案する。
提案モデルでは, 輸送過程の潜在表現を, 予想よりも根本真理にかなり近い位置で学習することができる。
論文 参考訳(メタデータ) (2021-09-27T14:49:22Z) - Low-rank statistical finite elements for scalable model-data synthesis [0.8602553195689513]
statFEMは、支配方程式に強制を埋め込むことによって、事前モデルの誤特定を認める。
この方法は、観測されたデータ生成過程を最小限の情報損失で再構築する。
本稿では、下層の密度共分散行列の低ランク近似を埋め込むことで、このハードルを克服する。
論文 参考訳(メタデータ) (2021-09-10T09:51:43Z) - Using Data Assimilation to Train a Hybrid Forecast System that Combines
Machine-Learning and Knowledge-Based Components [52.77024349608834]
利用可能なデータがノイズの多い部分測定の場合,カオスダイナミクスシステムのデータ支援予測の問題を検討する。
動的システムの状態の部分的測定を用いることで、不完全な知識ベースモデルによる予測を改善するために機械学習モデルを訓練できることを示す。
論文 参考訳(メタデータ) (2021-02-15T19:56:48Z) - Uncertainty estimation for molecular dynamics and sampling [0.0]
機械学習モデルは、時間を要する電子構造計算をサイドステップする非常に効果的な戦略として登場した。
モデルのトレーニング中に含まれる有限個の参照構造から導かれる誤差を推定することは非常に重要である。
本報告では, 水や液体ガリウムほど多様な構造特性と熱力学特性, システムについて述べる。
論文 参考訳(メタデータ) (2020-11-10T00:07:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。