論文の概要: Model-free quantification of completeness, uncertainties, and outliers in atomistic machine learning using information theory
- arxiv url: http://arxiv.org/abs/2404.12367v2
- Date: Wed, 18 Sep 2024 16:30:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-19 23:13:20.332337
- Title: Model-free quantification of completeness, uncertainties, and outliers in atomistic machine learning using information theory
- Title(参考訳): 情報理論を用いた原子論的機械学習における完全性・不確実性・外れ値のモデルフリー定量化
- Authors: Daniel Schwalbe-Koda, Sebastien Hamel, Babak Sadigh, Fei Zhou, Vincenzo Lordi,
- Abstract要約: 原子論的機械学習(ML)は、情報内容を分析するために教師なし学習やモデル予測に依存していることが多い。
本稿では、原子論シミュレーションにおける情報内容の定量化のための厳密なモデルフリーツールを提供する理論的枠組みを提案する。
- 参考スコア(独自算出の注目度): 4.59916193837551
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: An accurate description of information is relevant for a range of problems in atomistic machine learning (ML), such as crafting training sets, performing uncertainty quantification (UQ), or extracting physical insights from large datasets. However, atomistic ML often relies on unsupervised learning or model predictions to analyze information contents from simulation or training data. Here, we introduce a theoretical framework that provides a rigorous, model-free tool to quantify information contents in atomistic simulations. We demonstrate that the information entropy of a distribution of atom-centered environments explains known heuristics in ML potential developments, from training set sizes to dataset optimality. Using this tool, we propose a model-free UQ method that reliably predicts epistemic uncertainty and detects out-of-distribution samples, including rare events in systems such as nucleation. This method provides a general tool for data-driven atomistic modeling and combines efforts in ML, simulations, and physical explainability.
- Abstract(参考訳): 情報の正確な記述は、トレーニングセットの作成、不確実性定量化(UQ)の実行、大規模なデータセットからの物理的な洞察の抽出など、原子論的機械学習(ML)の様々な問題に関係している。
しかし、原子論的MLは、シミュレーションやトレーニングデータから情報内容を分析するために、教師なし学習やモデル予測に依存していることが多い。
本稿では、原子論シミュレーションにおける情報内容の定量化のための厳密なモデルフリーツールを提供する理論的枠組みを提案する。
原子中心環境の分布の情報エントロピーは、トレーニングセットのサイズからデータセットの最適性に至るまで、機械学習の潜在的発展における既知のヒューリスティックスを説明する。
本ツールを用いて,難治性不確実性を確実に予測し,核生成などのシステムにおける稀な事象を含む分布外サンプルを検出するモデルフリーなUQ手法を提案する。
この方法は、データ駆動原子論モデリングのための一般的なツールを提供し、ML、シミュレーション、物理的説明可能性の取り組みを組み合わせたものである。
関連論文リスト
- Balancing Molecular Information and Empirical Data in the Prediction of Physico-Chemical Properties [8.649679686652648]
本稿では,分子記述子と表現学習を組み合わせた一般的な手法を提案する。
提案したハイブリッドモデルは,グラフニューラルネットワークを用いた化学構造情報を利用する。
構造に基づく予測が信頼できない場合を自動的に検出し、表現学習に基づく予測によって修正する。
論文 参考訳(メタデータ) (2024-06-12T10:51:00Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Accurate melting point prediction through autonomous physics-informed
learning [52.217497897835344]
NPTアンサンブルにおける共存シミュレーションから自律的に学習することで融点を計算するアルゴリズムを提案する。
固液共存進化の物理モデルを統合することで、アルゴリズムの精度が向上し、最適な意思決定が可能になることを実証する。
論文 参考訳(メタデータ) (2023-06-23T07:53:09Z) - Capturing dynamical correlations using implicit neural representations [85.66456606776552]
実験データから未知のパラメータを復元するために、モデルハミルトンのシミュレーションデータを模倣するために訓練されたニューラルネットワークと自動微分を組み合わせた人工知能フレームワークを開発する。
そこで本研究では, 実時間から多次元散乱データに適用可能な微分可能なモデルを1回だけ構築し, 訓練する能力について述べる。
論文 参考訳(メタデータ) (2023-04-08T07:55:36Z) - Modular machine learning-based elastoplasticity: generalization in the
context of limited data [0.0]
エラスト塑性の定式化のモジュラリティに頼って,データの変動量に対処できるハイブリッドフレームワークについて論じる。
発見された物質モデルは、よく補間できるだけでなく、トレーニングデータの領域外から熱力学的に一貫した方法で正確な外挿を可能にする。
論文 参考訳(メタデータ) (2022-10-15T17:35:23Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Prediction of liquid fuel properties using machine learning models with
Gaussian processes and probabilistic conditional generative learning [56.67751936864119]
本研究の目的は、代替燃料の物理的特性を予測するためのクロージャ方程式として機能する、安価で計算可能な機械学習モデルを構築することである。
これらのモデルは、MDシミュレーションのデータベースや、データ融合-忠実性アプローチによる実験的な測定を用いて訓練することができる。
その結果,MLモデルでは,広範囲の圧力および温度条件の燃料特性を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2021-10-18T14:43:50Z) - Learning Transport Processes with Machine Intelligence [0.0]
本稿では,輸送プロセスの研究に対処するための機械学習に基づくアプローチを提案する。
提案モデルでは, 輸送過程の潜在表現を, 予想よりも根本真理にかなり近い位置で学習することができる。
論文 参考訳(メタデータ) (2021-09-27T14:49:22Z) - Low-rank statistical finite elements for scalable model-data synthesis [0.8602553195689513]
statFEMは、支配方程式に強制を埋め込むことによって、事前モデルの誤特定を認める。
この方法は、観測されたデータ生成過程を最小限の情報損失で再構築する。
本稿では、下層の密度共分散行列の低ランク近似を埋め込むことで、このハードルを克服する。
論文 参考訳(メタデータ) (2021-09-10T09:51:43Z) - Using Data Assimilation to Train a Hybrid Forecast System that Combines
Machine-Learning and Knowledge-Based Components [52.77024349608834]
利用可能なデータがノイズの多い部分測定の場合,カオスダイナミクスシステムのデータ支援予測の問題を検討する。
動的システムの状態の部分的測定を用いることで、不完全な知識ベースモデルによる予測を改善するために機械学習モデルを訓練できることを示す。
論文 参考訳(メタデータ) (2021-02-15T19:56:48Z) - Uncertainty estimation for molecular dynamics and sampling [0.0]
機械学習モデルは、時間を要する電子構造計算をサイドステップする非常に効果的な戦略として登場した。
モデルのトレーニング中に含まれる有限個の参照構造から導かれる誤差を推定することは非常に重要である。
本報告では, 水や液体ガリウムほど多様な構造特性と熱力学特性, システムについて述べる。
論文 参考訳(メタデータ) (2020-11-10T00:07:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。