論文の概要: Model-free quantification of completeness, uncertainties, and outliers in atomistic machine learning using information theory
- arxiv url: http://arxiv.org/abs/2404.12367v2
- Date: Wed, 18 Sep 2024 16:30:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-19 23:13:20.332337
- Title: Model-free quantification of completeness, uncertainties, and outliers in atomistic machine learning using information theory
- Title(参考訳): 情報理論を用いた原子論的機械学習における完全性・不確実性・外れ値のモデルフリー定量化
- Authors: Daniel Schwalbe-Koda, Sebastien Hamel, Babak Sadigh, Fei Zhou, Vincenzo Lordi,
- Abstract要約: 原子論的機械学習(ML)は、情報内容を分析するために教師なし学習やモデル予測に依存していることが多い。
本稿では、原子論シミュレーションにおける情報内容の定量化のための厳密なモデルフリーツールを提供する理論的枠組みを提案する。
- 参考スコア(独自算出の注目度): 4.59916193837551
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: An accurate description of information is relevant for a range of problems in atomistic machine learning (ML), such as crafting training sets, performing uncertainty quantification (UQ), or extracting physical insights from large datasets. However, atomistic ML often relies on unsupervised learning or model predictions to analyze information contents from simulation or training data. Here, we introduce a theoretical framework that provides a rigorous, model-free tool to quantify information contents in atomistic simulations. We demonstrate that the information entropy of a distribution of atom-centered environments explains known heuristics in ML potential developments, from training set sizes to dataset optimality. Using this tool, we propose a model-free UQ method that reliably predicts epistemic uncertainty and detects out-of-distribution samples, including rare events in systems such as nucleation. This method provides a general tool for data-driven atomistic modeling and combines efforts in ML, simulations, and physical explainability.
- Abstract(参考訳): 情報の正確な記述は、トレーニングセットの作成、不確実性定量化(UQ)の実行、大規模なデータセットからの物理的な洞察の抽出など、原子論的機械学習(ML)の様々な問題に関係している。
しかし、原子論的MLは、シミュレーションやトレーニングデータから情報内容を分析するために、教師なし学習やモデル予測に依存していることが多い。
本稿では、原子論シミュレーションにおける情報内容の定量化のための厳密なモデルフリーツールを提供する理論的枠組みを提案する。
原子中心環境の分布の情報エントロピーは、トレーニングセットのサイズからデータセットの最適性に至るまで、機械学習の潜在的発展における既知のヒューリスティックスを説明する。
本ツールを用いて,難治性不確実性を確実に予測し,核生成などのシステムにおける稀な事象を含む分布外サンプルを検出するモデルフリーなUQ手法を提案する。
この方法は、データ駆動原子論モデリングのための一般的なツールを提供し、ML、シミュレーション、物理的説明可能性の取り組みを組み合わせたものである。
関連論文リスト
- Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Electronic Structure Prediction of Multi-million Atom Systems Through Uncertainty Quantification Enabled Transfer Learning [5.4875371069660925]
基底状態電子密度 -- コーン・シャム密度汎関数理論(KS-DFT)シミュレーションで得られる -- は、豊富な物質情報を含んでいる。
しかし、KS-DFTの計算コストは、トレーニングデータ生成を妨害する傾向にあるシステムサイズと3倍にスケールする。
ここでは,この基本的課題に,移動学習を用いて学習データのマルチスケールな性質を活用する。
論文 参考訳(メタデータ) (2023-08-24T21:41:29Z) - Capturing dynamical correlations using implicit neural representations [85.66456606776552]
実験データから未知のパラメータを復元するために、モデルハミルトンのシミュレーションデータを模倣するために訓練されたニューラルネットワークと自動微分を組み合わせた人工知能フレームワークを開発する。
そこで本研究では, 実時間から多次元散乱データに適用可能な微分可能なモデルを1回だけ構築し, 訓練する能力について述べる。
論文 参考訳(メタデータ) (2023-04-08T07:55:36Z) - Prediction of liquid fuel properties using machine learning models with
Gaussian processes and probabilistic conditional generative learning [56.67751936864119]
本研究の目的は、代替燃料の物理的特性を予測するためのクロージャ方程式として機能する、安価で計算可能な機械学習モデルを構築することである。
これらのモデルは、MDシミュレーションのデータベースや、データ融合-忠実性アプローチによる実験的な測定を用いて訓練することができる。
その結果,MLモデルでは,広範囲の圧力および温度条件の燃料特性を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2021-10-18T14:43:50Z) - Learning Transport Processes with Machine Intelligence [0.0]
本稿では,輸送プロセスの研究に対処するための機械学習に基づくアプローチを提案する。
提案モデルでは, 輸送過程の潜在表現を, 予想よりも根本真理にかなり近い位置で学習することができる。
論文 参考訳(メタデータ) (2021-09-27T14:49:22Z) - Hessian-based toolbox for reliable and interpretable machine learning in
physics [58.720142291102135]
本稿では,モデルアーキテクチャの解釈可能性と信頼性,外挿を行うためのツールボックスを提案する。
与えられたテストポイントでの予測に対する入力データの影響、モデル予測の不確実性の推定、およびモデル予測の不可知スコアを提供する。
我々の研究は、物理学やより一般的には科学に適用されたMLにおける解釈可能性と信頼性の方法の体系的利用への道を開く。
論文 参考訳(メタデータ) (2021-08-04T16:32:59Z) - Calibrated Uncertainty for Molecular Property Prediction using Ensembles
of Message Passing Neural Networks [11.47132155400871]
我々は、分子や物質の特性を予測するために特別に設計されたメッセージパッシングニューラルネットワークを拡張した。
その結果,分子生成エネルギーのキャリブレーションの不確実性を考慮した予測モデルが得られた。
論文 参考訳(メタデータ) (2021-07-13T13:28:11Z) - Quantum-tailored machine-learning characterization of a superconducting
qubit [50.591267188664666]
我々は,量子デバイスのダイナミクスを特徴付ける手法を開発し,デバイスパラメータを学習する。
このアプローチは、数値的に生成された実験データに基づいてトレーニングされた物理に依存しないリカレントニューラルネットワークより優れている。
このデモンストレーションは、ドメイン知識を活用することで、この特徴付けタスクの正確性と効率が向上することを示す。
論文 参考訳(メタデータ) (2021-06-24T15:58:57Z) - Using Data Assimilation to Train a Hybrid Forecast System that Combines
Machine-Learning and Knowledge-Based Components [52.77024349608834]
利用可能なデータがノイズの多い部分測定の場合,カオスダイナミクスシステムのデータ支援予測の問題を検討する。
動的システムの状態の部分的測定を用いることで、不完全な知識ベースモデルによる予測を改善するために機械学習モデルを訓練できることを示す。
論文 参考訳(メタデータ) (2021-02-15T19:56:48Z) - Wavelet Scattering Networks for Atomistic Systems with Extrapolation of
Material Properties [7.555136209115944]
物質科学における機械学習の夢は、モデルが原子系の基礎となる物理学を学ぶことである。
本研究では、トレーニングセットに含まれていないプロパティに対する$textLi_alphatextSi$ Energy predictorの一般化性をテストする。
論文 参考訳(メタデータ) (2020-06-01T20:36:17Z) - Embedded-physics machine learning for coarse-graining and collective
variable discovery without data [3.222802562733787]
基礎となる物理を一貫して組み込む新しい学習フレームワークを提案する。
原子間力場の形で利用可能な物理学を完全に組み込んだ逆クルバック・リーブラー分岐に基づく新しい目的を提案する。
本研究は,バイモーダルポテンシャルエネルギー関数とアラニンジペプチドに対するCVの予測能力および物理的意義の観点からアルゴリズムの進歩を実証する。
論文 参考訳(メタデータ) (2020-02-24T10:28:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。