論文の概要: Knowing when to trust machine-learned interatomic potentials
- arxiv url: http://arxiv.org/abs/2605.00640v1
- Date: Fri, 01 May 2026 13:21:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.961935
- Title: Knowing when to trust machine-learned interatomic potentials
- Title(参考訳): 機械学習による原子間ポテンシャルの信頼の時期を知る
- Authors: Shams Mehdi, Ilkwon Cho, Olexandr Isayev,
- Abstract要約: PROBEは予測毎の信頼確率を生成し、基礎となるモデルを変更することなく実際の誤差を追跡できることを示す。
PROBEはポストホックでアーキテクチャに依存しず、任意のマシンが学習した原子間ポテンシャルに直接デプロイ可能である。
- 参考スコア(独自算出の注目度): 1.5586922787941984
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Prevailing machine-learned interatomic potential (MLIP) uncertainty-quantification methods rely on ensembles of independently trained backbones. These methods scale unfavorably with foundation-scale MLIPs, and their member-disagreement signals correlate weakly with per-molecule prediction error. Here we probe the frozen per-atom representations of a pretrained MLIP with a compact discriminative classifier, recasting MLIP uncertainty quantification as selective classification rather than error regression. The resulting method, PROBE (Post-hoc Reliability frOm Backbone Embeddings), produces a per-prediction reliability probability that monotonically tracks actual error without modification to the underlying model. Across large held-out evaluation sets and two structurally distinct MLIP architectures, PROBE outperforms ensemble disagreement as a binary reliability signal, which strengthens with the expressiveness of the backbone representation, implying a favorable scaling trajectory toward foundation-scale MLIPs. Multi-head self-attention additionally yields per-atom importance maps, providing chemically interpretable diagnostics at no additional computational cost. PROBE is post-hoc and architecture-agnostic, and is directly deployable on any MLIP that exposes per-atom representations.
- Abstract(参考訳): 機械学習型原子間ポテンシャル(MLIP)の不確実性定量法は、独立に訓練されたバックボーンのアンサンブルに依存している。
これらの手法は, 基礎スケールのMLIPと好ましくないスケールで拡張し, 会員識別信号は分子ごとの予測誤差と弱相関する。
ここでは,事前学習したMLIPの凍結した原子単位の表現をコンパクトな識別的分類器を用いて探索し,MLIPの不確かさの定量化を誤り回帰よりも選択的な分類として再放送する。
結果として得られた PROBE (Post-hoc Reliability frOm Backbone Embeddings) は、基礎となるモデルを変更することなく実際のエラーを単調に追跡する予測毎の信頼性確率を生成する。
大規模な評価セットと2つの構造的に異なるMLIPアーキテクチャにおいて、 PROBE はアンサンブル不一致をバイナリ信頼性信号として優れており、バックボーン表現の表現力を強化し、基礎規模のMLIPに対する適切なスケーリング軌道を示唆している。
マルチヘッド自己アテンションは原子単位の重要マップを付加し、化学的に解釈可能な診断を追加の計算コストなしで提供する。
PROBEはポストホックでアーキテクチャに依存しず、原子単位の表現を公開する任意のMLIPに直接デプロイ可能である。
関連論文リスト
- Equivariant Evidential Deep Learning for Interatomic Potentials [55.6997213490859]
不確かさの定量化は、分子動力学シミュレーションにおける機械学習の原子間ポテンシャルの信頼性を評価するために重要である。
既存のMLIPのUQアプローチは、高い計算コストや準最適性能によって制限されることが多い。
我々は,原子間ポテンシャルの定量的深層学習(texte2$IP)を提案する。
論文 参考訳(メタデータ) (2026-02-11T02:00:25Z) - Learning a Generative Meta-Model of LLM Activations [75.30161960337892]
ネットワークの内部状態の分布を学習する"メタモデル"を作成します。
ステアリング介入前に学んだメタモデルを適用することで、損失が減少するにつれて、流速が向上する。
これらの結果は、生成的メタモデルが制限的な構造的仮定を伴わずに、解釈可能性へのスケーラブルな経路を提供することを示唆している。
論文 参考訳(メタデータ) (2026-02-06T18:59:56Z) - From Evaluation to Design: Using Potential Energy Surface Smoothness Metrics to Guide Machine Learning Interatomic Potential Architectures [12.68400434984463]
MLIPは量子ポテンシャルエネルギー表面の物理的滑らかさを再現することができない。
マイクロカノニカル分子動力学のような既存の評価は計算に高価であり、主に近平衡状態を研究する。
MLIPの評価基準を改善するためにBSCT(Band Smoothness Characterization Test)を導入する。
論文 参考訳(メタデータ) (2026-02-04T18:50:10Z) - SIGMA: Scalable Spectral Insights for LLM Collapse [51.863164847253366]
SIGMA(Spectral Inequalities for Gram Matrix Analysis)は,モデル崩壊のための統一的なフレームワークである。
行列のスペクトル上の決定論的境界を導出するベンチマークを利用することで、SIGMAは表現空間の収縮を追跡するために数学的に基底化された計量を提供する。
我々は、SIGMAが状態への遷移を効果的に捉え、崩壊のメカニズムに関する理論的知見の両方を提供することを示した。
論文 参考訳(メタデータ) (2026-01-06T19:47:11Z) - BLIPs: Bayesian Learned Interatomic Potentials [47.73617239750485]
機械学習原子間ポテンシャル(MLIP)は、シミュレーションベースの化学の中心的なツールになりつつある。
MLIPは、アクティブな学習パイプラインをガイドする基本となる、構築による不確実性推定を提供していない。
BLIPはスケーラブルでアーキテクチャに依存しない、トレーニングや微調整のためのベイズ的フレームワークである。
論文 参考訳(メタデータ) (2025-08-19T17:28:14Z) - Simple Yet Effective: An Information-Theoretic Approach to Multi-LLM Uncertainty Quantification [9.397157329808254]
MUSEは、大規模言語モデルのよく校正されたサブセットを特定し、集約するための単純な情報理論手法である。
二分予測タスクの実験では、単一モデルとナイーブアンサンブルベースラインと比較してキャリブレーションと予測性能が改善された。
論文 参考訳(メタデータ) (2025-07-09T19:13:25Z) - Accurate, transferable, and verifiable machine-learned interatomic potentials for layered materials [0.0]
ツイストされた層状バンダーワールス材料は、しばしば、非ツイストの材料に欠如しているユニークな電子的および光学的特性を示す。
本稿では、層内相互作用と層間相互作用を分離する、マシン学習型原子間ポテンシャルとデータセットキュレーション手法を提案する。
本手法は,様々な層内相互作用モデルや層間相互作用モデルとシームレスに統合し,モワール材料の計算的緩和を可能にする。
論文 参考訳(メタデータ) (2025-03-19T17:14:02Z) - Cycles of Thought: Measuring LLM Confidence through Stable Explanations [53.15438489398938]
大規模言語モデル(LLM)は、様々なベンチマークで人間レベルの精度に到達し、さらに超えることができるが、不正確な応答における過度な自信は、依然として十分に文書化された障害モードである。
本稿では,LLMの不確実性を測定するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-05T16:35:30Z) - LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks [52.46420522934253]
本稿では,自己注意ネットワークのためのパラメータ効率のよいアンサンブル手法であるLoRA-Ensembleを紹介する。
この方法は、BatchEnsembleのような最先端の暗黙のテクニックを上回るだけでなく、Explicit Ensembleの正確さにマッチするか超える。
論文 参考訳(メタデータ) (2024-05-23T11:10:32Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。