論文の概要: Migration as a Probe: A Generalizable Benchmark Framework for Specialist vs. Generalist Machine-Learned Force Fields
- arxiv url: http://arxiv.org/abs/2509.00090v2
- Date: Fri, 17 Oct 2025 16:12:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 15:58:54.410098
- Title: Migration as a Probe: A Generalizable Benchmark Framework for Specialist vs. Generalist Machine-Learned Force Fields
- Title(参考訳): プローブとしてのマイグレーション: スペシャリスト対ジェネラリストマシン学習力場のための一般化可能なベンチマークフレームワーク
- Authors: Yi Cao, Paulette Clancy,
- Abstract要約: 機械学習力場(MLFF)は、分子動力学スケールでのアブ初期レベルの精度を実現することによって、計算材料科学を変革している。
研究者たちは、スペシャリストモデルをスクラッチから訓練するか、ファウンデーショナリストのファンデーションモデルを使うべきか、ハイブリッドアプローチを使うべきか?
本稿では, 弾性バンドトラジェクトリを用いて診断プローブとして評価する, 欠陥マイグレーション経路を用いたベンチマークフレームワークを提案する。
微調整モデルでは、運動特性に対するゼロショットおよびゼロショットのアプローチよりも大幅に優れるが、長距離物理学の部分的な損失を示す。
- 参考スコア(独自算出の注目度): 1.572216094651749
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine-learned force fields (MLFFs), especially pre-trained foundation models, are transforming computational materials science by enabling ab initio-level accuracy at molecular dynamics scales. Yet their rapid rise raises a key question: should researchers train specialist models from scratch, fine-tune generalist foundation models, or use hybrid approaches? The trade-offs in data efficiency, accuracy, cost, and robustness to out-of-distribution failure remain unclear. We introduce a benchmarking framework using defect migration pathways, evaluated through nudged elastic band trajectories, as diagnostic probes that test both interpolation and extrapolation. Using Cr-doped Sb2Te3 as a representative two-dimensional material, we benchmark multiple training paradigms within the MACE architecture across equilibrium, kinetic (atomic migration), and mechanical (interlayer sliding) tasks. Fine-tuned models substantially outperform from-scratch and zero-shot approaches for kinetic properties but show partial loss of long-range physics. Representational analysis reveals distinct, non-overlapping latent encodings, indicating that different training strategies learn different aspects of system physics. This framework provides practical guidelines for MLFF development and establishes migration-based probes as efficient diagnostics linking performance to learned representations, guiding future uncertainty-aware active learning.
- Abstract(参考訳): 機械学習力場(MLFF)、特に事前訓練された基礎モデル(英語版)は、分子動力学スケールでのアブ初期レベルの精度を実現することによって、計算材料科学を変換している。
研究者たちは、スペシャリストモデルをスクラッチから訓練するか、ファウンデーショナリストのファンデーションモデルを使うべきか、ハイブリッドアプローチを使うべきか?
データ効率、正確性、コスト、そしてアウト・オブ・ディストリビューションの失敗に対するロバスト性に関するトレードオフは、まだ不明である。
補間と外挿の両方を検査する診断プローブとして, 欠陥マイグレーション経路を用いたベンチマークフレームワークを導入する。
CrをドープしたSb2Te3を代表2次元材料として、平衡、運動論的(原子移動)、機械的(層間スライディング)タスクにわたるMACEアーキテクチャ内の複数のトレーニングパラダイムをベンチマークする。
微調整モデルでは、運動特性に対するゼロショットおよびゼロショットのアプローチよりも大幅に優れるが、長距離物理学の部分的な損失を示す。
表現解析は、異なるトレーニング戦略がシステム物理学の異なる側面を学ぶことを示す。
このフレームワークはMLFF開発のための実践的ガイドラインを提供し、学習された表現にパフォーマンスをリンクする効率的な診断としてマイグレーションベースのプローブを確立し、将来の不確実性を認識したアクティブラーニングを導く。
関連論文リスト
- Analysis of Transferability Estimation Metrics for Surgical Phase Recognition [3.3285108719932555]
微調整された事前学習モデルは現代の機械学習の基盤となり、限られたラベル付きデータで実践者がハイパフォーマンスを達成できるようになった。
専門的アノテーションが特に時間がかかり費用がかかる外科的ビデオ解析では、下流タスクに最適な事前学習モデルを特定することが重要かつ困難である。
我々は,2つの多様なデータセット上で,LogME,H-Score,TransRateの3つの代表的な指標の総合ベンチマークを行った。
論文 参考訳(メタデータ) (2025-08-22T18:05:33Z) - Learning Satellite Attitude Dynamics with Physics-Informed Normalising Flow [0.26217304977339473]
宇宙機の姿勢力学の学習に物理インフォームドニューラルネットワークを組み込むことの利点について検討する。
バシリスクシミュレータで生成されたシミュレーションデータに基づいて複数のモデルを訓練する。
PINNベースのモデルは、制御精度とロバスト性の観点から、純粋にデータ駆動モデルよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-11T10:50:49Z) - Physics-Informed Multimodal Bearing Fault Classification under Variable Operating Conditions using Transfer Learning [0.46085106405479537]
本研究では,物理インフォームド・マルチモーダル畳み込みニューラルネットワーク (CNN) とレイトフュージョンアーキテクチャを提案する。
このモデルには、物理的に不可解な予測をペナルティ化する、新しい物理インフォームド・ロス関数が組み込まれている。
パーダーボーン大学のデータセットの実験では、提案された物理学的インフォームドアプローチが、非物理学的インフォームドベースラインを一貫して上回ることを示した。
論文 参考訳(メタデータ) (2025-08-11T01:32:09Z) - Beyond Scaling: Measuring and Predicting the Upper Bound of Knowledge Retention in Language Model Pre-Training [51.41246396610475]
本稿では,外部ツールを使わずにクローズドブック質問応答(QA)の性能を予測することを目的とする。
我々は、21の公開言語と3つのカスタムトレーニングされた大規模言語モデルの事前学習コーパスに対して、大規模な検索と意味解析を行う。
これらの基礎の上に構築されたSMI(Size-dependent Mutual Information)は,事前学習データの特徴を線形に相関させる情報理論の指標である。
論文 参考訳(メタデータ) (2025-02-06T13:23:53Z) - What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。
モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文 参考訳(メタデータ) (2024-11-12T09:52:40Z) - Uncertainty-biased molecular dynamics for learning uniformly accurate interatomic potentials [25.091146216183144]
アクティブラーニングは、偏りや偏りのない分子動力学を用いて候補プールを生成する。
既存のバイアスやバイアスのないMDシミュレーション手法は、稀な事象や外挿領域を見逃しがちである。
この研究は、MLIPのエネルギー不確実性に偏ったMDが同時に外挿領域と稀な事象を捉えることを示した。
論文 参考訳(メタデータ) (2023-12-03T14:39:14Z) - Differentiable modeling to unify machine learning and physical models
and advance Geosciences [38.92849886903847]
微分可能地科学モデリング(DG)の概念,適用性,意義について概説する。
微分可能(differentiable)とは、モデル変数に関する勾配を正確かつ効率的に計算すること。
予備的な証拠は、DGが機械学習よりも優れた解釈可能性と因果性を提供することを示している。
論文 参考訳(メタデータ) (2023-01-10T15:24:14Z) - Forces are not Enough: Benchmark and Critical Evaluation for Machine
Learning Force Fields with Molecular Simulations [5.138982355658199]
分子動力学(MD)シミュレーション技術は様々な自然科学応用に広く用いられている。
我々は、最先端(SOTA)ML FFモデルの集合をベンチマークし、特に、一般的にベンチマークされる力の精度が、関連するシミュレーション指標とうまく一致していないことを示す。
論文 参考訳(メタデータ) (2022-10-13T17:59:03Z) - Physics-informed machine learning with differentiable programming for
heterogeneous underground reservoir pressure management [64.17887333976593]
地下貯水池の過圧化を避けることは、CO2の沈殿や排水の注入といった用途に欠かせない。
地中における複雑な不均一性のため, 噴射・抽出制御による圧力管理は困難である。
過圧化防止のための流体抽出速度を決定するために、フル物理モデルと機械学習を用いた微分可能プログラミングを用いる。
論文 参考訳(メタデータ) (2022-06-21T20:38:13Z) - Physics-Integrated Variational Autoencoders for Robust and Interpretable
Generative Modeling [86.9726984929758]
我々は、不完全物理モデルの深部生成モデルへの統合に焦点を当てる。
本稿では,潜在空間の一部が物理によって基底づけられたVAEアーキテクチャを提案する。
合成および実世界のデータセットの集合に対して生成的性能改善を示す。
論文 参考訳(メタデータ) (2021-02-25T20:28:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。