論文の概要: Force-Aware Neural Tangent Kernels for Scalable and Robust Active Learning of MLIPs
- arxiv url: http://arxiv.org/abs/2605.13788v2
- Date: Fri, 15 May 2026 16:53:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:25.968648
- Title: Force-Aware Neural Tangent Kernels for Scalable and Robust Active Learning of MLIPs
- Title(参考訳): MLIPのスケーラブルかつロバストな能動学習のための力認識型ニューラルネットワークカーネル
- Authors: Eszter Varga-Umbrich, Zachary Weller-Davies, Paul Duckworth, Jules Tilly, Olivier Peltre, Shikha Surana,
- Abstract要約: チャンク付き特徴空間後部分散ショートリストに基づく線形スケーリング獲得フレームワークを提案する。
次に,ニューラル・タンジェント・カーネル (NTK) をパラメータ座標の混合による力覚設定に拡張する。
我々は,力覚獲得が不可欠であるOC20データセットに対する共同エネルギー力NTKの有効性を実証する。
- 参考スコア(独自算出の注目度): 4.4406458484306555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active learning for machine-learning interatomic potentials (MLIPs) must address several challenges to be practical: scaling to large candidate pools, leveraging energy-force supervision, and maintaining robustness when candidate pools are biased relative to the target distribution. In this work, we jointly address these challenges. We first introduce a linearly scaling acquisition framework based on chunked feature-space posterior-variance shortlisting. By avoiding materialisation of the candidate and train set kernels, this approach enables screening of ~200k structures within hours and applies broadly to acquisition strategies that score candidates based on molecular similarity metrics. We then extend the Neural Tangent Kernel (NTK) to a force-aware setting via mixed parameter-coordinate derivatives, yielding a force NTK and a joint energy-force NTK that provide natural similarity metrics for vector-field prediction. We demonstrate the effectiveness of the joint energy-force NTK on the OC20 dataset, where force-aware acquisition is crucial: it achieves the lowest energy and force MAE and RMSE across all metrics and distribution splits. Across T1x, PMechDB, and RGD benchmarks, our force NTK methods remain competitive with established baselines while being significantly more efficient than committee-based approaches. Under a controlled candidate-pool shift case study on T1x, acquisition based on pretrained MLIP embeddings and NTKs remains robust, whereas committee-based methods exhibit higher variance. Overall, these results show that a single pretrained MLIP can enable scalable, force-aware, and distribution-robust active learning for foundation-model fine-tuning.
- Abstract(参考訳): 機械学習の原子間ポテンシャル(MLIP)のアクティブラーニングは、大きな候補プールへのスケーリング、エネルギー力の監督の活用、ターゲット分布に対して候補プールがバイアスを受ける場合のロバスト性維持など、実践すべきいくつかの課題に対処する必要がある。
本研究では,これらの課題を共同で解決する。
まず,チャンク付き特徴空間後分散ショートリストに基づく線形スケーリング獲得フレームワークを提案する。
候補とトレインセットのカーネルの物質化を避けることにより、時間内に約200kの構造のスクリーニングが可能となり、分子類似度測定値に基づいて候補をスコアリングする獲得戦略に広く適用される。
次に、ニューラル・タンジェント・カーネル(NTK)を混合パラメータ座標微分により力覚設定に拡張し、ベクトル場予測のための自然な類似度指標を提供する力NTKと合同エネルギー力NTKを生成する。
我々は,OC20データセットにおける共同エネルギー力NTKの有効性を実証する。このデータセットでは,力覚獲得が重要であり,すべての指標と分布分割に対して最小のエネルギーを達成し,MAEとRMSEを強制する。
T1x, PMechDB, RGDベンチマーク全体では, NTK法は既存のベースラインと競合する一方で, 委員会ベースアプローチよりもはるかに効率的である。
T1xの制御された候補プールシフトケーススタディでは、事前訓練されたMLIP埋め込みとNTKに基づく取得が引き続き堅牢であり、一方委員会ベースの手法はより分散度が高い。
これらの結果から,1つの事前学習されたMLIPが,基礎モデル微調整のための拡張性,力覚,分散ロバストな能動学習を可能にすることが示された。
関連論文リスト
- Pretrained Model Representations as Acquisition Signals for Active Learning of MLIPs [4.4406458484306555]
本稿では,事前学習したMLIPの潜伏空間に,効果的な取得に必要な情報が含まれているかを検討する。
我々は、事前訓練されたMACE電位から直接引き起こされる2つの取得信号を紹介する。
この結果から,事前学習は遅延空間形状とモデル誤差とを一致させ,反応MLIP微調整のための実用的かつ十分な取得信号が得られることが示唆された。
論文 参考訳(メタデータ) (2026-05-05T16:48:23Z) - Too Correct to Learn: Reinforcement Learning on Saturated Reasoning Data [55.84428098924793]
構造保存探索を行うためのパラメータ自由復号法である Constrained Uniform Top-K Smpling (CUTS) を提案する。
グループ内の利点分散を増幅するために、エクスプロイトと探索的なロールアウトを相乗化するためのトレーニングフレームワークであるMixed-CUTSに統合する。
特にMixed-CUTSは、AIME25ベンチマークのPass@1の精度を標準のGRPOよりも15.1%向上している。
論文 参考訳(メタデータ) (2026-04-20T16:43:28Z) - Equivariant Evidential Deep Learning for Interatomic Potentials [55.6997213490859]
不確かさの定量化は、分子動力学シミュレーションにおける機械学習の原子間ポテンシャルの信頼性を評価するために重要である。
既存のMLIPのUQアプローチは、高い計算コストや準最適性能によって制限されることが多い。
我々は,原子間ポテンシャルの定量的深層学習(texte2$IP)を提案する。
論文 参考訳(メタデータ) (2026-02-11T02:00:25Z) - HE-SNR: Uncovering Latent Logic via Entropy for Guiding Mid-Training on SWE-BENCH [11.643006508214887]
SWE-benchは、複雑なソフトウェアエンジニアリングタスクで大規模言語モデルを評価するための主要なベンチマークとして登場した。
Perplexity(PPL)のような標準メトリクスは、"Long-Context Tax"によって妥協され、下流SWEのパフォーマンスと弱い相関を示す。
提案するエントロピー圧縮仮説は,スカラートップ1圧縮ではなく,エントロピー圧縮状態に不確実性を構築する能力によって,インテリジェンスを再定義するものである。
論文 参考訳(メタデータ) (2026-01-28T05:03:24Z) - CoT-Saliency: Unified Chain-of-Thought Reasoning for Heterogeneous Saliency Tasks [96.64597365827046]
本稿では,3つの運用上不均一なサリエンシタスクを共同で処理する,最初の統合フレームワークを提案する。
タスクの不均一性を橋渡しする視覚言語モデル(VLM)において、チェーン・オブ・ソート(CoT)推論プロセスを導入する。
我々は,全タスクにまたがる特別なSOTA手法と強力なクローズドソースVLMの整合性を示す。
論文 参考訳(メタデータ) (2025-11-01T04:37:01Z) - Deep Hierarchical Learning with Nested Subspace Networks [53.71337604556311]
大規模ニューラルネットワークのためのNested Subspace Networks (NSN)を提案する。
NSNは、単一のモデルを連続した計算予算の範囲で動的かつきめ細かな調整を可能にする。
我々は,NSNを訓練済みのLLMに外科的に適用し,スムーズで予測可能な計算性能フロンティアを解き放つことができることを示した。
論文 参考訳(メタデータ) (2025-09-22T15:13:14Z) - Fishing For Cheap And Efficient Pruners At Initialization [4.433137726540548]
Pruningは、大規模ディープニューラルネットワーク(DNN)のデプロイに伴うコストと環境への影響を軽減する、有望なソリューションを提供する。
本稿では,Fisher-Taylor Sensitivity (FTS)について紹介する。これは,経験的Fisher Information Matrix (FIM) 対角線に基づく,安価で効率的なプルーニング基準である。
提案手法は, 極端間隔条件下であっても, ワンショットPSTの最先端技術に対する競合性能を実現する。
論文 参考訳(メタデータ) (2025-02-17T05:22:23Z) - Parameter-Efficient Fine-Tuning for Continual Learning: A Neural Tangent Kernel Perspective [125.00228936051657]
本稿では,タスク関連機能を適応的に生成しながら,タスク固有のパラメータ記憶を不要にする新しいフレームワークNTK-CLを紹介する。
最適化可能なパラメータを適切な正規化で微調整することにより、NTK-CLは確立されたPEFT-CLベンチマーク上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-07-24T09:30:04Z) - Lyapunov-stable Neural Control for State and Output Feedback: A Novel Formulation [67.63756749551924]
学習ベースのニューラルネットワーク(NN)制御ポリシは、ロボット工学と制御の幅広いタスクにおいて、印象的な経験的パフォーマンスを示している。
非線形力学系を持つNNコントローラのトラクション領域(ROA)に対するリアプノフ安定性の保証は困難である。
我々は、高速な経験的ファルシフィケーションと戦略的正則化を用いて、Lyapunov証明書とともにNNコントローラを学習するための新しいフレームワークを実証する。
論文 参考訳(メタデータ) (2024-04-11T17:49:15Z) - Neural-Kernel Conditional Mean Embeddings [26.862984140099837]
カーネル条件付き平均埋め込み(CME)は条件分布を表す強力なフレームワークを提供するが、スケーラビリティと課題に直面することが多い。
本稿では,これらの課題に対処するために,ディープラーニングとCMEの強みを効果的に組み合わせた新しい手法を提案する。
条件付き密度推定タスクでは、NN-CMEハイブリッドは競合性能を達成し、しばしば既存のディープラーニング手法を上回ります。
論文 参考訳(メタデータ) (2024-03-16T08:51:02Z) - Efficient kernel surrogates for neural network-based regression [0.8030359871216615]
ニューラルタンジェントカーネル(NTK)の効率的な近似である共役カーネル(CK)の性能について検討する。
CK性能がNTKよりもわずかに劣っていることを示し、特定の場合において、CK性能が優れていることを示す。
NTKの代わりにCKを使用するための理論的基盤を提供するだけでなく,DNNの精度を安価に向上するためのレシピを提案する。
論文 参考訳(メタデータ) (2023-10-28T06:41:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。