論文の概要: NepTrain and NepTrainKit: Automated Active Learning and Visualization Toolkit for Neuroevolution Potentials
- arxiv url: http://arxiv.org/abs/2506.01868v1
- Date: Mon, 02 Jun 2025 16:56:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:09.327373
- Title: NepTrain and NepTrainKit: Automated Active Learning and Visualization Toolkit for Neuroevolution Potentials
- Title(参考訳): NepTrainとNepTrainKit
- Authors: Chengbing Chen, Yutong Li, Rui Zhao, Zhoulin Liu, Zheyong Fan, Gang Tang, Zhiyong Wang,
- Abstract要約: トレーニングデータセットの初期化と管理に特化したNepTrainKitとNepTrainKitを開発しました。
NepTrainはオープンソースのPythonパッケージで、非物理的構造を識別・削除するための結合長フィルタリングメソッドを備えている。
NepTrainKitは、NEPトレーニングデータセット用に特別に設計されたGUIソフトウェアである。
- 参考スコア(独自算出の注目度): 11.540981668210144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As a machine-learned potential, the neuroevolution potential (NEP) method features exceptional computational efficiency and has been successfully applied in materials science. Constructing high-quality training datasets is crucial for developing accurate NEP models. However, the preparation and screening of NEP training datasets remain a bottleneck for broader applications due to their time-consuming, labor-intensive, and resource-intensive nature. In this work, we have developed NepTrain and NepTrainKit, which are dedicated to initializing and managing training datasets to generate high-quality training sets while automating NEP model training. NepTrain is an open-source Python package that features a bond length filtering method to effectively identify and remove non-physical structures from molecular dynamics trajectories, thereby ensuring high-quality training datasets. NepTrainKit is a graphical user interface (GUI) software designed specifically for NEP training datasets, providing functionalities for data editing, visualization, and interactive exploration. It integrates key features such as outlier identification, farthest-point sampling, non-physical structure detection, and configuration type selection. The combination of these tools enables users to process datasets more efficiently and conveniently. Using $\rm CsPbI_3$ as a case study, we demonstrate the complete workflow for training NEP models with NepTrain and further validate the models through materials property predictions. We believe this toolkit will greatly benefit researchers working with machine learning interatomic potentials.
- Abstract(参考訳): 機械が学習するポテンシャルとして、神経進化ポテンシャル(NEP)法は例外的な計算効率を特徴とし、材料科学に成功している。
正確なNEPモデルを開発するには、高品質なトレーニングデータセットの構築が不可欠だ。
しかし、NEPトレーニングデータセットの準備とスクリーニングは、その時間的、労働集約的、資源集約的な性質のために、幅広いアプリケーションにとってボトルネックのままである。
本研究では,NEPモデルトレーニングを自動化しつつ,高品質なトレーニングセットを生成するためのトレーニングデータセットの初期化と管理を目的としたNepTrainとNepTrainKitを開発した。
NepTrainはオープンソースのPythonパッケージで、結合長フィルタリング法によって分子動力学の軌道から非物理的構造を効果的に識別し、除去し、高品質なトレーニングデータセットを保証する。
NepTrainKitは、NEPトレーニングデータセットに特化したグラフィカルユーザインタフェース(GUI)ソフトウェアで、データ編集、可視化、インタラクティブな探索のための機能を提供する。
外乱識別、最遠点サンプリング、非物理的構造検出、設定タイプ選択といった重要な機能を統合する。
これらのツールを組み合わせることで、ユーザーはデータセットをより効率的に、便利に処理できる。
ケーススタディとして$\rm CsPbI_3$を用いて、NepTrainでNEPモデルをトレーニングするための完全なワークフローを実演し、材料特性予測によるモデルのさらなる検証を行う。
このツールキットは、機械学習の原子間ポテンシャルを扱う研究者に大いに役立つと信じています。
関連論文リスト
- High-performance training and inference for deep equivariant interatomic potentials [0.0]
我々はPyTorch Ahead-of-Time Inductorコンパイラを機械学習の原子間ポテンシャルに適用した最初のエンドツーエンドインフラストラクチャを紹介する。
これらの進歩は、実用関連性のシステムサイズに関する分子動力学計算を最大18倍に高速化する。
論文 参考訳(メタデータ) (2025-04-22T17:47:01Z) - Pre-training Graph Neural Networks with Structural Fingerprints for Materials Discovery [1.187456026346823]
本稿では,安価に計算された構造指紋を標的とする,新しい事前学習目標を提案する。
実験により,本手法はGNNの事前学習のための一般的な戦略として機能し,原子データに対する大規模基盤モデルへの適用が期待できる。
論文 参考訳(メタデータ) (2025-03-03T06:50:23Z) - PILOT: A Pre-Trained Model-Based Continual Learning Toolbox [65.57123249246358]
本稿では,PILOTとして知られるモデルベース連続学習ツールボックスについて紹介する。
一方、PILOTはL2P、DualPrompt、CODA-Promptといった事前学習モデルに基づいて、最先端のクラスインクリメンタル学習アルゴリズムを実装している。
一方、PILOTは、事前学習されたモデルの文脈に典型的なクラス増分学習アルゴリズムを適合させ、それらの効果を評価する。
論文 参考訳(メタデータ) (2023-09-13T17:55:11Z) - INGENIOUS: Using Informative Data Subsets for Efficient Pre-Training of
Language Models [40.54353850357839]
トレーニングコーパスの高度に代表的なサブセットを選択するために、サブモジュラー最適化を利用する方法を示す。
その結果,完全学習モデルの性能の最大$sim99%が得られた。
論文 参考訳(メタデータ) (2023-05-11T09:24:41Z) - PDSketch: Integrated Planning Domain Programming and Learning [86.07442931141637]
我々は PDSketch という新しいドメイン定義言語を提案する。
これにより、ユーザーはトランジションモデルで柔軟にハイレベルな構造を定義できる。
移行モデルの詳細は、トレーニング可能なニューラルネットワークによって満たされる。
論文 参考訳(メタデータ) (2023-03-09T18:54:12Z) - How to Train an Accurate and Efficient Object Detection Model on Any
Dataset [0.0]
オブジェクト検出訓練のためのデータセットに依存しないテンプレートを提案する。
慎重に選択され、事前訓練されたモデルと、さらなるトレーニングのための堅牢なトレーニングパイプラインで構成される。
私たちのソリューションは最初から動作し、幅広いデータセットに対して強力なベースラインを提供します。
論文 参考訳(メタデータ) (2022-11-30T17:09:01Z) - Learning to be a Statistician: Learned Estimator for Number of Distinct
Values [54.629042119819744]
列内の異なる値の数(NDV)を推定することは、データベースシステムにおける多くのタスクに有用である。
本研究では、ランダム(オンライン/オフライン)サンプルから正確なNDV推定を導出する方法に焦点を当てる。
教師付き学習フレームワークにおいて,NDV推定タスクを定式化し,モデルを推定対象として学習することを提案する。
論文 参考訳(メタデータ) (2022-02-06T15:42:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。