論文の概要: Machine Learning Workflow for Analysis of High-Dimensional Order Parameter Space: A Case Study of Polymer Crystallization from Molecular Dynamics Simulations
- arxiv url: http://arxiv.org/abs/2507.17980v1
- Date: Wed, 23 Jul 2025 23:02:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-25 15:10:42.649875
- Title: Machine Learning Workflow for Analysis of High-Dimensional Order Parameter Space: A Case Study of Polymer Crystallization from Molecular Dynamics Simulations
- Title(参考訳): 高次数パラメータ空間解析のための機械学習ワークフロー:分子動力学シミュレーションによる高分子結晶化の事例研究
- Authors: Elyar Tourani, Brian J. Edwards, Bamin Khomami,
- Abstract要約: 高分子中の結晶化経路の同定は分子シミュレーションに基づくデータを用いて現在行われている。
本研究では,結晶度を正確に定量化するための統合機械学習ワークフローを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Currently, identification of crystallization pathways in polymers is being carried out using molecular simulation-based data on a preset cut-off point on a single order parameter (OP) to define nucleated or crystallized regions. Aside from sensitivity to cut-off, each of these OPs introduces its own systematic biases. In this study, an integrated machine learning workflow is presented to accurately quantify crystallinity in polymeric systems using atomistic molecular dynamics data. Each atom is represented by a high-dimensional feature vector that combines geometric, thermodynamic-like, and symmetry-based descriptors. Low dimensional embeddings are employed to expose latent structural fingerprints within atomic environments. Subsequently, unsupervised clustering on the embeddings identified crystalline and amorphous atoms with high fidelity. After generating high quality labels with multidimensional data, we use supervised learning techniques to identify a minimal set of order parameters that can fully capture this label. Various tests were conducted to reduce the feature set, demonstrating that using only three order parameters is sufficient to recreate the crystallization labels. Based on these observed OPs, the crystallinity index (C-index) is defined as the logistic regression model's probability of crystallinity, remaining bimodal throughout the process and achieving over 0.98 classification performance (AUC). Notably, a model trained on one or a few snapshots enables efficient on-the-fly computation of crystallinity. Lastly, we demonstrate how the optimal C-index fit evolves during various stages of crystallization, supporting the hypothesis that entropy dominates early nucleation, while symmetry gains relevance later. This workflow provides a data-driven strategy for OP selection and a metric to monitor structural transformations in large-scale polymer simulations.
- Abstract(参考訳): 高分子中の結晶化経路の同定は, 1次パラメータ(OP)上の予め設定されたカットオフ点上の分子シミュレーションに基づくデータを用いて行い, 核化領域や結晶化領域を定義する。
感度とカットオフの他に、それぞれのOPは独自の体系的バイアスを導入する。
本研究では, 分子動力学データを用いて, 高分子系の結晶度を正確に定量化するための統合機械学習ワークフローを提案する。
各原子は、幾何学的、熱力学的、対称性に基づく記述子を組み合わせた高次元特徴ベクトルで表される。
低次元の埋め込みは、原子環境下で潜伏する構造的な指紋を露出するために用いられる。
その後、埋め込み上の教師なしクラスタリングにより、高忠実度の結晶性原子とアモルファス原子が同定された。
多次元データを用いて高品質なラベルを生成した後、教師付き学習技術を用いて、このラベルを完全にキャプチャできる最小の順序パラメータを同定する。
結晶化ラベルを再現するには, 3次パラメータのみを用いるだけで十分であることを示すため, 特徴量を減らすために種々の試験を行った。
これらの観測されたOPに基づいて、結晶度指数(C-index)は、ロジスティック回帰モデルの結晶度確率として定義され、その過程を通してバイモーダルであり、0.98以上の分類性能(AUC)を達成する。
特に、1つまたは数個のスナップショットでトレーニングされたモデルは、結晶性の効率的なオンザフライ計算を可能にする。
最後に、結晶化の様々な段階で最適なC-インデックス適合がどう進化するかを示し、エントロピーが初期核形成を支配し、対称性が後から関連性を得るという仮説を支持する。
このワークフローは、OP選択のためのデータ駆動戦略と、大規模ポリマーシミュレーションにおける構造変換を監視する指標を提供する。
関連論文リスト
- Aligned Manifold Property and Topology Point Clouds for Learning Molecular Properties [55.2480439325792]
この研究は、局所量子由来のスカラー場とカスタムトポロジカルディスクリプタを組み合わせた分子表面表現であるAMPTCRを導入する。
分子量については、AMPTCRが物理的に意味のあるデータをコードし、検証R2は0.87であることを確認した。
細菌抑制タスクでは、AMPTCRは大腸菌阻害値の分類と直接回帰の両方を可能にする。
論文 参考訳(メタデータ) (2025-07-22T04:35:50Z) - Towards Space Group Determination from EBSD Patterns: The Role of Deep Learning and High-throughput Dynamical Simulations [0.7154115167845776]
深層学習法は、パターンを入力として、空間群対称性を分類することができる。
ニューラルネットワークは、背景修正EBSDパターンの空間群型を予測するために訓練された。
我々は,シミュレーションおよび実験データにおいて,90%以上の精度のスコアを得られたモデルを実現するためのレザベリング手法を提案する。
論文 参考訳(メタデータ) (2025-04-30T05:36:31Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Efficient Probabilistic Modeling of Crystallization at Mesoscopic Scale [4.271235935891555]
メソスコピックスケールでの結晶化プロセスは、特に材料科学と冶金学に興味がある。
本稿では,メソスコピックスケールでの効率的な結晶成長の確率モデルであるCrystal Growth Neural Emulator (CGNE)を紹介する。
CGNEは、最近の動的システムの最先端確率モデルと比較して、推論時間と性能の向上率を11倍に向上させる。
論文 参考訳(メタデータ) (2024-05-26T15:37:19Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - Data-free Weight Compress and Denoise for Large Language Models [96.68582094536032]
パラメータ行列を圧縮する手法として,データフリーなジョイントランクk近似を提案する。
キャリブレーションデータなしで、元の性能の93.43%を維持しながら80%のパラメータのモデルプルーニングを実現する。
論文 参考訳(メタデータ) (2024-02-26T05:51:47Z) - Latent Conservative Objective Models for Data-Driven Crystal Structure
Prediction [62.36797874900395]
計算化学において、結晶構造予測は最適化問題である。
この問題に対処する1つのアプローチは、密度汎関数理論(DFT)に基づいてシミュレータを構築し、続いてシミュレーションで探索を実行することである。
我々は,LCOM(最近の保守的客観モデル)と呼ばれる我々の手法が,構造予測の成功率の観点から,最も優れたアプローチと同等に機能することを示す。
論文 参考訳(メタデータ) (2023-10-16T04:35:44Z) - Data-Driven Score-Based Models for Generating Stable Structures with
Adaptive Crystal Cells [1.515687944002438]
本研究は, 化学安定性や化学組成など, 新しい結晶構造を創出することを目的としている。
提案手法の新規性は、結晶細胞の格子が固定されていないという事実にある。
対称性の制約を尊重し、計算上の優位性をもたらす多グラフ結晶表現が導入された。
論文 参考訳(メタデータ) (2023-10-16T02:53:24Z) - Crystal Structure Prediction by Joint Equivariant Diffusion [27.52168842448489]
結晶構造予測(CSP)は様々な科学分野において重要である。
本稿では, 安定結晶から構造分布を学習する新しい拡散モデルであるDiffCSPを提案する。
論文 参考訳(メタデータ) (2023-07-30T15:46:33Z) - Equivariant Parameter Sharing for Porous Crystalline Materials [4.271235935891555]
既存の結晶特性予測法は、制限的すぎる制約を持つか、単位細胞間で対称性を組み込むのみである。
我々は、結晶の単位セルの対称性をアーキテクチャに組み込んだモデルを開発し、多孔質構造を明示的にモデル化する。
提案手法は, 既存の結晶特性予測法よりも優れた性能を示し, 対称性の包含によりより効率的なモデルが得られることを確認した。
論文 参考訳(メタデータ) (2023-04-04T08:33:13Z) - A Score-based Geometric Model for Molecular Dynamics Simulations [33.158796937777886]
分子配座のログ密度の勾配を推定する新しいモデルScoreMDを提案する。
複数のアーキテクチャの改善により、MD17とC7O2H10の異性体において最先端のベースラインよりも優れています。
この研究は、新しい物質の加速と薬物発見に関する新たな洞察を提供する。
論文 参考訳(メタデータ) (2022-04-19T05:13:46Z) - Disentangling multiple scattering with deep learning: application to
strain mapping from electron diffraction patterns [48.53244254413104]
我々は、高非線形電子回折パターンを定量的構造因子画像に変換するために、FCU-Netと呼ばれるディープニューラルネットワークを実装した。
結晶構造の異なる組み合わせを含む20,000以上のユニークな動的回折パターンを用いてFCU-Netを訓練した。
シミュレーションされた回折パターンライブラリ、FCU-Netの実装、訓練されたモデルの重み付けは、オープンソースリポジトリで自由に利用可能です。
論文 参考訳(メタデータ) (2022-02-01T03:53:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。