論文の概要: OXtal: An All-Atom Diffusion Model for Organic Crystal Structure Prediction
- arxiv url: http://arxiv.org/abs/2512.06987v1
- Date: Sun, 07 Dec 2025 20:46:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.618032
- Title: OXtal: An All-Atom Diffusion Model for Organic Crystal Structure Prediction
- Title(参考訳): 有機結晶構造予測のための全原子拡散モデルOXtal
- Authors: Emily Jin, Andrei Cristian Nica, Mikhail Galkin, Jarrid Rector-Brooks, Kin Long Kelvin Lee, Santiago Miret, Frances H. Arnold, Michael Bronstein, Avishek Joey Bose, Alexander Tong, Cheng-Hao Liu,
- Abstract要約: 分子内コンフォーメーションと周期的パッキングの条件付き関節分布を学習する大規模100Mパラメータ全原子拡散モデルであるOXtalを導入する。
実験的に検証された600Kの結晶構造の大規模なデータセットを活用することで、OXtalは、以前のabinitio機械学習CSPメソッドよりも改善の順序を達成できる。
オキシタルは80%以上のパッキング類似率を獲得し、分子結晶化の熱力学的および運動論的規則性の両方をモデル化する能力を示している。
- 参考スコア(独自算出の注目度): 63.318434943975255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurately predicting experimentally-realizable 3D molecular crystal structures from their 2D chemical graphs is a long-standing open challenge in computational chemistry called crystal structure prediction (CSP). Efficiently solving this problem has implications ranging from pharmaceuticals to organic semiconductors, as crystal packing directly governs the physical and chemical properties of organic solids. In this paper, we introduce OXtal, a large-scale 100M parameter all-atom diffusion model that directly learns the conditional joint distribution over intramolecular conformations and periodic packing. To efficiently scale OXtal, we abandon explicit equivariant architectures imposing inductive bias arising from crystal symmetries in favor of data augmentation strategies. We further propose a novel crystallization-inspired lattice-free training scheme, Stoichiometric Stochastic Shell Sampling ($S^4$), that efficiently captures long-range interactions while sidestepping explicit lattice parametrization -- thus enabling more scalable architectural choices at all-atom resolution. By leveraging a large dataset of 600K experimentally validated crystal structures (including rigid and flexible molecules, co-crystals, and solvates), OXtal achieves orders-of-magnitude improvements over prior ab initio machine learning CSP methods, while remaining orders of magnitude cheaper than traditional quantum-chemical approaches. Specifically, OXtal recovers experimental structures with conformer $\text{RMSD}_1<0.5$ Å and attains over 80\% packing similarity rate, demonstrating its ability to model both thermodynamic and kinetic regularities of molecular crystallization.
- Abstract(参考訳): 2次元化学グラフから実験的に実現可能な3次元分子結晶構造を正確に予測することは、結晶構造予測(CSP)と呼ばれる計算化学における長年の挑戦である。
この問題を効果的に解決することは、医薬品から有機半導体まで、結晶パッキングが有機固体の物理的および化学的性質を直接支配するからである。
本稿では,分子内コンフォーメーションと周期的パッキングによる条件付き関節分布を直接学習する大規模100Mパラメータ全原子拡散モデルであるOXtalを紹介する。
OXtalを効率的にスケールするために、結晶対称性から生じる誘導バイアスを示唆する明示的同変アーキテクチャを放棄し、データ拡張戦略を優先する。
さらに, 結晶化にインスパイアされた格子フリートレーニングスキーム, Stoichiometric Stochastic Shell Sampling (S^4$)を提案する。
実験で検証された600Kの結晶構造(剛性および柔軟な分子、共結晶、溶媒を含む)の大規模なデータセットを活用することで、OXtalは従来の量子化学手法よりも桁違いに低いオーダーを保ちながら、以前のアブ・イニシアト・機械学習のCSP法よりもマグニチュード・オブ・マグニチュードの改善を実現している。
具体的には、OXtal はコンホメータ $\text{RMSD}_1<0.5$ > で実験構造を復元し、80 %以上のパッキング類似性を達成し、分子結晶化の熱力学的および運動論的規則性の両方をモデル化する能力を示した。
関連論文リスト
- Foundation Models for Discovery and Exploration in Chemical Space [57.97784111110166]
MISTは、大規模なラベルなしデータセットに基づいて訓練された分子基盤モデルのファミリーである。
我々は、これらのモデルが化学空間をまたいだ現実世界の問題を解決する能力を実証する。
論文 参考訳(メタデータ) (2025-10-20T17:56:01Z) - Machine Learning Workflow for Analysis of High-Dimensional Order Parameter Space: A Case Study of Polymer Crystallization from Molecular Dynamics Simulations [0.0]
高分子中の結晶化経路の同定は分子シミュレーションに基づくデータを用いて現在行われている。
本研究では,結晶度を正確に定量化するための統合機械学習ワークフローを提案する。
論文 参考訳(メタデータ) (2025-07-23T23:02:10Z) - End-to-End Crystal Structure Prediction from Powder X-Ray Diffraction [37.563382606039006]
本研究では,PXRDを用いた結晶構造予測モデルであるXtalNetを紹介する。
XtalNetはPXRDを付加条件として利用し、曖昧さを排除し、単位細胞に最大400個の原子を持つ複雑な有機構造を生成する。
XtalNetは、条件付き結晶構造予測タスクにおいて、hMOF-100とhMOF-400において、90.2%と79%のトップ10マッチングレートを達成する。
論文 参考訳(メタデータ) (2024-01-08T12:50:17Z) - Latent Conservative Objective Models for Data-Driven Crystal Structure
Prediction [62.36797874900395]
計算化学において、結晶構造予測は最適化問題である。
この問題に対処する1つのアプローチは、密度汎関数理論(DFT)に基づいてシミュレータを構築し、続いてシミュレーションで探索を実行することである。
我々は,LCOM(最近の保守的客観モデル)と呼ばれる我々の手法が,構造予測の成功率の観点から,最も優れたアプローチと同等に機能することを示す。
論文 参考訳(メタデータ) (2023-10-16T04:35:44Z) - Crystal-GFN: sampling crystals with desirable properties and constraints [103.79058968784163]
本稿では,結晶構造の生成モデルであるCrystal-GFNを紹介する。
本稿では,MatBenchで学習した新しいプロキシ機械学習モデルにより予測された結晶構造の原子1個あたりの生成エネルギーを目的として利用する。
その結果、Crystal-GFNは低(中間-3.1 eV/原子)で生成エネルギーが予測される非常に多様な結晶をサンプリングできることが示された。
論文 参考訳(メタデータ) (2023-10-07T21:36:55Z) - Crystal Structure Prediction by Joint Equivariant Diffusion [27.52168842448489]
結晶構造予測(CSP)は様々な科学分野において重要である。
本稿では, 安定結晶から構造分布を学習する新しい拡散モデルであるDiffCSPを提案する。
論文 参考訳(メタデータ) (2023-07-30T15:46:33Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。