論文の概要: CLOUD: A Scalable and Physics-Informed Foundation Model for Crystal Representation Learning
- arxiv url: http://arxiv.org/abs/2506.17345v1
- Date: Thu, 19 Jun 2025 15:45:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.366342
- Title: CLOUD: A Scalable and Physics-Informed Foundation Model for Crystal Representation Learning
- Title(参考訳): CLOUD: 結晶表現学習のための拡張性と物理インフォームド基礎モデル
- Authors: Changwen Xu, Shang Zhu, Venkatasubramanian Viswanathan,
- Abstract要約: CLOUD(Crystal Language mOdel for Unified and Differentiable Materials Modeling)は,新しいSCOPE(Symmetry-Consistent SCOPE)をトレーニングしたトランスフォーマーベースのフレームワークである。
CLOUDは600万以上の結晶構造で事前訓練されており、幅広い材料特性を予測する上での競争性能を達成する。
異種材料モデリングの概念の証明として, フォノン内部エネルギーと熱容量の予測にCLOUDを適用した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The prediction of crystal properties is essential for understanding structure-property relationships and accelerating the discovery of functional materials. However, conventional approaches relying on experimental measurements or density functional theory (DFT) calculations are often resource-intensive, limiting their scalability. Machine learning (ML) models offer a promising alternative by learning complex structure-property relationships from data, enabling faster predictions. Yet, existing ML models often rely on labeled data, adopt representations that poorly capture essential structural characteristics, and lack integration with physical principles--factors that limit their generalizability and interpretability. Here, we introduce CLOUD (Crystal Language mOdel for Unified and Differentiable materials modeling), a transformer-based framework trained on a novel Symmetry-Consistent Ordered Parameter Encoding (SCOPE) that encodes crystal symmetry, Wyckoff positions, and composition in a compact, coordinate-free string representation. Pre-trained on over six million crystal structures, CLOUD is fine-tuned on multiple downstream tasks and achieves competitive performance in predicting a wide range of material properties, demonstrating strong scaling performance. Furthermore, as proof of concept of differentiable materials modeling, CLOUD is applied to predict the phonon internal energy and heat capacity, which integrates the Debye model to preserve thermodynamic consistency. The CLOUD-DEBYE framework enforces thermodynamic consistency and enables temperature-dependent property prediction without requiring additional data. These results demonstrate the potential of CLOUD as a scalable and physics-informed foundation model for crystalline materials, unifying symmetry-consistent representations with physically grounded learning for property prediction and materials discovery.
- Abstract(参考訳): 結晶特性の予測は、構造-物性関係を理解し、機能性物質の発見を加速するために不可欠である。
しかしながら、実験的な測定や密度汎関数理論(DFT)の計算に依存する従来の手法は、しばしば資源集約であり、スケーラビリティを制限している。
機械学習(ML)モデルは、データから複雑な構造-プロパティ関係を学習することで、より高速な予測を可能にする、有望な代替手段を提供する。
しかし、既存のMLモデルは、しばしばラベル付きデータに頼り、重要な構造的特徴を十分に捉えていない表現を採用し、それらの一般化可能性と解釈可能性を制限する物理原理との統合を欠いている。
本稿では,CLOUD(Crystal Language mOdel for Unified and Differentiable Materials Modeling, CLOUD)について紹介する。
CLOUDは600万以上の結晶構造に基づいて事前訓練され、複数の下流タスクに微調整され、幅広い材料特性を予測し、高いスケーリング性能を示す。
さらに、微分可能な材料モデリングの概念の証明として、CLOUDを用いて、熱力学的一貫性を維持するためにデバイモデルを統合したフォノン内部エネルギーと熱容量を予測する。
CLOUD-DEBYEフレームワークは熱力学的一貫性を強制し、追加データを必要としない温度依存特性予測を可能にする。
これらの結果は、CLOUDが結晶材料の拡張性および物理インフォームド基礎モデルとしての可能性を示し、物性予測と材料発見のための物理基底学習による対称性を持つ表現を統一する。
関連論文リスト
- Explainable Prediction of the Mechanical Properties of Composites with CNNs [11.662972025976192]
説明可能なAI(XAI)の手法を備えた畳み込みニューラルネットワーク(CNN)が,この問題の解決に有効であることを示す。
提案手法では, 逆張力試験を用いて生成したデータセットに基づいて学習したカスタムCNNを用いて, コンポジットの機械的特性を予測する。
次に、SHAPと統合勾配の2つのポストホックXAI法を用いて予測を説明し、CNNが合成体の挙動に影響を与える重要な幾何学的特徴を用いていることを示す。
論文 参考訳(メタデータ) (2025-05-20T08:54:06Z) - Causal Discovery from Data Assisted by Large Language Models [50.193740129296245]
知識駆動発見のために、実験データと事前のドメイン知識を統合することが不可欠である。
本稿では、高分解能走査透過電子顕微鏡(STEM)データと大規模言語モデル(LLM)からの洞察を組み合わせることで、このアプローチを実証する。
SmドープBiFeO3(SmBFO)におけるChatGPTをドメイン固有文献に微調整することにより、構造的、化学的、分極的自由度の間の因果関係をマッピングするDAG(Directed Acyclic Graphs)の隣接行列を構築する。
論文 参考訳(メタデータ) (2025-03-18T02:14:49Z) - Fine-Tuned Language Models Generate Stable Inorganic Materials as Text [57.01994216693825]
テキストエンコードされた原子構造データに基づく微調整された大規模言語モデルは、実装が簡単で信頼性が高い。
我々の最強モデルは、CDVAEの約2倍の速度で準安定であると予測された物質を生成することができる。
テキストプロンプト固有の柔軟性のため、我々のモデルは安定物質を無条件に生成するために同時に使用することができる。
論文 参考訳(メタデータ) (2024-02-06T20:35:28Z) - Scalable Diffusion for Materials Generation [99.71001883652211]
我々は任意の結晶構造(ユニマット)を表現できる統一された結晶表現を開発する。
UniMatはより大型で複雑な化学系から高忠実度結晶構造を生成することができる。
材料の生成モデルを評価するための追加指標を提案する。
論文 参考訳(メタデータ) (2023-10-18T15:49:39Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Thermodynamics-based Artificial Neural Networks (TANN) for multiscale
modeling of materials with inelastic microstructure [0.0]
マルチスケールの均質化手法は、非弾性材料のマクロ力学的挙動の信頼性と正確な予測を行うためにしばしば用いられる。
ディープラーニングに基づくデータ駆動型アプローチは、アドホックな法則や高速な数値手法に代わる、有望な代替手段として台頭している。
本稿では,非弾性・複雑な構造を持つ機械材料のモデリングのための熱力学に基づくニューラルネットワーク(TANN)を提案する。
論文 参考訳(メタデータ) (2021-08-30T11:50:38Z) - ICE-BeeM: Identifiable Conditional Energy-Based Deep Models Based on
Nonlinear ICA [11.919315372249802]
確率モデルの同定可能性理論を考察する。
我々は,独立に修飾されたコンポーネント分析の枠組みにおけるコンポーネントの推定に,我々のモデルを利用できることを示す。
論文 参考訳(メタデータ) (2020-02-26T14:43:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。