論文の概要: CrystalFormer-RL: Reinforcement Fine-Tuning for Materials Design
- arxiv url: http://arxiv.org/abs/2504.02367v1
- Date: Thu, 03 Apr 2025 07:59:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-04 19:36:01.723789
- Title: CrystalFormer-RL: Reinforcement Fine-Tuning for Materials Design
- Title(参考訳): CrystalFormer-RL:材料設計のための強化微細調整
- Authors: Zhendong Cao, Lei Wang,
- Abstract要約: 自己回帰変換器を用いた材料生成モデルCrystalFormerへの強化微細調整の適用について検討する。
報酬信号の最適化により、微調整は識別モデルからの知識を生成モデルに注入する。
生成したモデルであるCrystalFormer-RLは、生成した結晶の安定性を向上し、望ましいが矛盾する材料特性を持つ結晶の発見に成功した。
- 参考スコア(独自算出の注目度): 2.290956583394892
- License:
- Abstract: Reinforcement fine-tuning has instrumental enhanced the instruction-following and reasoning abilities of large language models. In this work, we explore the applications of reinforcement fine-tuning to the autoregressive transformer-based materials generative model CrystalFormer (arXiv:2403.15734) using discriminative machine learning models such as interatomic potentials and property prediction models. By optimizing reward signals-such as energy above the convex hull and material property figures of merit-reinforcement fine-tuning infuses knowledge from discriminative models into generative models. The resulting model, CrystalFormer-RL, shows enhanced stability in generated crystals and successfully discovers crystals with desirable yet conflicting material properties, such as substantial dielectric constant and band gap simultaneously. Notably, we observe that reinforcement fine-tuning enables not only the property-guided novel material design ability of generative pre-trained model but also unlocks property-driven material retrieval from the unsupervised pre-training dataset. Leveraging rewards from discriminative models to fine-tune materials generative models opens an exciting gateway to the synergies of the machine learning ecosystem for materials.
- Abstract(参考訳): 強化微調整は、大規模言語モデルの指示追従能力と推論能力を強化した。
本研究では,自己回帰変換器を用いた材料生成モデルCrystalFormer(arXiv:2403.15734)への強化微調整の適用について,原子間ポテンシャルや特性予測モデルなどの識別機械学習モデルを用いて検討する。
凸船体上のエネルギーなどの報酬信号を最適化し、有益強化の材料特性の数値を最適化することにより、識別モデルからの知識を生成モデルに注入する。
生成したモデルであるCrystalFormer-RLは、生成した結晶の安定性を向上し、大きな誘電率定数やバンドギャップといった望ましい材料特性を持つ結晶を同時に発見することに成功した。
特に、強化微調整は、生成事前学習モデルのプロパティ誘導された新規材料設計能力だけでなく、教師なし事前学習データセットからプロパティ駆動型物質検索を解き放つことを観察する。
識別モデルから微調整材料生成モデルへの報酬を活用することで、材料のための機械学習エコシステムのシナジーに対するエキサイティングなゲートウェイが開かれる。
関連論文リスト
- On the Robustness of Machine Learning Models in Predicting Thermodynamic Properties: a Case of Searching for New Quasicrystal Approximants [0.0]
この研究では、準結晶データセットのネストした金属間近似を合成し、それらの上で様々な機械学習モデルを訓練した。
我々の質的かつより重要なことは、予測の違いを定量的に評価することで、トレーニングサンプルの異なる合理的な変化が、予測される新しい物質の全く異なるセットにつながることを明らかに示しています。
また,プレトレーニングの利点を示し,安定度を高めるためのシーケンシャルトレーニングの簡易かつ効果的な手法を提案した。
論文 参考訳(メタデータ) (2024-10-02T12:54:21Z) - Generative Inverse Design of Crystal Structures via Diffusion Models with Transformers [1.2289361708127877]
有望な性質を持つ新しい無機材料は、科学的にも工業的にも重要な課題である。
有望な性質を持つ新しい無機材料の発見は、科学的にも工業的にも重要な課題である。
そこで本研究では,トランスフォーマーアーキテクチャに基づくバックボーンを用いた,結晶構造の生成的逆設計のための新しいタイプの拡散モデルについて検討する。
論文 参考訳(メタデータ) (2024-06-13T16:03:15Z) - Fine-Tuned Language Models Generate Stable Inorganic Materials as Text [57.01994216693825]
テキストエンコードされた原子構造データに基づく微調整された大規模言語モデルは、実装が簡単で信頼性が高い。
我々の最強モデルは、CDVAEの約2倍の速度で準安定であると予測された物質を生成することができる。
テキストプロンプト固有の柔軟性のため、我々のモデルは安定物質を無条件に生成するために同時に使用することができる。
論文 参考訳(メタデータ) (2024-02-06T20:35:28Z) - Scalable Diffusion for Materials Generation [99.71001883652211]
我々は任意の結晶構造(ユニマット)を表現できる統一された結晶表現を開発する。
UniMatはより大型で複雑な化学系から高忠実度結晶構造を生成することができる。
材料の生成モデルを評価するための追加指標を提案する。
論文 参考訳(メタデータ) (2023-10-18T15:49:39Z) - Data-Driven Score-Based Models for Generating Stable Structures with
Adaptive Crystal Cells [1.515687944002438]
本研究は, 化学安定性や化学組成など, 新しい結晶構造を創出することを目的としている。
提案手法の新規性は、結晶細胞の格子が固定されていないという事実にある。
対称性の制約を尊重し、計算上の優位性をもたらす多グラフ結晶表現が導入された。
論文 参考訳(メタデータ) (2023-10-16T02:53:24Z) - On the Stability of Iterative Retraining of Generative Models on their own Data [56.153542044045224]
混合データセットに対する生成モデルの訓練が与える影響について検討する。
まず、初期生成モデルがデータ分布を十分に近似する条件下で反復学習の安定性を実証する。
我々は、正規化フローと最先端拡散モデルを繰り返し訓練することにより、合成画像と自然画像の両方に関する我々の理論を実証的に検証する。
論文 参考訳(メタデータ) (2023-09-30T16:41:04Z) - Evaluating the diversity and utility of materials proposed by generative
models [38.85523285991743]
本稿では, 逆設計プロセスの一部として, 物理誘導結晶生成モデルという, 最先端の生成モデルを用いる方法を示す。
本研究は, 逆設計を改善するために, 生成モデルをどのように改善するかを示唆する。
論文 参考訳(メタデータ) (2023-08-09T14:42:08Z) - Your Autoregressive Generative Model Can be Better If You Treat It as an
Energy-Based One [83.5162421521224]
本稿では,自己回帰生成モデルの学習のための独自のE-ARM法を提案する。
E-ARMは、よく設計されたエネルギーベースの学習目標を活用する。
我々は、E-ARMを効率的に訓練でき、露光バイアス問題を緩和できることを示した。
論文 参考訳(メタデータ) (2022-06-26T10:58:41Z) - How to See Hidden Patterns in Metamaterials with Interpretable Machine
Learning [82.67551367327634]
我々は,材料単位セルのパターンを見つけるための,解釈可能な多分解能機械学習フレームワークを開発した。
具体的には、形状周波数特徴と単位セルテンプレートと呼ばれるメタマテリアルの2つの新しい解釈可能な表現を提案する。
論文 参考訳(メタデータ) (2021-11-10T21:19:02Z) - Physics-Integrated Variational Autoencoders for Robust and Interpretable
Generative Modeling [86.9726984929758]
我々は、不完全物理モデルの深部生成モデルへの統合に焦点を当てる。
本稿では,潜在空間の一部が物理によって基底づけられたVAEアーキテクチャを提案する。
合成および実世界のデータセットの集合に対して生成的性能改善を示す。
論文 参考訳(メタデータ) (2021-02-25T20:28:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。