論文の概要: PLaID++: A Preference Aligned Language Model for Targeted Inorganic Materials Design
- arxiv url: http://arxiv.org/abs/2509.07150v1
- Date: Mon, 08 Sep 2025 18:57:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-10 14:38:27.091272
- Title: PLaID++: A Preference Aligned Language Model for Targeted Inorganic Materials Design
- Title(参考訳): PLaID++: ターゲットとする無機材料設計のための言語モデル
- Authors: Andy Xu, Rohan Desai, Larry Wang, Gabriel Hope, Ethan Ritz,
- Abstract要約: PLaID++(Large Language Model, LLM)は, 安定かつ特性誘導された結晶生成のために微調整された言語モデルである。
Wyckoffベースの新しいテキスト表現を用いてQwen-2.5 7Bを微調整して結晶構造を生成する。
対称性の制約を直接テキストにエンコードすることで、PLaID++は熱力学的に安定で、ユニークで、新規な構造を以前の方法よりも$sim$50%高い速度で生成する。
- 参考スコア(独自算出の注目度): 0.1408690282236036
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discovering novel materials is critical for technological advancements such as solar cells, batteries, and carbon capture. However, the development of new materials is constrained by a slow and expensive trial-and-error process. To accelerate this pipeline, we introduce PLaID++, a Large Language Model (LLM) fine-tuned for stable and property-guided crystal generation. We fine-tune Qwen-2.5 7B to generate crystal structures using a novel Wyckoff-based text representation. We show that generation can be effectively guided with a reinforcement learning technique based on Direct Preference Optimization (DPO), with sampled structures categorized by their stability, novelty, and space group. By encoding symmetry constraints directly into text and guiding model outputs towards desirable chemical space, PLaID++ generates structures that are thermodynamically stable, unique, and novel at a $\sim$50\% greater rate than prior methods and conditionally generates structures with desired space group properties. Our experiments highlight the effectiveness of iterative DPO, achieving $\sim$115\% and $\sim$50\% improvements in unconditional and space group conditioned generation, respectively, compared to fine-tuning alone. Our work demonstrates the potential of adapting post-training techniques from natural language processing to materials design, paving the way for targeted and efficient discovery of novel materials.
- Abstract(参考訳): 新規素材の発見は、太陽電池、電池、炭素捕獲などの技術進歩に不可欠である。
しかし、新しい材料の開発は遅くて高価な試行錯誤プロセスによって制約されている。
このパイプラインを高速化するために、安定かつ特性誘導された結晶生成のために微調整されたLarge Language Model (LLM) であるPLaID++を導入する。
Wyckoffベースの新しいテキスト表現を用いてQwen-2.5 7Bを微調整して結晶構造を生成する。
提案手法は, 直接選好最適化(DPO)に基づく強化学習手法を用いて, その安定性, 新規性, 空間群によって分類されたサンプル構造を効果的に導出できることを示す。
対称性の制約を直接テキストにエンコードし、望ましい化学空間に向けてモデル出力を導くことで、PLaID++は熱力学的に安定で、ユニークで、新規な構造を以前の手法よりも$$$50\%高い速度で生成し、所望の空間群の性質を持つ構造を生成する。
実験では,未条件条件および空間群条件付き生成における$\sim$115\%および$\sim$50\%の改善を,微調整単独に比べ,反復的DPOの有効性を強調した。
本研究は, 自然言語処理から材料設計へのポストトレーニング技術の適用の可能性を示し, 新規素材の標的的かつ効率的な発見への道を開くものである。
関連論文リスト
- AI-Assisted Rapid Crystal Structure Generation Towards a Target Local Environment [5.169292784037981]
局所環境幾何配向結晶発生器(LEGO-xtal)と呼ばれる対称性インフォームドAI生成手法を提案する。
提案手法は、拡張された小さなデータセットに基づいて訓練されたAIモデルを用いて初期構造を生成する。
本研究では,25個の低エネルギーのsp2炭素同素体から1,700個以上の黒鉛の基底状態エネルギー0.5eV/原子に拡張することでLEGO-xtalの有効性を実証した。
論文 参考訳(メタデータ) (2025-06-09T20:47:36Z) - InvDesFlow-AL: Active Learning-based Workflow for Inverse Design of Functional Materials [10.518405572411286]
InvDesFlow-ALという,能動的学習戦略に基づく逆材料設計生成フレームワークを提案する。
InvDesFlow-ALモデルは、既存の生成モデルに比べて32.96%の性能向上を示す0.0423 AA-ALのRMSEを達成する。
InvDesFlow-ALは低エネルギー・低エネルギー材料の設計に成功している。
論文 参考訳(メタデータ) (2025-05-14T07:29:06Z) - Establishing baselines for generative discovery of inorganic crystals [0.0]
生成的人工知能は、材料発見のための有望な道を提供するが、従来の方法に対するその優位性はいまだ不明である。
本研究では、電荷バランスのプロトタイプのランダム列挙と既知の化合物のデータ駆動イオン交換という、2つのベースラインアプローチを導入し、ベンチマークする。
以上の結果から, イオン交換などの確立された手法は, 安定な新規物質を生成できるが, それらの多くはよく知られている化合物とよく似ている。
論文 参考訳(メタデータ) (2025-01-04T00:14:59Z) - Efficient Symmetry-Aware Materials Generation via Hierarchical Generative Flow Networks [52.13486402193811]
新しい固体材料は、結晶構造の広大な空間を急速に探索し、安定した領域を探索する必要がある。
既存の手法では、大きな材料空間を探索し、望ましい特性と要求を持った多様なサンプルを生成するのに苦労している。
本研究では, 材料空間の対称性を効果的に活用し, 所望の特性を持つ結晶構造を生成するために, 階層的探索戦略を用いた新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-11-06T23:53:34Z) - Unleashing the power of novel conditional generative approaches for new materials discovery [3.972733741872872]
結晶構造設計問題に対する2つの生成的アプローチを提案する。
1つは条件付き構造変化であり、最もエネルギー的に好ましい構造と全てのより安定なポリモルフィックの間のエネルギー差を利用する。
もう1つは条件付き構造の生成であり、最もエネルギー的に好ましい構造と、その全てのより安定したポリモルフィックの間のエネルギー差を利用する。
論文 参考訳(メタデータ) (2024-11-05T14:58:31Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - Fine-Tuned Language Models Generate Stable Inorganic Materials as Text [53.81190146434045]
テキストエンコードされた原子構造データに基づく微調整された大規模言語モデルは、実装が簡単で信頼性が高い。
我々の最強モデルは、CDVAEの約2倍の速度で準安定であると予測された物質を生成することができる。
テキストプロンプト固有の柔軟性のため、我々のモデルは安定物質を無条件に生成するために同時に使用することができる。
論文 参考訳(メタデータ) (2024-02-06T20:35:28Z) - Latent Conservative Objective Models for Data-Driven Crystal Structure
Prediction [62.36797874900395]
計算化学において、結晶構造予測は最適化問題である。
この問題に対処する1つのアプローチは、密度汎関数理論(DFT)に基づいてシミュレータを構築し、続いてシミュレーションで探索を実行することである。
我々は,LCOM(最近の保守的客観モデル)と呼ばれる我々の手法が,構造予測の成功率の観点から,最も優れたアプローチと同等に機能することを示す。
論文 参考訳(メタデータ) (2023-10-16T04:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。