論文の概要: PLaID++: A Preference Aligned Language Model for Targeted Inorganic Materials Design
- arxiv url: http://arxiv.org/abs/2509.07150v2
- Date: Fri, 17 Oct 2025 04:59:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 13:49:08.700886
- Title: PLaID++: A Preference Aligned Language Model for Targeted Inorganic Materials Design
- Title(参考訳): PLaID++: ターゲットとする無機材料設計のための言語モデル
- Authors: Andy Xu, Rohan Desai, Larry Wang, Gabriel Hope, Ethan Ritz,
- Abstract要約: 安定かつ特性誘導型結晶生成のためのLLMポストトレーニングであるPLaID++を紹介する。
結晶学的な表現と報酬の定式化にパフォーマンスのヒンジがあることがわかった。
- 参考スコア(独自算出の注目度): 0.1408690282236036
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reinforcement Learning from Verifiable Rewards (RLVR) has emerged as a promising approach to improve correctness in LLMs, however, in many scientific problems, the objective is not necessarily to produce the correct answer, but instead to produce a diverse array of candidates which satisfy a set of constraints. We study this challenge in the context of materials generation. To this end, we introduce PLaID++, an LLM post-trained for stable and property-guided crystal generation. We find that performance hinges on our crystallographic representation and reward formulation. First, we introduce a compact, symmetry-informed Wyckoff text representation which improves computational efficiency and encourages generalization from physical priors. Second, we demonstrate that temperature scaling acts as an entropy regularizer which counteracts mode collapse and encourages exploration. By encoding symmetry constraints directly into text and guiding model outputs towards desirable chemical space, PLaID++ generates structures that are thermodynamically stable, unique, and novel at a $\sim$50\% greater rate than prior methods and conditionally generates structures with desired space group properties. Our work demonstrates the potential of adapting post-training techniques from natural language processing to materials design, paving the way for targeted and efficient discovery of novel materials.
- Abstract(参考訳): Reinforcement Learning from Verifiable Rewards (RLVR) は、LLMの正確性を改善するための有望なアプローチとして登場したが、多くの科学的問題において、その目的は必ずしも正しい答えを生み出すことではなく、一連の制約を満たす多様な候補を生成することである。
我々はこの課題を材料生成の文脈で研究する。
この目的のために、安定かつ特性誘導された結晶生成のためのLLMポストトレーニングであるPLaID++を導入する。
結晶学的な表現と報酬の定式化にパフォーマンスのヒンジがあることがわかった。
まず、計算効率を向上し、物理前の一般化を促進する、コンパクトで対称性に富んだWyckoffテキスト表現を導入する。
第2に, 温度スケーリングはモード崩壊に対処し, 探索を促進するエントロピー正則化器として機能することを示した。
対称性の制約を直接テキストにエンコードし、望ましい化学空間に向けてモデル出力を導くことで、PLaID++は熱力学的に安定で、ユニークで、新規な構造を以前の手法よりも$$$50\%高い速度で生成し、所望の空間群の性質を持つ構造を生成する。
本研究は, 自然言語処理から材料設計へのポストトレーニング技術の適用の可能性を示し, 新規素材の標的的かつ効率的な発見への道を開くものである。
関連論文リスト
- AI-Assisted Rapid Crystal Structure Generation Towards a Target Local Environment [5.169292784037981]
局所環境幾何配向結晶発生器(LEGO-xtal)と呼ばれる対称性インフォームドAI生成手法を提案する。
提案手法は、拡張された小さなデータセットに基づいて訓練されたAIモデルを用いて初期構造を生成する。
本研究では,25個の低エネルギーのsp2炭素同素体から1,700個以上の黒鉛の基底状態エネルギー0.5eV/原子に拡張することでLEGO-xtalの有効性を実証した。
論文 参考訳(メタデータ) (2025-06-09T20:47:36Z) - InvDesFlow-AL: Active Learning-based Workflow for Inverse Design of Functional Materials [10.518405572411286]
InvDesFlow-ALという,能動的学習戦略に基づく逆材料設計生成フレームワークを提案する。
InvDesFlow-ALモデルは、既存の生成モデルに比べて32.96%の性能向上を示す0.0423 AA-ALのRMSEを達成する。
InvDesFlow-ALは低エネルギー・低エネルギー材料の設計に成功している。
論文 参考訳(メタデータ) (2025-05-14T07:29:06Z) - Establishing baselines for generative discovery of inorganic crystals [0.0]
生成的人工知能は、材料発見のための有望な道を提供するが、従来の方法に対するその優位性はいまだ不明である。
本研究では、電荷バランスのプロトタイプのランダム列挙と既知の化合物のデータ駆動イオン交換という、2つのベースラインアプローチを導入し、ベンチマークする。
以上の結果から, イオン交換などの確立された手法は, 安定な新規物質を生成できるが, それらの多くはよく知られている化合物とよく似ている。
論文 参考訳(メタデータ) (2025-01-04T00:14:59Z) - Efficient Symmetry-Aware Materials Generation via Hierarchical Generative Flow Networks [52.13486402193811]
新しい固体材料は、結晶構造の広大な空間を急速に探索し、安定した領域を探索する必要がある。
既存の手法では、大きな材料空間を探索し、望ましい特性と要求を持った多様なサンプルを生成するのに苦労している。
本研究では, 材料空間の対称性を効果的に活用し, 所望の特性を持つ結晶構造を生成するために, 階層的探索戦略を用いた新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-11-06T23:53:34Z) - Unleashing the power of novel conditional generative approaches for new materials discovery [3.972733741872872]
結晶構造設計問題に対する2つの生成的アプローチを提案する。
1つは条件付き構造変化であり、最もエネルギー的に好ましい構造と全てのより安定なポリモルフィックの間のエネルギー差を利用する。
もう1つは条件付き構造の生成であり、最もエネルギー的に好ましい構造と、その全てのより安定したポリモルフィックの間のエネルギー差を利用する。
論文 参考訳(メタデータ) (2024-11-05T14:58:31Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - Fine-Tuned Language Models Generate Stable Inorganic Materials as Text [53.81190146434045]
テキストエンコードされた原子構造データに基づく微調整された大規模言語モデルは、実装が簡単で信頼性が高い。
我々の最強モデルは、CDVAEの約2倍の速度で準安定であると予測された物質を生成することができる。
テキストプロンプト固有の柔軟性のため、我々のモデルは安定物質を無条件に生成するために同時に使用することができる。
論文 参考訳(メタデータ) (2024-02-06T20:35:28Z) - Latent Conservative Objective Models for Data-Driven Crystal Structure
Prediction [62.36797874900395]
計算化学において、結晶構造予測は最適化問題である。
この問題に対処する1つのアプローチは、密度汎関数理論(DFT)に基づいてシミュレータを構築し、続いてシミュレーションで探索を実行することである。
我々は,LCOM(最近の保守的客観モデル)と呼ばれる我々の手法が,構造予測の成功率の観点から,最も優れたアプローチと同等に機能することを示す。
論文 参考訳(メタデータ) (2023-10-16T04:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。