論文の概要: PLaID++: A Preference Aligned Language Model for Targeted Inorganic Materials Design
- arxiv url: http://arxiv.org/abs/2509.07150v2
- Date: Fri, 17 Oct 2025 04:59:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 13:49:08.700886
- Title: PLaID++: A Preference Aligned Language Model for Targeted Inorganic Materials Design
- Title(参考訳): PLaID++: ターゲットとする無機材料設計のための言語モデル
- Authors: Andy Xu, Rohan Desai, Larry Wang, Gabriel Hope, Ethan Ritz,
- Abstract要約: 安定かつ特性誘導型結晶生成のためのLLMポストトレーニングであるPLaID++を紹介する。
結晶学的な表現と報酬の定式化にパフォーマンスのヒンジがあることがわかった。
- 参考スコア(独自算出の注目度): 0.1408690282236036
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reinforcement Learning from Verifiable Rewards (RLVR) has emerged as a promising approach to improve correctness in LLMs, however, in many scientific problems, the objective is not necessarily to produce the correct answer, but instead to produce a diverse array of candidates which satisfy a set of constraints. We study this challenge in the context of materials generation. To this end, we introduce PLaID++, an LLM post-trained for stable and property-guided crystal generation. We find that performance hinges on our crystallographic representation and reward formulation. First, we introduce a compact, symmetry-informed Wyckoff text representation which improves computational efficiency and encourages generalization from physical priors. Second, we demonstrate that temperature scaling acts as an entropy regularizer which counteracts mode collapse and encourages exploration. By encoding symmetry constraints directly into text and guiding model outputs towards desirable chemical space, PLaID++ generates structures that are thermodynamically stable, unique, and novel at a $\sim$50\% greater rate than prior methods and conditionally generates structures with desired space group properties. Our work demonstrates the potential of adapting post-training techniques from natural language processing to materials design, paving the way for targeted and efficient discovery of novel materials.
- Abstract(参考訳): Reinforcement Learning from Verifiable Rewards (RLVR) は、LLMの正確性を改善するための有望なアプローチとして登場したが、多くの科学的問題において、その目的は必ずしも正しい答えを生み出すことではなく、一連の制約を満たす多様な候補を生成することである。
我々はこの課題を材料生成の文脈で研究する。
この目的のために、安定かつ特性誘導された結晶生成のためのLLMポストトレーニングであるPLaID++を導入する。
結晶学的な表現と報酬の定式化にパフォーマンスのヒンジがあることがわかった。
まず、計算効率を向上し、物理前の一般化を促進する、コンパクトで対称性に富んだWyckoffテキスト表現を導入する。
第2に, 温度スケーリングはモード崩壊に対処し, 探索を促進するエントロピー正則化器として機能することを示した。
対称性の制約を直接テキストにエンコードし、望ましい化学空間に向けてモデル出力を導くことで、PLaID++は熱力学的に安定で、ユニークで、新規な構造を以前の手法よりも$$$50\%高い速度で生成し、所望の空間群の性質を持つ構造を生成する。
本研究は, 自然言語処理から材料設計へのポストトレーニング技術の適用の可能性を示し, 新規素材の標的的かつ効率的な発見への道を開くものである。
関連論文リスト
- LLM-Based Scientific Equation Discovery via Physics-Informed Token-Regularized Policy Optimization [32.24464649397858]
PiT-POは、Large Language Modelsを強化学習を通じて適応ジェネレータに進化させる統一フレームワークである。
PiT-POの中心は、2重拘束機構であり、冗長構造を抑えるために微細でトークンレベルのペナルティを同時に適用しながら、階層的な物理的妥当性を厳格に強制する。
実証的に、PiT-POは標準ベンチマークで最先端のパフォーマンスを達成し、流体力学問題に挑戦する新しい乱流モデルを発見することに成功した。
論文 参考訳(メタデータ) (2026-02-11T07:02:23Z) - Flow Density Control: Generative Optimization Beyond Entropy-Regularized Fine-Tuning [59.11663802446183]
フローおよび拡散生成モデルは、事前情報を保持しながらタスク固有の目的を最適化するために適応することができる。
本研究では,フロー密度制御(FDC)を導入し,複雑な問題をより単純な微調整タスクの特定のシーケンスに還元する。
我々は,近年のミラーフローの理解を活用して,現実的な仮定の下で提案されたスキームの収束保証を導出する。
論文 参考訳(メタデータ) (2025-11-27T17:19:01Z) - CLOUD: A Scalable and Physics-Informed Foundation Model for Crystal Representation Learning [0.0]
CLOUD(Crystal Language mOdel for Unified and Differentiable Materials Modeling)は,新しいSCOPE(Symmetry-Consistent SCOPE)をトレーニングしたトランスフォーマーベースのフレームワークである。
CLOUDは600万以上の結晶構造で事前訓練されており、幅広い材料特性を予測する上での競争性能を達成する。
異種材料モデリングの概念の証明として, フォノン内部エネルギーと熱容量の予測にCLOUDを適用した。
論文 参考訳(メタデータ) (2025-06-19T15:45:24Z) - AI-Assisted Rapid Crystal Structure Generation Towards a Target Local Environment [5.169292784037981]
局所環境幾何配向結晶発生器(LEGO-xtal)と呼ばれる対称性インフォームドAI生成手法を提案する。
提案手法は、拡張された小さなデータセットに基づいて訓練されたAIモデルを用いて初期構造を生成する。
本研究では,25個の低エネルギーのsp2炭素同素体から1,700個以上の黒鉛の基底状態エネルギー0.5eV/原子に拡張することでLEGO-xtalの有効性を実証した。
論文 参考訳(メタデータ) (2025-06-09T20:47:36Z) - Reparameterized LLM Training via Orthogonal Equivalence Transformation [54.80172809738605]
直交同値変換を用いてニューロンを最適化する新しいトレーニングアルゴリズムPOETを提案する。
POETは、目的関数を安定して最適化し、一般化を改善する。
我々は、大規模ニューラルネットワークのトレーニングにおいて、POETを柔軟かつスケーラブルにするための効率的な近似を開発する。
論文 参考訳(メタデータ) (2025-06-09T17:59:34Z) - InvDesFlow-AL: Active Learning-based Workflow for Inverse Design of Functional Materials [10.518405572411286]
InvDesFlow-ALという,能動的学習戦略に基づく逆材料設計生成フレームワークを提案する。
InvDesFlow-ALモデルは、既存の生成モデルに比べて32.96%の性能向上を示す0.0423 AA-ALのRMSEを達成する。
InvDesFlow-ALは低エネルギー・低エネルギー材料の設計に成功している。
論文 参考訳(メタデータ) (2025-05-14T07:29:06Z) - Penrose Tiled Low-Rank Compression and Section-Wise Q&A Fine-Tuning: A General Framework for Domain-Specific Large Language Model Adaptation [7.161207910629032]
大規模言語モデル(LLM)は、材料科学のような専門的な科学分野に対して大きな約束を持っている。
本稿では,この課題に対処するために,構造化モデル圧縮と科学的微調整システムを組み合わせた2段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-28T01:33:05Z) - Al-Khwarizmi: Discovering Physical Laws with Foundation Models [6.07593567400172]
データから物理法則を推定することは、科学と工学の重要な課題である。
この研究は、データから物理法を発見するための新しいエージェントフレームワークであるAl-Khwarizmiを紹介している。
論文 参考訳(メタデータ) (2025-02-03T09:54:00Z) - Establishing baselines for generative discovery of inorganic crystals [0.0]
生成的人工知能は、材料発見のための有望な道を提供するが、従来の方法に対するその優位性はいまだ不明である。
本研究では、電荷バランスのプロトタイプのランダム列挙と既知の化合物のデータ駆動イオン交換という、2つのベースラインアプローチを導入し、ベンチマークする。
以上の結果から, イオン交換などの確立された手法は, 安定な新規物質を生成できるが, それらの多くはよく知られている化合物とよく似ている。
論文 参考訳(メタデータ) (2025-01-04T00:14:59Z) - Self-Improvement in Language Models: The Sharpening Mechanism [70.9248553790022]
我々は、レンズを通して自己改善の能力について、新たな視点を提供する。
言語モデルは、正しい応答を生成する場合よりも、応答品質の検証が優れているという観察に感銘を受けて、後学習において、モデル自体を検証対象として、自己改善を形式化する。
SFTとRLHFに基づく自己改善アルゴリズムの2つの自然ファミリーを解析する。
論文 参考訳(メタデータ) (2024-12-02T20:24:17Z) - Efficient Symmetry-Aware Materials Generation via Hierarchical Generative Flow Networks [52.13486402193811]
新しい固体材料は、結晶構造の広大な空間を急速に探索し、安定した領域を探索する必要がある。
既存の手法では、大きな材料空間を探索し、望ましい特性と要求を持った多様なサンプルを生成するのに苦労している。
本研究では, 材料空間の対称性を効果的に活用し, 所望の特性を持つ結晶構造を生成するために, 階層的探索戦略を用いた新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-11-06T23:53:34Z) - Unleashing the power of novel conditional generative approaches for new materials discovery [3.972733741872872]
結晶構造設計問題に対する2つの生成的アプローチを提案する。
1つは条件付き構造変化であり、最もエネルギー的に好ましい構造と全てのより安定なポリモルフィックの間のエネルギー差を利用する。
もう1つは条件付き構造の生成であり、最もエネルギー的に好ましい構造と、その全てのより安定したポリモルフィックの間のエネルギー差を利用する。
論文 参考訳(メタデータ) (2024-11-05T14:58:31Z) - In-context Demonstration Matters: On Prompt Optimization for Pseudo-Supervision Refinement [71.60563181678323]
大規模言語モデル(LLM)は様々なタスクで大きな成功を収めており、生成品質をさらに向上させるためには微調整が必要である場合もある。
これらの課題に対処する直接的な解決策は、教師なしの下流タスクから高信頼のデータを生成することである。
本稿では,プロンプトと全体的な擬似スーパービジョンを両立させる新しい手法,擬似教師付きデモアライメント・アライメント・アライメント・プロンプト・最適化(PAPO)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-04T03:39:28Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [67.1393112206885]
大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。
本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。
我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文 参考訳(メタデータ) (2024-02-09T07:45:26Z) - Fine-Tuned Language Models Generate Stable Inorganic Materials as Text [53.81190146434045]
テキストエンコードされた原子構造データに基づく微調整された大規模言語モデルは、実装が簡単で信頼性が高い。
我々の最強モデルは、CDVAEの約2倍の速度で準安定であると予測された物質を生成することができる。
テキストプロンプト固有の柔軟性のため、我々のモデルは安定物質を無条件に生成するために同時に使用することができる。
論文 参考訳(メタデータ) (2024-02-06T20:35:28Z) - Latent Conservative Objective Models for Data-Driven Crystal Structure
Prediction [62.36797874900395]
計算化学において、結晶構造予測は最適化問題である。
この問題に対処する1つのアプローチは、密度汎関数理論(DFT)に基づいてシミュレータを構築し、続いてシミュレーションで探索を実行することである。
我々は,LCOM(最近の保守的客観モデル)と呼ばれる我々の手法が,構造予測の成功率の観点から,最も優れたアプローチと同等に機能することを示す。
論文 参考訳(メタデータ) (2023-10-16T04:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。