論文の概要: Preference Learning from Physics-Based Feedback: Tuning Language Models to Design BCC/B2 Superalloys
- arxiv url: http://arxiv.org/abs/2511.12036v1
- Date: Sat, 15 Nov 2025 05:08:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.524061
- Title: Preference Learning from Physics-Based Feedback: Tuning Language Models to Design BCC/B2 Superalloys
- Title(参考訳): 物理に基づくフィードバックからの優先学習:BCC/B2超合金設計のための言語モデルのチューニング
- Authors: Satanu Ghosh, Collin Holgate, Neal R. Brodnik, Doug Downey, Samantha Daly, Tresa M. Pollock, Samuel Carton,
- Abstract要約: 新規構造合金の言語モデル誘導設計作業に好み学習を適用した。
安定な無機結晶を創出することに焦点を当てた以前の研究とは対照的に,本手法は特定のクラスBCC/B2超合金を合成可能である。
- 参考スコア(独自算出の注目度): 12.570983140888627
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We apply preference learning to the task of language model-guided design of novel structural alloys. In contrast to prior work that focuses on generating stable inorganic crystals, our approach targets the synthesizeability of a specific structural class: BCC/B2 superalloys, an underexplored family of materials with potential applications in extreme environments. Using three open-weight models (LLaMA-3.1, Gemma-2, and OLMo-2), we demonstrate that language models can be optimized for multiple design objectives using a single, unified reward signal through Direct Preference Optimization (DPO). Unlike prior approaches that rely on heuristic or human-in-the-loop feedback (costly), our reward signal is derived from thermodynamic phase calculations, offering a scientifically grounded criterion for model tuning. To our knowledge, this is the first demonstration of preference-tuning a language model using physics-grounded feedback for structural alloy design. The resulting framework is general and extensible, providing a path forward for intelligent design-space exploration across a range of physical science domains.
- Abstract(参考訳): 新規構造合金の言語モデル誘導設計作業に好み学習を適用した。
安定な無機結晶を創出することに焦点を当てた以前の研究とは対照的に,本手法は特定の構造クラスの合成性,BCC/B2スーパーアロイを目標としている。
3つのオープンウェイトモデル (LLaMA-3.1, Gemma-2, OLMo-2) を用いて, 言語モデルが直接選好最適化 (DPO) による単一の統一報酬信号を用いて, 複数の設計目標に対して最適化可能であることを示す。
ヒューリスティック(ヒューリスティック)やヒューマン・イン・ザ・ループ(Human-in-the-loop)のフィードバックに依存する従来のアプローチとは異なり、報酬信号は熱力学的位相計算から導き出され、モデルチューニングのための科学的根拠付き基準を提供する。
我々の知る限り、これは構造合金設計のための物理基底フィードバックを用いた言語モデルの嗜好調整の初めての実演である。
結果として得られるフレームワークは汎用的で拡張可能であり、さまざまな物理科学領域を横断するインテリジェントなデザイン空間探索の道筋を提供する。
関連論文リスト
- MOFGPT: Generative Design of Metal-Organic Frameworks using Language Models [5.417632175667162]
応用固有の性質を持つ金属有機フレームワーク(MOF)は、材料化学における中心的な課題である。
我々はMOFのデノボ設計のための強化学習型トランスフォーマーベースのフレームワークを提案する。
特性フィードバックをシーケンス生成に統合することにより、このモデルを合成可能でトポロジカルに有効なMOFに向けて駆動する。
論文 参考訳(メタデータ) (2025-05-30T20:09:11Z) - A Survey of Model Architectures in Information Retrieval [59.61734783818073]
2019年から現在までの期間は、情報検索(IR)と自然言語処理(NLP)における最大のパラダイムシフトの1つとなっている。
従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。
今後の課題と今後の方向性について、先見的な議論で締めくくります。
論文 参考訳(メタデータ) (2025-02-20T18:42:58Z) - AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO [0.0]
大きな言語モデル(LLM)は、言語処理において印象的な能力を示してきたが、視覚的な空間的推論を必要とするタスクにしばしば苦労している。
迷路ナビゲーションのための視覚的推論能力を備えた標準LLMの2段階学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-20T16:05:18Z) - Physics Instrument Design with Reinforcement Learning [0.0]
本稿では、勾配に基づく楽器最適化法に代わる物理機器の設計に強化学習(Reinforcement Learning, RL)を用いる場合について述べる。
論文 参考訳(メタデータ) (2024-12-13T16:08:28Z) - Cliqueformer: Model-Based Optimization with Structured Transformers [102.55764949282906]
大規模なニューラルネットワークは予測タスクに優れるが、タンパク質工学や材料発見といった設計問題への応用には、オフラインモデルベース最適化(MBO)の問題を解決する必要がある。
機能的グラフィカルモデル(FGM)を用いてブラックボックス関数の構造を学習するトランスフォーマーベースのアーキテクチャであるCliqueformerを提案する。
化学および遺伝子設計タスクを含む様々な領域において、Cliqueformerは既存の方法よりも優れた性能を示している。
論文 参考訳(メタデータ) (2024-10-17T00:35:47Z) - Fine-tuning large language models for domain adaptation: Exploration of training strategies, scaling, model merging and synergistic capabilities [4.389938747401259]
本研究は、材料科学や工学などの分野における大規模言語モデル(LLM)に対する微調整戦略の効果について考察する。
複数の微調整モデルの融合は、親モデルの個々の貢献を超越した能力の出現につながる可能性がある。
論文 参考訳(メタデータ) (2024-09-05T11:49:53Z) - Large Language Model Agent as a Mechanical Designer [7.136205674624813]
本研究では、FEMモジュールと協調して事前訓練された大規模言語モデル(LLM)を利用して、構造設計を自律的に生成、評価、洗練するフレームワークを提案する。
LLMはドメイン固有の微調整なしで動作し、設計候補を提案し、FEMから派生した性能指標を解釈し、構造的な音響修正を適用する。
NSGA-II (Non-Sorting Genetic Algorithm II) と比較して,本手法はより高速に収束し,より少ないFEM評価を実現する。
論文 参考訳(メタデータ) (2024-04-26T16:41:24Z) - Design Space Exploration and Explanation via Conditional Variational
Autoencoders in Meta-model-based Conceptual Design of Pedestrian Bridges [52.77024349608834]
本稿では,条件付き変分オートエンコーダ(CVAE)による人間設計者向上のための性能駆動型設計探索フレームワークを提案する。
CVAEはスイスの歩行者橋の合成例18万件で訓練されている。
論文 参考訳(メタデータ) (2022-11-29T17:28:31Z) - Language Models are General-Purpose Interfaces [109.45478241369655]
本稿では,様々な基礎モデルに対する汎用インタフェースとして言語モデルを提案する。
事前訓練されたエンコーダのコレクションは、様々なモダリティ(ビジョンや言語など)を知覚する
インタフェースとモジュールエンコーダを協調的に事前学習するための半因果言語モデリング手法を提案する。
論文 参考訳(メタデータ) (2022-06-13T17:34:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。