論文の概要: Lang2Str: Two-Stage Crystal Structure Generation with LLMs and Continuous Flow Models
- arxiv url: http://arxiv.org/abs/2603.03946v1
- Date: Wed, 04 Mar 2026 11:14:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.278354
- Title: Lang2Str: Two-Stage Crystal Structure Generation with LLMs and Continuous Flow Models
- Title(参考訳): Lang2Str: LLMと連続流れモデルによる2段階結晶構造生成
- Authors: Cong Liu, Chengyue Gong, Zhenyu Liu, Jiale Zhao, Yuxuan Zhang,
- Abstract要約: フレキシブルかつ高精度な材料生成のための2段階生成フレームワークであるLang2Strを提案する。
本手法は, 生成過程を条件付き生成タスクとみなす。
本手法は,テクスタイブ初期材料生成および結晶構造予測タスクにおける競合性能を実現する。
- 参考スコア(独自算出の注目度): 22.830348732529334
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative models hold great promise for accelerating material discovery but are often limited by their inflexible single-stage generative process in designing valid and diverse materials. To address this, we propose a two-stage generative framework, Lang2Str, that combines the strengths of large language models (LLMs) and flow-based models for flexible and precise material generation. Our method frames the generative process as a conditional generative task, where an LLM provides high-level conditions by generating descriptions of material unit cells' geometric layouts and properties. These descriptions, informed by the LLM's extensive background knowledge, ensure reasonable structure designs. A conditioned flow model then decodes these textual conditions into precise continuous coordinates and unit cell parameters. This staged approach combines the structured reasoning of LLMs and the distribution modeling capabilities of flow models. Experimental results show that our method achieves competitive performance on \textit{ab initio} material generation and crystal structure prediction tasks, with generated structures exhibiting closer alignment to ground truth in both geometry and energy levels, surpassing state-of-the-art models. The flexibility and modularity of our framework further enable fine-grained control over the generation process, potentially leading to more efficient and customizable material design.
- Abstract(参考訳): 生成モデルは、材料発見を加速する大きな約束を持っているが、有効で多様な材料を設計する際の、柔軟な単段階生成プロセスによって制限されることが多い。
そこで本稿では,大規模言語モデル(LLM)とフローベースモデルを組み合わせた2段階生成フレームワークであるLang2Strを提案する。
本手法は,LLMが物質単位セルの幾何学的レイアウトと特性を記述して高次条件を提供する条件生成タスクとして生成過程をモデル化する。
これらの記述は、LLMの豊富な背景知識によって知らされ、合理的な構造設計を保証する。
条件付きフローモデルは、これらのテキスト条件を正確な連続座標と単位セルパラメータにデコードする。
この段階的アプローチは、LLMの構造的推論とフローモデルの分散モデリング能力を組み合わせたものである。
実験結果から,本手法は<textit{ab initio}材料生成と結晶構造予測タスクにおいて,形状とエネルギーの両面において接地真理に密接な関係を示し,最先端のモデルを上回った。
フレームワークの柔軟性とモジュラリティにより、生成プロセスのきめ細かい制御が可能になり、より効率的でカスタマイズ可能な材料設計につながる可能性がある。
関連論文リスト
- LLM Meets Diffusion: A Hybrid Framework for Crystal Material Generation [25.009649087291432]
CrysLLMGenは、LLMと拡散モデルを統合するハイブリッドフレームワークであり、結晶生成にそれらの相補的な強度を利用する。
我々のフレームワークは、いくつかのベンチマークタスクやデータセットで最先端の生成モデルより優れています。
論文 参考訳(メタデータ) (2025-10-27T06:08:19Z) - Speed Always Wins: A Survey on Efficient Architectures for Large Language Models [51.817121227562964]
大規模言語モデル(LLM)は、言語理解、生成、推論、マルチモーダルモデルの能力境界の押し付けにおいて、素晴らしい結果をもたらしている。
トランスフォーマーモデルは、現代のLLMの基礎として、優れたスケーリング特性を備えた強力なベースラインを提供する。
従来のトランスフォーマーアーキテクチャは、相当な計算を必要とし、大規模なトレーニングと実践的なデプロイメントに重大な障害を生じさせる。
論文 参考訳(メタデータ) (2025-08-13T14:13:46Z) - MOFGPT: Generative Design of Metal-Organic Frameworks using Language Models [5.417632175667162]
応用固有の性質を持つ金属有機フレームワーク(MOF)は、材料化学における中心的な課題である。
我々はMOFのデノボ設計のための強化学習型トランスフォーマーベースのフレームワークを提案する。
特性フィードバックをシーケンス生成に統合することにより、このモデルを合成可能でトポロジカルに有効なMOFに向けて駆動する。
論文 参考訳(メタデータ) (2025-05-30T20:09:11Z) - MatLLMSearch: Crystal Structure Discovery with Evolution-Guided Large Language Models [27.083255538087215]
事前学習されたLarge Language Models (LLMs) は, 微調整を伴わずに, 本質的に新規で安定した結晶構造を生成可能であることを示す。
我々のフレームワークは、進化的パイプライン内でLSMをインテリジェントな提案エージェントとして使用し、暗黙のクロスオーバーと突然変異操作を実行するように誘導する。
MatLLMSearchは、機械学習の原子間ポテンシャルによって78.38%の準安定率と31.7%のDFT認証安定性を達成している。
論文 参考訳(メタデータ) (2025-02-28T10:41:16Z) - Open Materials Generation with Stochastic Interpolants [14.939468363546384]
Open Materials Generation (OMatG) は、結晶材料の生成設計と発見のための統一的なフレームワークである。
OMatGは無機補間剤を用いて任意の塩基分布を無機結晶の標的分布にブリッジする。
我々はOMatGの性能を結晶構造予測と'de novo'生成の2つのタスクでベンチマークする。
論文 参考訳(メタデータ) (2025-02-04T18:56:47Z) - Efficient Symmetry-Aware Materials Generation via Hierarchical Generative Flow Networks [52.13486402193811]
新しい固体材料は、結晶構造の広大な空間を急速に探索し、安定した領域を探索する必要がある。
既存の手法では、大きな材料空間を探索し、望ましい特性と要求を持った多様なサンプルを生成するのに苦労している。
本研究では, 材料空間の対称性を効果的に活用し, 所望の特性を持つ結晶構造を生成するために, 階層的探索戦略を用いた新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-11-06T23:53:34Z) - Configurable Foundation Models: Building LLMs from a Modular Perspective [115.63847606634268]
LLMを多数の機能モジュールに分解する傾向が高まり、複雑なタスクに取り組むためにモジュールの一部とモジュールの動的アセンブリを推論することができる。
各機能モジュールを表すブロックという用語を造語し、モジュール化された構造をカスタマイズ可能な基礎モデルとして定義する。
検索とルーティング,マージ,更新,成長という,レンガ指向の4つの操作を提示する。
FFN層はニューロンの機能的特殊化と機能的ニューロン分割を伴うモジュラーパターンに従うことが判明した。
論文 参考訳(メタデータ) (2024-09-04T17:01:02Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - Fine-Tuned Language Models Generate Stable Inorganic Materials as Text [53.81190146434045]
テキストエンコードされた原子構造データに基づく微調整された大規模言語モデルは、実装が簡単で信頼性が高い。
我々の最強モデルは、CDVAEの約2倍の速度で準安定であると予測された物質を生成することができる。
テキストプロンプト固有の柔軟性のため、我々のモデルは安定物質を無条件に生成するために同時に使用することができる。
論文 参考訳(メタデータ) (2024-02-06T20:35:28Z) - Scalable Diffusion for Materials Generation [99.71001883652211]
我々は任意の結晶構造(ユニマット)を表現できる統一された結晶表現を開発する。
UniMatはより大型で複雑な化学系から高忠実度結晶構造を生成することができる。
材料の生成モデルを評価するための追加指標を提案する。
論文 参考訳(メタデータ) (2023-10-18T15:49:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。