論文の概要: Invariant Tokenization of Crystalline Materials for Language Model Enabled Generation
- arxiv url: http://arxiv.org/abs/2503.00152v1
- Date: Fri, 28 Feb 2025 20:02:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:14:30.146450
- Title: Invariant Tokenization of Crystalline Materials for Language Model Enabled Generation
- Title(参考訳): 言語モデル生成が可能な結晶材料の不変トークン化
- Authors: Keqiang Yan, Xiner Li, Hongyi Ling, Kenna Ashen, Carl Edwards, Raymundo Arróyave, Marinka Zitnik, Heng Ji, Xiaofeng Qian, Xiaoning Qian, Shuiwang Ji,
- Abstract要約: 鍵となるステップは、3次元結晶構造を1次元配列に変換して言語モデル(LM)で処理することだ。
Mat2Seqは3次元結晶構造を1次元配列に変換し、同じ結晶の異なる数学的記述が単一のユニークなシーケンスで表現されることを保証する。
実験結果から,Mate2Seqは,従来の手法と比較して,結晶構造生成において有望な性能を発揮することがわかった。
- 参考スコア(独自算出の注目度): 82.91073155506277
- License:
- Abstract: We consider the problem of crystal materials generation using language models (LMs). A key step is to convert 3D crystal structures into 1D sequences to be processed by LMs. Prior studies used the crystallographic information framework (CIF) file stream, which fails to ensure SE(3) and periodic invariance and may not lead to unique sequence representations for a given crystal structure. Here, we propose a novel method, known as Mat2Seq, to tackle this challenge. Mat2Seq converts 3D crystal structures into 1D sequences and ensures that different mathematical descriptions of the same crystal are represented in a single unique sequence, thereby provably achieving SE(3) and periodic invariance. Experimental results show that, with language models, Mat2Seq achieves promising performance in crystal structure generation as compared with prior methods.
- Abstract(参考訳): 言語モデル(LM)を用いた結晶材料生成の問題点を考察する。
重要なステップは、3D結晶構造を1次元配列に変換し、LMで処理することである。
以前の研究では、結晶情報フレームワーク(CIF)ファイルストリームを使用しており、SE(3)と周期的不変性を保証することができず、特定の結晶構造に対してユニークなシーケンス表現を導出しない可能性がある。
本稿では,この課題に対処するため,Mat2Seqと呼ばれる新しい手法を提案する。
Mat2Seqは3次元結晶構造を1次元配列に変換し、同じ結晶の異なる数学的記述が単一のユニークなシーケンスで表現されることを保証する。
実験結果から,Mate2Seqは,従来の手法と比較して,結晶構造生成において有望な性能を発揮することがわかった。
関連論文リスト
- CrystalGRW: Generative Modeling of Crystal Structures with Targeted Properties via Geodesic Random Walks [1.2141052067494946]
本稿では,密度汎関数理論で検証された安定位相を予測できる拡散モデルであるCrystalGRWを紹介する。
CrystalGRWは、既存のモデルに匹敵する精度で基底状態に近い現実的な結晶構造を生成する能力を示す。
これらの特徴は、安定で対称性に富んだ結晶候補を実験的に検証することで、材料発見と逆設計を加速する。
論文 参考訳(メタデータ) (2025-01-15T18:26:35Z) - Generative Hierarchical Materials Search [91.93125016916463]
結晶構造の制御可能な生成のための生成階層材料探索(GenMS)を提案する。
GenMSは(1)高レベル自然言語を入力とし、結晶に関する中間テキスト情報を生成する言語モデルからなる。
GenMSはまた、生成された結晶構造から特性(たとえば生成エネルギー)を予測するためにグラフニューラルネットワークを使用する。
論文 参考訳(メタデータ) (2024-09-10T17:51:28Z) - Complete and Efficient Graph Transformers for Crystal Material Property Prediction [53.32754046881189]
結晶構造は、3次元空間の正則格子に沿って繰り返される原始単位セル内の原子塩基によって特徴づけられる。
本稿では,各原子の格子に基づく表現を確立するために,単位細胞の周期パターンを利用する新しい手法を提案する。
結晶材料に特化して設計されたSE(3)トランスであるComFormerを提案する。
論文 参考訳(メタデータ) (2024-03-18T15:06:37Z) - Scalable Diffusion for Materials Generation [99.71001883652211]
我々は任意の結晶構造(ユニマット)を表現できる統一された結晶表現を開発する。
UniMatはより大型で複雑な化学系から高忠実度結晶構造を生成することができる。
材料の生成モデルを評価するための追加指標を提案する。
論文 参考訳(メタデータ) (2023-10-18T15:49:39Z) - Latent Conservative Objective Models for Data-Driven Crystal Structure
Prediction [62.36797874900395]
計算化学において、結晶構造予測は最適化問題である。
この問題に対処する1つのアプローチは、密度汎関数理論(DFT)に基づいてシミュレータを構築し、続いてシミュレーションで探索を実行することである。
我々は,LCOM(最近の保守的客観モデル)と呼ばれる我々の手法が,構造予測の成功率の観点から,最も優れたアプローチと同等に機能することを示す。
論文 参考訳(メタデータ) (2023-10-16T04:35:44Z) - Data-Driven Score-Based Models for Generating Stable Structures with
Adaptive Crystal Cells [1.515687944002438]
本研究は, 化学安定性や化学組成など, 新しい結晶構造を創出することを目的としている。
提案手法の新規性は、結晶細胞の格子が固定されていないという事実にある。
対称性の制約を尊重し、計算上の優位性をもたらす多グラフ結晶表現が導入された。
論文 参考訳(メタデータ) (2023-10-16T02:53:24Z) - Crystal Structure Prediction by Joint Equivariant Diffusion [27.52168842448489]
結晶構造予測(CSP)は様々な科学分野において重要である。
本稿では, 安定結晶から構造分布を学習する新しい拡散モデルであるDiffCSPを提案する。
論文 参考訳(メタデータ) (2023-07-30T15:46:33Z) - Fold2Seq: A Joint Sequence(1D)-Fold(3D) Embedding-based Generative Model
for Protein Design [70.27706384570723]
Fold2Seqは特定の標的に条件付きタンパク質配列を設計するための新しいフレームワークである。
Fold2Seqの性能は, シーケンス設計の速度, カバレッジ, 信頼性において向上したか, 同等であったかを示す。
フォールドベースのFold2Seqの独特な利点は、構造ベースのディープモデルやRosettaDesignと比較して、3つの現実世界の課題においてより明確になる。
論文 参考訳(メタデータ) (2021-06-24T14:34:24Z) - Quantum metamorphism [0.0]
本稿では,2Tと4T-DTCの2つの周期性を持つDTC間の量子準同型モデルを提案する。
メタモルフィズムの条件は、4T-DTCハミルトニアンの摂動項の変調によるものであり、徐々に構造を解き、それを2T-DTCに変換する。
また,現在の量子技術を用いて量子メタモルフィズムを実験的に観測するプロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-04T04:01:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。