論文の概要: ReadMOF: Structure-Free Semantic Embeddings from Systematic MOF Nomenclature for Machine Learning
- arxiv url: http://arxiv.org/abs/2604.10568v1
- Date: Sun, 12 Apr 2026 10:32:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.105233
- Title: ReadMOF: Structure-Free Semantic Embeddings from Systematic MOF Nomenclature for Machine Learning
- Title(参考訳): ReadMOF: 機械学習のためのシステマティックMOF命名法からの構造化不要なセマンティックな埋め込み
- Authors: Kewei Zhu, Cameron Wilson, Bartosz Mazur, Yi Li, Ashleigh M. Chester, Peyman Z. Moghadam,
- Abstract要約: ReadMOFは、構造-プロパティ関係のための命名自由機械学習フレームワークである。
ReadMOFは、体系的な化学名を従来の構造ベースの記述子を表すベクトル埋め込みに変換する。
以上の結果から,構造化化学言語は従来の分子表現に代えて,スケーラブルで解釈可能で,幾何学に依存しない言語となることが示唆された。
- 参考スコア(独自算出の注目度): 2.3357746028311186
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Systematic chemical names, such as IUPAC-style nomenclature for metal-organic frameworks (MOFs), contain rich structural and compositional information in a standardized textual format. Here we introduce ReadMOF, which is, to our knowledge, the first nomenclature-free machine learning framework that leverages these names to model structure-property relationships without requiring atomic coordinates or connectivity graphs. By employing pretrained language models, ReadMOF converts systematic MOF names from the Cambridge Structural Database (CSD) into vector embeddings that closely represent traditional structure-based descriptors. These embeddings enable applications in materials informatics, including property prediction, similarity retrieval, and clustering, with performance comparable to geometry-dependent methods. When combined with large language models, ReadMOF also establishes chemically meaningful reasoning ability with textual input only. Our results show that structured chemical language, interpreted through modern natural language processing techniques, can provide a scalable, interpretable, and geometry-independent alternative to conventional molecular representations. This approach opens new opportunities for language-driven discovery in materials science.
- Abstract(参考訳): IUPAC-style nomenclature for Metal-organic frameworks (MOFs) のような体系的な化学名は、構造的および構成的な情報を標準化されたテキスト形式で含んでいる。
本稿では、原子座標や接続グラフを必要とせずに、これらの名前を利用して構造-プロパティ関係をモデル化する、最初の命名自由機械学習フレームワークであるReadMOFを紹介する。
事前訓練された言語モデルを利用することで、ReadMOFは、ケンブリッジ構造データベース(CSD)から従来の構造ベースの記述子を忠実に表現するベクトル埋め込みに変換する。
これらの埋め込みは、プロパティ予測、類似性検索、クラスタリングなどの材料情報学の応用を可能にし、幾何に依存した手法に匹敵する性能を持つ。
大規模な言語モデルと組み合わせることで、ReadMOFはテキスト入力のみで化学的に意味のある推論能力を確立する。
以上の結果から,現代の自然言語処理技術を通じて解釈される構造化化学言語は,従来の分子表現に代わる,スケーラブルで解釈可能な,幾何学に依存しない代替手段を提供することができることがわかった。
このアプローチは、材料科学における言語による発見の新しい機会を開く。
関連論文リスト
- Understanding the Capabilities of Molecular Graph Neural Networks in Materials Science Through Multimodal Learning and Physical Context Encoding [2.172419551358714]
分子グラフニューラルネットワーク(GNN)は、しばしばXYZベースの幾何学的表現にのみ焦点をあてる。
この研究は、IUPAC名、分子式、物理化学的性質、同義語などのテキスト記述子を統合するマルチモーダルフレームワークを導入している。
論文 参考訳(メタデータ) (2025-05-17T20:42:16Z) - RFL: Simplifying Chemical Structure Recognition with Ring-Free Language [66.47173094346115]
化学構造を階層的に記述する新しいリング自由言語(RFL)を提案する。
RFLは複雑な分子構造を複数の部分に分解し、特異性と簡潔性の両方を保証する。
分子骨格と個々の環を段階的に予測する骨格生成モジュールからなる普遍的な分子骨格デコーダ(MSD)を提案する。
論文 参考訳(メタデータ) (2024-12-10T15:29:32Z) - Generative Hierarchical Materials Search [91.93125016916463]
結晶構造の制御可能な生成のための生成階層材料探索(GenMS)を提案する。
GenMSは(1)高レベル自然言語を入力とし、結晶に関する中間テキスト情報を生成する言語モデルからなる。
GenMSはまた、生成された結晶構造から特性(たとえば生成エネルギー)を予測するためにグラフニューラルネットワークを使用する。
論文 参考訳(メタデータ) (2024-09-10T17:51:28Z) - Physics of Language Models: Part 1, Learning Hierarchical Language Structures [51.68385617116854]
トランスフォーマーベースの言語モデルは効率的だが複雑であり、内部の動作や推論メカニズムを理解することは大きな課題である。
本稿では,長文を生成可能な階層規則を生成する合成CFGのファミリーを紹介する。
我々は、GPTのような生成モデルがCFG定義階層を正確に学習し、推論し、それに基づいて文を生成することを実証する。
論文 参考訳(メタデータ) (2023-05-23T04:28:16Z) - Building Open Knowledge Graph for Metal-Organic Frameworks (MOF-KG):
Challenges and Case Studies [63.61566811532431]
金属有機フレームワーク(MOF)は、ガス貯蔵、分子分離、化学センシング、結晶および薬物のデリバリーといった応用に革命をもたらす大きな可能性を持っている。
ケンブリッジ構造データベース(CSD)は10,636個のMOF結晶を報告しており、これには114,373個のMOF構造が含まれる。
本稿では,MOF予測,発見,合成を容易にする知識グラフ手法の活用に向けた取り組みについて述べる。
論文 参考訳(メタデータ) (2022-07-10T16:41:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。