論文の概要: MOFormer: Self-Supervised Transformer model for Metal-Organic Framework
Property Prediction
- arxiv url: http://arxiv.org/abs/2210.14188v1
- Date: Tue, 25 Oct 2022 17:29:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 15:59:16.943262
- Title: MOFormer: Self-Supervised Transformer model for Metal-Organic Framework
Property Prediction
- Title(参考訳): MOFormer: 金属-有機フレームワーク特性予測のための自己監督型トランスモデル
- Authors: Zhonglin Cao, Rishikesh Magar, Yuyang Wang, and Amir Barati Farimani
- Abstract要約: 金属有機フレームワーク(英: Metal-Organic Frameworks、MOFs)は、エネルギー貯蔵、脱塩、ガス貯蔵、ガス分離などの用途に使用できる多孔質材料である。
特定のアプリケーションに最適なMOFを見つけるには、膨大な数の候補を効率よく正確に探索する必要がある。
そこで本研究では,MOFの特性予測のために,MOFormerと呼ばれるトランスフォーマーモデルに基づく構造に依存しないディープラーニング手法を提案する。
- 参考スコア(独自算出の注目度): 7.367477168940467
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Metal-Organic Frameworks (MOFs) are materials with a high degree of porosity
that can be used for applications in energy storage, water desalination, gas
storage, and gas separation. However, the chemical space of MOFs is close to an
infinite size due to the large variety of possible combinations of building
blocks and topology. Discovering the optimal MOFs for specific applications
requires an efficient and accurate search over an enormous number of potential
candidates. Previous high-throughput screening methods using computational
simulations like DFT can be time-consuming. Such methods also require
optimizing 3D atomic structure of MOFs, which adds one extra step when
evaluating hypothetical MOFs. In this work, we propose a structure-agnostic
deep learning method based on the Transformer model, named as MOFormer, for
property predictions of MOFs. The MOFormer takes a text string representation
of MOF (MOFid) as input, thus circumventing the need of obtaining the 3D
structure of hypothetical MOF and accelerating the screening process.
Furthermore, we introduce a self-supervised learning framework that pretrains
the MOFormer via maximizing the cross-correlation between its
structure-agnostic representations and structure-based representations of
crystal graph convolutional neural network (CGCNN) on >400k publicly available
MOF data. Using self-supervised learning allows the MOFormer to intrinsically
learn 3D structural information though it is not included in the input.
Experiments show that pretraining improved the prediction accuracy of both
models on various downstream prediction tasks. Furthermore, we revealed that
MOFormer can be more data-efficient on quantum-chemical property prediction
than structure-based CGCNN when training data is limited. Overall, MOFormer
provides a novel perspective on efficient MOF design using deep learning.
- Abstract(参考訳): 金属有機フレームワーク(英: Metal-Organic Frameworks、MOFs)は、エネルギー貯蔵、脱塩、ガス貯蔵、ガス分離などの用途に使用できる多孔質材料である。
しかし、MOFsの化学空間は、ビルディングブロックとトポロジーの様々な組み合わせにより、無限大に近い。
特定のアプリケーションに最適なMOFを見つけるには、膨大な数の候補を効率よく正確に探索する必要がある。
DFTのような計算シミュレーションを用いた従来の高スループットスクリーニングには時間がかかる。
このような手法では、MOFの3次元原子構造を最適化する必要がある。
本研究では,mofの特性予測のために,モフォーマーと呼ばれるトランスフォーマーモデルに基づく構造非依存なディープラーニング手法を提案する。
MOFormerは、MOF(MOFid)のテキスト文字列表現を入力として、仮説MOFの3D構造を取得し、スクリーニングプロセスを加速する必要性を回避する。
さらに,400k以上の公開MOFデータ上で,その構造に依存しない表現と結晶グラフ畳み込みニューラルネットワーク(CGCNN)の構造に基づく表現との相互相関を最大化することにより,MOFormerを事前訓練する自己教師型学習フレームワークを導入する。
自己教師付き学習を用いることで、モフォーマーは入力に含まれないが、内在的に3d構造情報を学習することができる。
実験により, 各種下流予測タスクにおいて, 事前学習により両モデルの予測精度が向上した。
さらに,トレーニングデータに制限がある場合,MOFormerは構造に基づくCGCNNよりも量子化学的特性予測においてよりデータ効率が高いことを示した。
全体として、MOFormerはディープラーニングを使った効率的なMOF設計の新しい視点を提供する。
関連論文リスト
- MDDM: A Molecular Dynamics Diffusion Model to Predict Particle Self-Assembly [0.0]
分子動力学拡散モデルでは、与えられた入力対ポテンシャル関数の有効な出力を予測することができる。
このモデルは、非条件および条件付き生成タスクのベースライン点雲拡散モデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2025-01-28T22:21:45Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [77.50732023411811]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
TransDLMは標準化された化学命名法を分子の意味表現として利用し、プロパティ要求をテキスト記述に暗黙的に埋め込む。
提案手法は, 分子構造類似性を最適化し, ベンチマークデータセットの化学的特性を向上するための最先端手法を超越した手法である。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - MOFFlow: Flow Matching for Structure Prediction of Metal-Organic Frameworks [42.61784133509237]
金属-有機フレームワーク(英: Metal-organic framework、MOF)は、炭素捕獲や薬物の放出といった多くの分野で有望な応用を持つ結晶材料のクラスである。
ab initio計算や深い生成モデルを含む既存のアプローチは、単位セル内の多くの原子のためにMOF構造が複雑になるのに苦労している。
我々はMOF構造予測に適した最初の深部生成モデルMOFFlowを紹介する。
論文 参考訳(メタデータ) (2024-10-07T13:51:58Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - MOFDiff: Coarse-grained Diffusion for Metal-Organic Framework Design [4.819734936375677]
金属-有機フレームワーク(MOF)は、ガス貯蔵や炭素捕獲といった応用に非常に関心がある。
CGMOF構造を生成する粗粒拡散モデルMOFDiffを提案する。
有効かつ斬新なMOF構造の生成能力と優れたMOF材料の設計における有効性を評価する。
論文 参考訳(メタデータ) (2023-10-16T18:00:15Z) - Molecular Geometry-aware Transformer for accurate 3D Atomic System
modeling [51.83761266429285]
本稿では,ノード(原子)とエッジ(結合と非結合の原子対)を入力とし,それらの相互作用をモデル化するトランスフォーマーアーキテクチャを提案する。
MoleformerはOC20の緩和エネルギー予測の初期状態の最先端を実現し、QM9では量子化学特性の予測に非常に競争力がある。
論文 参考訳(メタデータ) (2023-02-02T03:49:57Z) - Machine Learning model for gas-liquid interface reconstruction in CFD
numerical simulations [59.84561168501493]
流体の体積(VoF)法は多相流シミュレーションにおいて2つの不混和性流体間の界面を追跡・見つけるために広く用いられている。
VoF法の主なボトルネックは、計算コストが高く、非構造化グリッド上での精度が低いため、インタフェース再構成のステップである。
一般的な非構造化メッシュ上でのインタフェース再構築を高速化するために,グラフニューラルネットワーク(GNN)に基づく機械学習拡張VoF手法を提案する。
論文 参考訳(メタデータ) (2022-07-12T17:07:46Z) - Building Open Knowledge Graph for Metal-Organic Frameworks (MOF-KG):
Challenges and Case Studies [63.61566811532431]
金属有機フレームワーク(MOF)は、ガス貯蔵、分子分離、化学センシング、結晶および薬物のデリバリーといった応用に革命をもたらす大きな可能性を持っている。
ケンブリッジ構造データベース(CSD)は10,636個のMOF結晶を報告しており、これには114,373個のMOF構造が含まれる。
本稿では,MOF予測,発見,合成を容易にする知識グラフ手法の活用に向けた取り組みについて述べる。
論文 参考訳(メタデータ) (2022-07-10T16:41:11Z) - A Universal Framework for Featurization of Atomistic Systems [0.0]
物理や機械学習に基づく反応力場は、時間と長さのスケールのギャップを埋めるために使うことができる。
本稿では,原子周囲の電子密度の物理的に関連する多極展開を利用するガウス多極(GMP)デデュール化スキームを紹介する。
我々は,GMPに基づくモデルがQM9データセットの化学的精度を達成できることを示し,新しい要素を外挿してもその精度は妥当であることを示した。
論文 参考訳(メタデータ) (2021-02-04T03:11:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。