論文の概要: Machine learning with persistent homology and chemical word embeddings
improves prediction accuracy and interpretability in metal-organic frameworks
- arxiv url: http://arxiv.org/abs/2010.00532v2
- Date: Wed, 31 Mar 2021 17:56:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 08:53:56.647293
- Title: Machine learning with persistent homology and chemical word embeddings
improves prediction accuracy and interpretability in metal-organic frameworks
- Title(参考訳): 持続的ホモロジーと化学単語埋め込みによる機械学習による金属-有機フレームワークの予測精度と解釈性の向上
- Authors: Aditi S. Krishnapriyan, Joseph Montoya, Maciej Haranczyk, Jens
Hummelsh{\o}j, Dmitriy Morozov
- Abstract要約: 材料の構造と化学の複雑な表現をキャプチャする記述子を自動的に生成するエンド・ツー・エンドの機械学習モデルを提案する。
物質系から直接、幾何学的および化学的情報をカプセル化する。
提案手法は, 対象物間での精度, 転送可能性の両面において, 一般的に用いられている手作業による特徴量から構築したモデルに比べ, かなり改善されている。
- 参考スコア(独自算出の注目度): 0.07874708385247352
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning has emerged as a powerful approach in materials discovery.
Its major challenge is selecting features that create interpretable
representations of materials, useful across multiple prediction tasks. We
introduce an end-to-end machine learning model that automatically generates
descriptors that capture a complex representation of a material's structure and
chemistry. This approach builds on computational topology techniques (namely,
persistent homology) and word embeddings from natural language processing. It
automatically encapsulates geometric and chemical information directly from the
material system. We demonstrate our approach on multiple nanoporous
metal-organic framework datasets by predicting methane and carbon dioxide
adsorption across different conditions. Our results show considerable
improvement in both accuracy and transferability across targets compared to
models constructed from the commonly-used, manually-curated features,
consistently achieving an average 25-30% decrease in
root-mean-squared-deviation and an average increase of 40-50% in R2 scores. A
key advantage of our approach is interpretability: Our model identifies the
pores that correlate best to adsorption at different pressures, which
contributes to understanding atomic-level structure--property relationships for
materials design.
- Abstract(参考訳): 機械学習は材料発見における強力なアプローチとして登場した。
その大きな課題は、複数の予測タスクで有用な、材料を解釈可能な表現する機能を選択することである。
本稿では,材料の構造と化学の複雑な表現を自動生成するエンド・ツー・エンドの機械学習モデルを提案する。
このアプローチは計算トポロジ技術(すなわち永続ホモロジー)と自然言語処理からの単語埋め込みに基づいている。
物質系から直接幾何学的・化学的な情報をカプセル化する。
本研究では,様々な条件下でメタンおよび二酸化炭素の吸着を予測し,複数のナノ多孔性金属-有機系データセットへのアプローチを実証する。
本研究の結果は, 一般に使用されている手作業による特徴から構築したモデルと比較して, 目標間の精度と伝達性の両方が著しく向上し, 根平均二乗平均25~30%の減少, R2スコアの平均40~50%の上昇を達成した。
我々のモデルは、異なる圧力下での吸着に最も近い孔を識別し、材料設計における原子レベルの構造-特性関係を理解するのに寄与する。
関連論文リスト
- Fine-Tuned Language Models Generate Stable Inorganic Materials as Text [57.01994216693825]
テキストエンコードされた原子構造データに基づく微調整された大規模言語モデルは、実装が簡単で信頼性が高い。
我々の最強モデルは、CDVAEの約2倍の速度で準安定であると予測された物質を生成することができる。
テキストプロンプト固有の柔軟性のため、我々のモデルは安定物質を無条件に生成するために同時に使用することができる。
論文 参考訳(メタデータ) (2024-02-06T20:35:28Z) - On the importance of catalyst-adsorbate 3D interactions for relaxed
energy predictions [98.70797778496366]
吸着剤の相対的な位置を無視しながら,OC20データセットの緩和エネルギーを予測できるかどうかを検討する。
結合サイト情報の削除は,期待通りに精度を低下させるが,修正モデルは極めて良好なMAEで緩和エネルギーを予測することができる。
論文 参考訳(メタデータ) (2023-10-10T14:57:04Z) - Structure to Property: Chemical Element Embeddings and a Deep Learning
Approach for Accurate Prediction of Chemical Properties [0.0]
本稿では,多層エンコーダやデコーダアーキテクチャなどのディープラーニング技術に基づく新しい機械学習モデルを提案する。
有機および無機化合物を含む各種入力データに適用することで,本手法がもたらす機会を実証する。
この研究で使用されるモデルは高い予測力を示し、洗練された機械学習で実現可能な進歩を裏付けるものである。
論文 参考訳(メタデータ) (2023-09-17T19:41:32Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Automatic Identification of Chemical Moieties [11.50343898633327]
本稿では, メッセージパッシングニューラルネットワークを用いて, 原子表現から化学量を自動的に同定する手法を提案する。
本手法の汎用性は, 化学データベースにおける代表成分の選択を可能にすることによって実証される。
論文 参考訳(メタデータ) (2022-03-30T10:58:23Z) - A Machine Learning Method for Material Property Prediction: Example
Polymer Compatibility [39.364776649251944]
材料特性予測のための新しい汎用機械学習手法を提案する。
代表的な例として, 本手法の有効性を示すために, ポリマーの適合性を選択する。
論文 参考訳(メタデータ) (2022-02-28T05:48:05Z) - Improving VAE based molecular representations for compound property
prediction [0.0]
機械学習モデルの化学特性予測性能を簡易に向上する手法を提案する。
本稿では,プロパティ予測モデルの性能と,プロパティ予測データセットとより大きなラベル付きデータセットとの距離の関係を示す。
論文 参考訳(メタデータ) (2022-01-13T12:57:11Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - Graph Neural Network for Hamiltonian-Based Material Property Prediction [56.94118357003096]
無機材料のバンドギャップを予測できるいくつかの異なるグラフ畳み込みネットワークを提示し、比較する。
モデルは、それぞれの軌道自体の情報と相互の相互作用の2つの異なる特徴を組み込むように開発されている。
その結果,クロスバリデーションにより予測精度が期待できることがわかった。
論文 参考訳(メタデータ) (2020-05-27T13:32:10Z) - Machine Learning Enabled Discovery of Application Dependent Design
Principles for Two-dimensional Materials [1.1470070927586016]
我々は熱力学、機械的、電子的特性を予測するためにモデルのアンサンブルを訓練する。
ほぼ2つの非結合なアプリケーションに対して,45,000近い構造体をスクリーニングする。
有機-無機ペロブスカイトと鉛とスズとのハイブリッドが太陽電池の応用に好適であることが判明した。
論文 参考訳(メタデータ) (2020-03-19T23:13:50Z) - Explainable Deep Relational Networks for Predicting Compound-Protein
Affinities and Contacts [80.69440684790925]
Deep Relationsは物理にインスパイアされた、本質的に説明可能なアーキテクチャを持つディープリレーショナルネットワークである。
それは最先端技術に対する優れた解釈可能性を示している。
接触予測 9.5, 16.9, 19.3, 5.7 倍の AUPRC をテスト用、複合ユニク、タンパク質ユニク、両ユニクセットで強化する。
論文 参考訳(メタデータ) (2019-12-29T00:14:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。