論文の概要: Structure to Property: Chemical Element Embeddings and a Deep Learning
Approach for Accurate Prediction of Chemical Properties
- arxiv url: http://arxiv.org/abs/2309.09355v1
- Date: Sun, 17 Sep 2023 19:41:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 16:03:40.656358
- Title: Structure to Property: Chemical Element Embeddings and a Deep Learning
Approach for Accurate Prediction of Chemical Properties
- Title(参考訳): 物性構造:化学要素埋め込みと化学特性の正確な予測のための深層学習アプローチ
- Authors: Shokirbek Shermukhamedov, Dilorom Mamurjonova, Michael Probst
- Abstract要約: 本稿では,多層エンコーダやデコーダアーキテクチャなどのディープラーニング技術に基づく新しい機械学習モデルを提案する。
有機および無機化合物を含む各種入力データに適用することで,本手法がもたらす機会を実証する。
この研究で使用されるモデルは高い予測力を示し、洗練された機械学習で実現可能な進歩を裏付けるものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The application of machine learning (ML) techniques in computational
chemistry has led to significant advances in predicting molecular properties,
accelerating drug discovery, and material design. ML models can extract hidden
patterns and relationships from complex and large datasets, allowing for the
prediction of various chemical properties with high accuracy. The use of such
methods has enabled the discovery of molecules and materials that were
previously difficult to identify. This paper introduces a new ML model based on
deep learning techniques, such as a multilayer encoder and decoder
architecture, for classification tasks. We demonstrate the opportunities
offered by our approach by applying it to various types of input data,
including organic and inorganic compounds. In particular, we developed and
tested the model using the Matbench and Moleculenet benchmarks, which include
crystal properties and drug design-related benchmarks. We also conduct a
comprehensive analysis of vector representations of chemical compounds,
shedding light on the underlying patterns in molecular data. The models used in
this work exhibit a high degree of predictive power, underscoring the progress
that can be made with refined machine learning when applied to molecular and
material datasets. For instance, on the Tox21 dataset, we achieved an average
accuracy of 96%, surpassing the previous best result by 10%. Our code is
publicly available at https://github.com/dmamur/elembert.
- Abstract(参考訳): 機械学習(ML)技術の計算化学への応用は、分子特性の予測、薬物発見の加速、材料設計において大きな進歩をもたらした。
mlモデルは、複雑なデータセットや大規模データセットから隠れたパターンや関係を抽出でき、高い精度で様々な化学的特性を予測できる。
このような方法を用いることで、それまで同定が困難だった分子や材料の発見が可能となった。
本稿では,階層化タスクのための多層エンコーダやデコーダアーキテクチャなど,ディープラーニング技術に基づく新しいmlモデルを提案する。
有機および無機化合物を含む各種入力データに適用することで,本手法がもたらす機会を実証する。
特に, 結晶特性と薬物設計関連ベンチマークを含むMatebench と Moleculenet ベンチマークを用いて, モデルの開発と試験を行った。
また, 化合物のベクトル表現の包括的解析を行い, 分子データの基盤となるパターンに光を当てる。
この研究で使用されるモデルは高い予測力を示し、分子および材料データセットに適用した場合に、洗練された機械学習で達成できる進歩を裏付ける。
例えば、tox21データセットでは、平均精度96%を達成し、以前の最高の結果を10%上回っています。
私たちのコードはhttps://github.com/dmamur/elembert.comで公開されています。
関連論文リスト
- Unsupervised Learning of Molecular Embeddings for Enhanced Clustering
and Emergent Properties for Chemical Compounds [2.6803933204362336]
SMILESデータに基づく化合物の検出とクラスタリングのための様々な手法を提案する。
埋め込みデータを用いて化合物のグラフィカルな構造を解析し, しきい値を満たすためにベクトル探索を用いる。
また、GPT3.5を用いたベクトルデータベースに格納された自然言語記述埋め込みを用い、ベースモデルより優れていた。
論文 参考訳(メタデータ) (2023-10-25T18:00:24Z) - MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - Machine Learning Small Molecule Properties in Drug Discovery [44.62264781248437]
我々は, 結合親和性, 溶解性, ADMET (吸収, 分布, 代謝, 排出, 毒性) を含む幅広い特性について検討する。
化学指紋やグラフベースニューラルネットワークなど,既存の一般的な記述子や埋め込みについて論じる。
最後に、モデル予測の理解を提供する技術、特に薬物発見における重要な意思決定について評価する。
論文 参考訳(メタデータ) (2023-08-02T22:18:41Z) - QH9: A Quantum Hamiltonian Prediction Benchmark for QM9 Molecules [72.73126947400603]
我々は、999の分子動力学軌道に対して正確なハミルトン行列を提供するために、QH9と名付けられた新しい量子ハミルトンデータセットを生成する。
現在の機械学習モデルでは、任意の分子に対するハミルトン行列を予測する能力がある。
論文 参考訳(メタデータ) (2023-06-15T23:39:07Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - Improving VAE based molecular representations for compound property
prediction [0.0]
機械学習モデルの化学特性予測性能を簡易に向上する手法を提案する。
本稿では,プロパティ予測モデルの性能と,プロパティ予測データセットとより大きなラベル付きデータセットとの距離の関係を示す。
論文 参考訳(メタデータ) (2022-01-13T12:57:11Z) - Do Large Scale Molecular Language Representations Capture Important
Structural Information? [31.76876206167457]
本稿では,MoLFormerと呼ばれる効率的なトランスフォーマーエンコーダモデルのトレーニングにより得られた分子埋め込みについて述べる。
実験の結果,グラフベースおよび指紋ベースによる教師付き学習ベースラインと比較して,学習された分子表現が競合的に機能することが確認された。
論文 参考訳(メタデータ) (2021-06-17T14:33:55Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。