論文の概要: Accurate and efficient structure elucidation from routine one-dimensional NMR spectra using multitask machine learning
- arxiv url: http://arxiv.org/abs/2408.08284v1
- Date: Thu, 15 Aug 2024 17:37:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-16 13:05:43.308105
- Title: Accurate and efficient structure elucidation from routine one-dimensional NMR spectra using multitask machine learning
- Title(参考訳): マルチタスク機械学習を用いた日常的な1次元NMRスペクトルからの高精度かつ効率的な構造推定
- Authors: Frank Hu, Michael S. Chen, Grant M. Rotskoff, Matthew W. Kanan, Thomas E. Markland,
- Abstract要約: 本稿では,その1D 1Hおよび13C NMRスペクトルに基づいて未知化合物の分子構造を予測する機械学習フレームワークを提案する。
この機能を畳み込みニューラルネットワーク(CNN)に統合することで、高速かつ高精度なスペクトルから構造を予測するエンドツーエンドモデルを構築します。
- 参考スコア(独自算出の注目度): 1.2754578699685275
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rapid determination of molecular structures can greatly accelerate workflows across many chemical disciplines. However, elucidating structure using only one-dimensional (1D) NMR spectra, the most readily accessible data, remains an extremely challenging problem because of the combinatorial explosion of the number of possible molecules as the number of constituent atoms is increased. Here, we introduce a multitask machine learning framework that predicts the molecular structure (formula and connectivity) of an unknown compound solely based on its 1D 1H and/or 13C NMR spectra. First, we show how a transformer architecture can be constructed to efficiently solve the task, traditionally performed by chemists, of assembling large numbers of molecular fragments into molecular structures. Integrating this capability with a convolutional neural network (CNN), we build an end-to-end model for predicting structure from spectra that is fast and accurate. We demonstrate the effectiveness of this framework on molecules with up to 19 heavy (non-hydrogen) atoms, a size for which there are trillions of possible structures. Without relying on any prior chemical knowledge such as the molecular formula, we show that our approach predicts the exact molecule 69.6% of the time within the first 15 predictions, reducing the search space by up to 11 orders of magnitude.
- Abstract(参考訳): 分子構造の迅速な決定は、多くの化学分野にわたるワークフローを大幅に加速させることができる。
しかし、最もアクセスしやすいデータである1次元(1D)NMRスペクトルのみを用いる構造は、構成原子の数が増えるにつれて可能な分子の数が爆発的に増加するため、非常に難しい問題である。
本稿では,その1D 1Hおよび/または13C NMRスペクトルのみに基づく未知化合物の分子構造(形式と接続性)を予測するマルチタスク機械学習フレームワークを提案する。
まず,多くの分子断片を分子構造に組み立てる,化学者が伝統的に行ってきた課題を効率的に解くために,トランスフォーマーアーキテクチャを構築する方法を示す。
この機能を畳み込みニューラルネットワーク(CNN)に統合することで、高速かつ高精度なスペクトルから構造を予測するエンドツーエンドモデルを構築します。
最大19個の重原子(非水素原子)を持つ分子に対して、この枠組みの有効性を実証する。
分子式のような先行的な化学知識を頼らずに、我々の手法は最初の15回の予測で正確な分子の69.6%を予測し、探索空間を最大11桁まで減少させることを示した。
関連論文リスト
- GraphXForm: Graph transformer for computer-aided molecular design with application to extraction [73.1842164721868]
本稿では,デコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormについて述べる。
液液抽出のための2つの溶媒設計課題について評価し,4つの最先端分子設計技術より優れていることを示した。
論文 参考訳(メタデータ) (2024-11-03T19:45:15Z) - A Transformer Based Generative Chemical Language AI Model for Structural Elucidation of Organic Compounds [1.5628118690186594]
本稿では,概念変換器を用いた生成化学言語人工知能(AI)モデルを提案する。
我々のモデルはエンコーダ・デコーダアーキテクチャと自己保持機構を用いて、最も可能性の高い化学構造を直接生成する。
現代のCPUでは、29個の原子を持つ分子をわずか数秒で構造解明し、83%の精度でトップ15を達成している。
論文 参考訳(メタデータ) (2024-10-13T15:41:20Z) - Carbohydrate NMR chemical shift predictions using E(3) equivariant graph
neural networks [0.0]
この研究は、E(3)同変グラフニューラルネットワークを利用して炭水化物NMRスペクトルを予測する新しいアプローチを導入する。
特に,従来のモデルと比較して,平均絶対誤差を最大3倍に削減した。
この含意は、炭水化物の構造とスペクトル解釈の高度な理解を超えている。
論文 参考訳(メタデータ) (2023-11-21T15:01:14Z) - QH9: A Quantum Hamiltonian Prediction Benchmark for QM9 Molecules [69.25826391912368]
QH9と呼ばれる新しい量子ハミルトンデータセットを生成し、999または2998の分子動力学軌道に対して正確なハミルトン行列を提供する。
現在の機械学習モデルでは、任意の分子に対するハミルトン行列を予測する能力がある。
論文 参考訳(メタデータ) (2023-06-15T23:39:07Z) - Prefix-Tree Decoding for Predicting Mass Spectra from Molecules [12.868704267691125]
我々は、質量スペクトルを分子公式の集合として扱うことにより、分子からの質量スペクトルを予測するための新しい中間戦略を用いる。
質量スペクトル予測タスクにおける有望な実験結果を示す。
論文 参考訳(メタデータ) (2023-03-11T17:44:28Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Substructure-Atom Cross Attention for Molecular Representation Learning [21.4652884347198]
分子表現学習のための新しい枠組みを提案する。
私たちの貢献は3つある: (a) 部分構造を分子のノード的特徴に組み込むことの有用性を実証すること、(b) トランスフォーマーとグラフニューラルネットワークからなる2つの分岐ネットワークを設計すること、(c) 分子からの特徴や計算的な情報を必要としないこと、である。
論文 参考訳(メタデータ) (2022-10-15T09:44:27Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - Do Large Scale Molecular Language Representations Capture Important
Structural Information? [31.76876206167457]
本稿では,MoLFormerと呼ばれる効率的なトランスフォーマーエンコーダモデルのトレーニングにより得られた分子埋め込みについて述べる。
実験の結果,グラフベースおよび指紋ベースによる教師付き学習ベースラインと比較して,学習された分子表現が競合的に機能することが確認された。
論文 参考訳(メタデータ) (2021-06-17T14:33:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。