論文の概要: Pushing the limits of one-dimensional NMR spectroscopy for automated structure elucidation using artificial intelligence
- arxiv url: http://arxiv.org/abs/2512.18531v1
- Date: Sat, 20 Dec 2025 22:56:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.384134
- Title: Pushing the limits of one-dimensional NMR spectroscopy for automated structure elucidation using artificial intelligence
- Title(参考訳): 人工知能を用いた構造自動解明のための一次元NMRスペクトルの限界を押し上げる
- Authors: Frank Hu, Jonathan M. Tubb, Dimitris Argyropoulos, Sergey Golotvin, Mikhail Elyashberg, Grant M. Rotskoff, Matthew W. Kanan, Thomas E. Markland,
- Abstract要約: 有機化学において典型的に遭遇する全元素を網羅して、最大40個の非水素原子を持つ系の課題を達成することができるかを示す。
自然言語処理からの洞察を用いて、変換器に基づくアーキテクチャは、最初の15回の予測で55.2%の精度で正しい分子を予測する。
- 参考スコア(独自算出の注目度): 2.18055229961224
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One-dimensional NMR spectroscopy is one of the most widely used techniques for the characterization of organic compounds and natural products. For molecules with up to 36 non-hydrogen atoms, the number of possible structures has been estimated to range from $10^{20} - 10^{60}$. The task of determining the structure (formula and connectivity) of a molecule of this size using only its one-dimensional $^1$H and/or $^{13}$C NMR spectrum, i.e. de novo structure generation, thus appears completely intractable. Here we show how it is possible to achieve this task for systems with up to 40 non-hydrogen atoms across the full elemental coverage typically encountered in organic chemistry (C, N, O, H, P, S, Si, B, and the halogens) using a deep learning framework, thus covering a vast portion of the drug-like chemical space. Leveraging insights from natural language processing, we show that our transformer-based architecture predicts the correct molecule with 55.2% accuracy within the first 15 predictions using only the $^1$H and $^{13}$C NMR spectra, thus overcoming the combinatorial growth of the chemical space while also being extensible to experimental data via fine-tuning.
- Abstract(参考訳): 1次元NMR分光法は、有機化合物や天然物のキャラクタリゼーションに最も広く用いられている手法の1つである。
最大36個の非水素原子を持つ分子の場合、可能な構造数は10^{20} - 10^{60}$と推定されている。
この大きさの分子の構造(形式と接続性)を決定するタスクは、1次元の$^1$Hと/または$^{13}$C NMRスペクトル、すなわちde novo構造の生成だけで、完全に難解に見える。
ここでは, 有機化学(C, N, O, H, P, S, Si, B, およびハロゲン)において典型的に発生する, 最大40個の非水素原子を含む系において, 深層学習の枠組みを用いて, この課題を実現する方法を示す。
自然言語処理の知見を活かして、我々のトランスフォーマーベースのアーキテクチャは、$1$Hと$^{13}$C NMRスペクトルのみを用いて、最初の15の予測で55.2%の精度で正しい分子を予測し、化学空間の組合せ的成長を克服し、微調整による実験データにも拡張可能であることを示す。
関連論文リスト
- OXtal: An All-Atom Diffusion Model for Organic Crystal Structure Prediction [63.318434943975255]
分子内コンフォーメーションと周期的パッキングの条件付き関節分布を学習する大規模100Mパラメータ全原子拡散モデルであるOXtalを導入する。
実験的に検証された600Kの結晶構造の大規模なデータセットを活用することで、OXtalは、以前のabinitio機械学習CSPメソッドよりも改善の順序を達成できる。
オキシタルは80%以上のパッキング類似率を獲得し、分子結晶化の熱力学的および運動論的規則性の両方をモデル化する能力を示している。
論文 参考訳(メタデータ) (2025-12-07T20:46:30Z) - Atomic Diffusion Models for Small Molecule Structure Elucidation from NMR Spectra [5.818797900550866]
ChefNMR (Chemical Elucidation From NMR) は、未知の分子の構造を直接予測するエンドツーエンドのフレームワークである。
天然物に含まれる複雑な化学物質群をモデル化するため,111,000以上の天然物に対してシミュレーションされた1次元NMRスペクトルのデータセットを作成した。
ChefNMRは、未通過の精度が65%を超える、挑戦的な天然物化合物の構造を予測する。
論文 参考訳(メタデータ) (2025-12-02T18:59:13Z) - NMR-Solver: Automated Structure Elucidation via Large-Scale Spectral Matching and Physics-Guided Fragment Optimization [24.714189961887215]
核磁気共鳴分光法(英: Nuclear Magnetic Resonance spectroscopy、NMR)は、有機化学において最も強力で広く用いられている分子構造解明法の一つである。
本稿では,小さな有機分子構造を1ドルHおよび13ドルCのNMRスペクトルから自動決定するための,実用的で解釈可能なフレームワークであるNMR-rについて述べる。
論文 参考訳(メタデータ) (2025-08-30T23:59:12Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Accurate and efficient structure elucidation from routine one-dimensional NMR spectra using multitask machine learning [1.2754578699685275]
本稿では,その1D 1Hおよび13C NMRスペクトルに基づいて未知化合物の分子構造を予測する機械学習フレームワークを提案する。
この機能を畳み込みニューラルネットワーク(CNN)に統合することで、高速かつ高精度なスペクトルから構造を予測するエンドツーエンドモデルを構築します。
論文 参考訳(メタデータ) (2024-08-15T17:37:36Z) - Carbohydrate NMR chemical shift predictions using E(3) equivariant graph
neural networks [0.0]
この研究は、E(3)同変グラフニューラルネットワークを利用して炭水化物NMRスペクトルを予測する新しいアプローチを導入する。
特に,従来のモデルと比較して,平均絶対誤差を最大3倍に削減した。
この含意は、炭水化物の構造とスペクトル解釈の高度な理解を超えている。
論文 参考訳(メタデータ) (2023-11-21T15:01:14Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - 3DMolNet: A Generative Network for Molecular Structures [5.446536331020099]
固定サイズや組成に制限されない分子構造を効率的に生成するための新しい手法を提案する。
本モデルは,分子の翻訳・回転・置換不変低次元表現を学習する変分オートエンコーダに基づく。
新たに生成した分子の組成的および構造的妥当性は、量子化学法によって確認されている。
論文 参考訳(メタデータ) (2020-10-08T13:04:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。