論文の概要: Solvent-Aware 2D NMR Prediction: Leveraging Multi-Tasking Training and Iterative Self-Training Strategies
- arxiv url: http://arxiv.org/abs/2403.11353v2
- Date: Tue, 28 May 2024 02:44:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-30 00:59:19.216182
- Title: Solvent-Aware 2D NMR Prediction: Leveraging Multi-Tasking Training and Iterative Self-Training Strategies
- Title(参考訳): 溶媒を意識した2次元NMR予測:マルチタスクトレーニングと反復自己学習戦略の活用
- Authors: Yunrui Li, Hao Xu, Pengyu Hong,
- Abstract要約: 実験2次元NMRスペクトルにおける原子2次元NMR交差ピークの予測とアノテートピークの予測のための機械学習モデルを訓練するための反復的教師なし学習(IUL)手法を提案する。
我々は19,000個のヘテロ核単一量子コヒーレンス(HSQC)スペクトルでモデルをトレーニングし、専門家アノテーションで500個のHSQCスペクトルでテストし、さらに別の専門家注釈付きHSQCデータセットで2つの従来手法(ChemDrawとMestrenova)と比較した。
HSQCクロスピーク予測では,13Cシフトで2.035ppm,0.163ppm,1HのMAEを達成する。
- 参考スコア(独自算出の注目度): 7.470166291890153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nuclear magnetic resonance (NMR) spectroscopy is crucial across diverse scientific fields, revealing detailed structural information, electronic properties, and molecular dynamic insights. Accurate prediction of NMR peaks in a spectrum from molecular structures allows chemists to effectively evaluate candidate structures by comparing predictions with experimental shifts in an NMR spectra. This process facilitates peak assignments, thereby aiding in verifying molecular structures or identifying discrepancies. Although significant progress has been made in predicting 1D NMR with Machine Learning (ML) approaches, 2D NMR prediction remains a challenge due to the lack of an annotated 2D NMR training dataset. To address this gap, we propose an Iterative Unsupervised Learning (IUL) approach to train a machine learning model for predicting atomic 2D NMR cross peaks and annotating peaks in experimental 2D NMR spectra. Initially, the model undergoes a Multi-Task pre-Training (MTT) phase using a set of annotated 1D 1H and 13C NMR spectra. Then, the model is iteratively improved through a fine-tuning process with IUL, alternating between using the model to annotate the unlabeled 2D NMR data and refining the model using the newly generated annotations. Using the proposed approach, we trained our model on 19,000 Heteronuclear Single Quantum Coherence (HSQC) spectra, tested it on 500 HSQC spectra with expert annotations, and further compared it with two traditional methods (ChemDraw and Mestrenova) on another expert-annotated HSQC dataset. For HSQC cross peak prediction, our model achieves MAE of 2.035 ppm and 0.163 ppm for 13C shifts and 1H shifts on the test dataset, respectively, and outperforms the conventional tools. This performance demonstrates not only the model's capability in accurately predicting chemical shifts, but also its effectiveness in peak assignments for experimental HSQC spectra.
- Abstract(参考訳): 核磁気共鳴(NMR)分光法は様々な科学分野において重要であり、詳細な構造情報、電子特性、分子動力学の洞察を明らかにする。
分子構造からのスペクトルにおけるNMRピークの正確な予測は、化学者がNMRスペクトルの実験的シフトと比較することによって、候補構造を効果的に評価することができる。
このプロセスはピークの割り当てを促進するため、分子構造の検証や相違点の同定に寄与する。
機械学習(ML)アプローチによる1次元NMRの予測には大きな進歩があるが、注釈付き2次元NMRトレーニングデータセットがないため、2次元NMR予測は依然として課題である。
このギャップに対処するため,実験2次元NMRスペクトルにおける原子2次元NMR交差ピークの予測とアノテートピークの予測のための機械学習モデルを訓練するための反復的教師なし学習(IUL)手法を提案する。
当初、このモデルは注釈付き1D 1Hと13C NMRスペクトルを用いてマルチタスク事前訓練(MTT)フェーズを行う。
次に、IULを用いた微調整プロセスによりモデルの改善を行い、未ラベルの2D NMRデータにアノテートするためにモデルを使用することと、新たに生成されたアノテーションを用いてモデルを精査することとを交互に交互に行う。
提案手法を用いて、19,000個のヘテロ核単一量子コヒーレンス(HSQC)スペクトルを用いてモデルをトレーニングし、専門家アノテーションを用いた500個のHSQCスペクトル上でテストし、さらに別の専門家アノテーション付きHSQCデータセット上の2つの従来手法(ChemDrawとMestrenova)と比較した。
HSQCクロスピーク予測では,テストデータセット上の13Cシフトに対して2.035 ppmと0.163 ppmのMAEを達成し,従来のツールよりも優れていた。
この性能は、化学シフトを正確に予測するモデルの性能だけでなく、実験用HSQCスペクトルのピーク割り当てにおける有効性を示す。
関連論文リスト
- Unraveling Molecular Structure: A Multimodal Spectroscopic Dataset for Chemistry [0.1747623282473278]
このデータセットは、特許データから化学反応から抽出された790k分子の1ドルH-NMR、13ドルC-NMR、HSQC-NMR、赤外線、質量スペクトルからなる。
本研究では, 構造解明, 対象分子のスペクトル予測, 機能群予測などの単一モダリティタスクを評価するためのベンチマークを行う。
論文 参考訳(メタデータ) (2024-07-04T12:52:48Z) - Carbohydrate NMR chemical shift predictions using E(3) equivariant graph
neural networks [0.0]
この研究は、E(3)同変グラフニューラルネットワークを利用して炭水化物NMRスペクトルを予測する新しいアプローチを導入する。
特に,従来のモデルと比較して,平均絶対誤差を最大3倍に削減した。
この含意は、炭水化物の構造とスペクトル解釈の高度な理解を超えている。
論文 参考訳(メタデータ) (2023-11-21T15:01:14Z) - Sensing of magnetic field effects in radical-pair reactions using a
quantum sensor [50.591267188664666]
特定の化学反応における磁場効果(MFE)は、過去50年間によく確立されてきた。
我々は、局所的なスピン環境とセンサーとの結合を考慮して、ラジカル対の精巧で現実的なモデルを採用する。
2つのモデル系に対して、ラジカル対とNV量子センサの弱い結合状態においても検出可能なMFEの信号を導出する。
論文 参考訳(メタデータ) (2022-09-28T12:56:15Z) - Quantum Heterodyne Sensing of Nuclear Spins via Double Resonance [0.0]
ヘテロダインアプローチはスペクトル分解における電子スピン寿命限界を克服するために広く用いられている。
この研究は、NV中心を持つ高磁場ナノスケールヘテロダインNMRプロトコルへの道を開く。
論文 参考訳(メタデータ) (2022-05-20T13:48:59Z) - Nanometer-Scale Nuclear Magnetic Resonance Diffraction with Sub-\AA
ngstrom Precision [0.0]
核磁気共鳴回折(NMRd)を用いたナノMRIの新しいアプローチを提案する。
NMRdを原子スケールで実現することで、NMRの分光能力を利用した材料評価のための強力な新しい方法論が生み出される。
論文 参考訳(メタデータ) (2022-04-01T05:53:52Z) - Unsupervised Spectral Unmixing For Telluric Correction Using A Neural
Network Autoencoder [58.720142291102135]
本研究では,HARPS-N線速度スペクトルから高精度の太陽スペクトルを抽出するニューラルネットワークオートエンコーダ手法を提案する。
論文 参考訳(メタデータ) (2021-11-17T12:54:48Z) - Controlled coherent dynamics of [VO(TPP)], a prototype molecular nuclear
qudit with an electronic ancilla [50.002949299918136]
本稿では,[VO(TPP)](バナジルテトラフェニルポルフィリン酸塩)が量子計算アルゴリズムの実装に適していることを示す。
超微細相互作用によって結合された電子スピン1/2を核スピン7/2に埋め込み、どちらも顕著なコヒーレンスによって特徴づけられる。
論文 参考訳(メタデータ) (2021-03-15T21:38:41Z) - Zero- to ultralow-field nuclear magnetic resonance and its applications [11.963366832132495]
ZULF NMRはサブミクロテラ系における核磁化シグナルを検出する。
スピン交換緩和自由原子磁気センサは、zuLF NMRのための新しい感度検出器を提供する。
ZULF NMRは、最近、化学、生物学、医学、基礎物理学のテストでかなりの注目を集めている。
論文 参考訳(メタデータ) (2020-11-30T16:13:20Z) - Confidence-guided Lesion Mask-based Simultaneous Synthesis of Anatomic
and Molecular MR Images in Patients with Post-treatment Malignant Gliomas [65.64363834322333]
信頼性ガイドSAMR(CG-SAMR)は、病変情報からマルチモーダル解剖学的配列にデータを合成する。
モジュールは中間結果に対する信頼度測定に基づいて合成をガイドする。
実際の臨床データを用いた実験により,提案モデルが最先端の合成法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-08-06T20:20:22Z) - Lesion Mask-based Simultaneous Synthesis of Anatomic and MolecularMR
Images using a GAN [59.60954255038335]
提案するフレームワークは,ストレッチアウトアップサンプリングモジュール,ブレインアトラスエンコーダ,セグメンテーション一貫性モジュール,マルチスケールラベルワイド識別器から構成される。
実際の臨床データを用いた実験により,提案モデルが最先端の合成法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-06-26T02:50:09Z) - Two-Dimensional Single- and Multiple-Quantum Correlation Spectroscopy in
Zero-Field Nuclear Magnetic Resonance [55.41644538483948]
Rb気相セル磁気センサを用いてゼロ磁場で検出された1量子および複数量子相関$J$-spectroscopyを示す。
ゼロフィールドでは、エタノールのスペクトルは炭素イソトポマーの混合物として現れ、相関スペクトルは2つの複合スペクトルを分離するのに有用である。
論文 参考訳(メタデータ) (2020-04-09T10:02:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。