論文の概要: Solvent-Aware 2D NMR Prediction: Leveraging Multi-Tasking Training and Iterative Self-Training Strategies
- arxiv url: http://arxiv.org/abs/2403.11353v1
- Date: Sun, 17 Mar 2024 21:52:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-19 17:17:15.353042
- Title: Solvent-Aware 2D NMR Prediction: Leveraging Multi-Tasking Training and Iterative Self-Training Strategies
- Title(参考訳): 溶媒を意識した2次元NMR予測:マルチタスクトレーニングと反復自己学習戦略の活用
- Authors: Yunrui Li, Hao Xu, Pengyu Hong,
- Abstract要約: 本稿では,原子2DNMRシフトを予測し,実験スペクトルにピークを割り当てる深層学習モデルを訓練するための反復自己学習(IST)手法を提案する。
我々のモデルは2次元NMRを正確に予測できるだけでなく、実験的な2次元NMRスペクトルのアノテートピークも予測できる。
- 参考スコア(独自算出の注目度): 7.470166291890153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nuclear magnetic resonance (NMR) spectroscopy plays a pivotal role in various scientific fields, offering insights into structural information, electronic properties and dynamic behaviors of molecules. Accurate NMR spectrum prediction efficiently produces candidate molecules, enabling chemists to compare them with actual experimental spectra. This process aids in confirming molecular structures or pinpointing discrepancies, guiding further investigation. Machine Learning (ML) has then emerged as a promising alternative approach for predicting atomic NMR chemical shits of molecules given their structures. Although significant progresses have been made in predicting one-dimensional (1D) NMR, two-dimensional (2D) NMR prediction via ML remains a challenge due to the lack of annotated NMR training datasets. To address this gap, we propose an iterative self-training (IST) approach to train a deep learning model for predicting atomic 2DNMR shifts and assigning peaks in experimental spectra. Our model undergoes an initial pre-training phase employing a Multi-Task Training (MTT) approach, which simultaneously leverages annotated 1D NMR datasets of both $^{1}\text{H}$ and $^{13}\text{C}$ spectra to enhance its understanding of NMR spectra. Subsequently, the pre-trained model is utilized to generate pseudo-annotations for unlabelled 2D NMR spectra, which are subsequently used to refine the 2D NMR prediction model. Our approach iterates between annotated unlabelled 2D NMR data and refining our 2D NMR prediction model until convergence. Finally, our model is able to not only accurately predict 2D NMR but also annotate peaks in experimental 2D NMR spectra. Experimental results show that our model is capable of accurately handling medium-sized and large molecules, including polysaccharides, underscoring its effectiveness.
- Abstract(参考訳): 核磁気共鳴(NMR)分光は、様々な科学分野において重要な役割を担い、構造情報、電子的性質、分子の動的挙動に関する洞察を提供する。
正確なNMRスペクトル予測は、候補分子を効率よく生成し、化学者はそれらを実際の実験スペクトルと比較することができる。
このプロセスは分子構造の確認や相違点の特定に役立ち、さらなる研究を導く。
機械学習(ML)は、分子の構造から原子NMR化学的たわごとを予測するための、有望な代替手法として登場した。
1次元(1D)NMRの予測には大きな進歩があったが、注釈付きNMRトレーニングデータセットがないため、MLによる2次元(2D)NMRの予測は依然として課題である。
このギャップに対処するため,原子2次元NMRシフトを予測し,実験スペクトルにピークを割り当てるためのディープラーニングモデルを訓練するための反復自己学習(IST)手法を提案する。
本モデルでは,Multi-Task Training (MTT) アプローチを用いて, NMRスペクトルの理解を深めるために, $^{1}\text{H}$ と $^{13}\text{C}$ spectra のアノテーション付き 1D NMR データセットを同時に利用する。
その後、事前訓練されたモデルを用いて、未標識の2次元NMRスペクトルの擬似アノテーションを生成し、その後、2次元NMR予測モデルを洗練するために使用される。
提案手法は,注釈付き2次元NMRデータと2次元NMR予測モデルを収束するまで精査する。
最後に、我々のモデルは2次元NMRを正確に予測できるだけでなく、実験的な2次元NMRスペクトルのアノテートピークも予測できる。
実験結果から,本モデルでは多糖類を含む中型および大規模分子を精度良く処理できることがわかった。
関連論文リスト
- Equivariant Masked Position Prediction for Efficient Molecular Representation [6.761418610103767]
グラフニューラルネットワーク(GNN)は、計算化学においてかなりの可能性を示している。
Equivariant Masked Position Prediction (EMPP) と呼ばれる新しい自己教師型アプローチを導入する。
EMPPは、より明確に定義され、量子力学的特徴の学習を強化するニュアンスされた位置予測タスクを定式化する。
論文 参考訳(メタデータ) (2025-02-12T08:39:26Z) - Graph-neural-network predictions of solid-state NMR parameters from spherical tensor decomposition [0.0]
核磁気共鳴(NMR)は、物質の局所的な原子構造に敏感な強力な分光法である。
機械学習(ML)は、このような予測を行うための効率的なルートとして登場した。
論文 参考訳(メタデータ) (2024-12-19T17:11:07Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Denoise Pretraining on Nonequilibrium Molecules for Accurate and
Transferable Neural Potentials [8.048439531116367]
より正確で伝達可能なGNNポテンシャル予測を実現するために,非平衡分子配座の事前学習を提案する。
小分子で事前学習したモデルでは、顕著な伝達性を示し、多様な分子系で微調整された場合の性能が向上した。
論文 参考訳(メタデータ) (2023-03-03T21:15:22Z) - Generative structured normalizing flow Gaussian processes applied to
spectroscopic data [4.0773490083614075]
物理科学では、限られた訓練データは将来の観測データを適切に特徴づけることができない。
特に外挿を依頼される場合、モデルが不確実性を適切に示すことは重要である。
火星探査機キュリオシティに搭載されたChemCam装置のレーザ誘起分解分光データに関する方法論を実証した。
論文 参考訳(メタデータ) (2022-12-14T23:57:46Z) - Towards Robust k-Nearest-Neighbor Machine Translation [72.9252395037097]
近年,k-Nearest-Neighbor Machine Translation (kNN-MT)がNMTの重要な研究方向となっている。
その主なアイデアは、NMTモデルを更新することなく翻訳を変更するために、追加のデータストアから有用なキーと値のペアを取得することである。
取り出したノイズペアはモデル性能を劇的に低下させる。
ノイズの影響を軽減するために,頑健なトレーニングを施した信頼性向上kNN-MTモデルを提案する。
論文 参考訳(メタデータ) (2022-10-17T07:43:39Z) - Semi-Supervised Junction Tree Variational Autoencoder for Molecular
Property Prediction [0.0]
本研究では, 化学特性予測における半教師付き学習を容易にするため, 最先端分子生成法であるJT-VAEを改良した。
我々はJT-VAEアーキテクチャを活用し、分子特性予測から条件付き分子生成までのタスクに最適な解釈可能な表現を学習する。
論文 参考訳(メタデータ) (2022-08-10T03:06:58Z) - Graph Neural Networks for Temperature-Dependent Activity Coefficient
Prediction of Solutes in Ionic Liquids [58.720142291102135]
IL中の溶質の温度依存性無限希釈交流を予測するためのGNNを提案する。
我々は、GNNを4万以上のAC値を含むデータベース上でトレーニングし、最先端のMCMと比較する。
GNNとMCMも同様に高い予測性能を達成し、GNNはトレーニング中に考慮されていないILと溶質を含む溶液のACに対して高品質な予測を可能にする。
論文 参考訳(メタデータ) (2022-06-23T15:27:29Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Assessing Graph-based Deep Learning Models for Predicting Flash Point [52.931492216239995]
グラフベースのディープラーニング(GBDL)モデルは初めてフラッシュポイントを予測するために実装された。
MPNNの平均R2と平均絶対誤差(MAE)は、それぞれ2.3%低、2.0K高である。
論文 参考訳(メタデータ) (2020-02-26T06:10:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。