論文の概要: A large-scale foundation model enables simulation-to-real adaptation for nuclear magnetic resonance-based molecular structure analysis
- arxiv url: http://arxiv.org/abs/2606.20756v1
- Date: Thu, 18 Jun 2026 07:58:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 13:11:56.943
- Title: A large-scale foundation model enables simulation-to-real adaptation for nuclear magnetic resonance-based molecular structure analysis
- Title(参考訳): 大規模基礎モデルにより核磁気共鳴に基づく分子構造解析のためのシミュレーションから現実への適応が可能となる
- Authors: Chen Yang, Zheng Fang, Hanyu Sun, Fanjie Xu, Hongxin Xiang, Hanyu Gao, Xiangxiang Zeng, Yuqiang Li, Xiaojian Wang, Jun Xia,
- Abstract要約: 我々は、NMRのための大規模基礎モデルであるUltraNMRを導入し、一般化可能なスペクトル表現を学習する。
我々は、UltraNMRが常に最先端の性能を示し、下流データ上で直接訓練されたUltraNMRの変種よりも明らかに優れていることを示す。
現実世界の応用において、UltraNMRは中国薬局で記録された2つの未知の天然物の構造解明を促進する。
- 参考スコア(独自算出の注目度): 18.060510803989228
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nuclear Magnetic Resonance (NMR) spectroscopy is a powerful tool for molecular structure analysis, and spectral artificial intelligence offers great potential for its rapid and automated interpretation. However, the scarcity of experimental NMR datasets has constrained deep learning in this domain to narrow, task-specific applications that lack broad generalization. Here, we introduce UltraNMR, a large-scale foundation model for NMR that leverages the intrinsic properties of NMR spectra to learn generalizable spectral representations. We collected 158 million paired simulated $^{1}$H and $^{13}$C NMR spectra to train UltraNMR, employing multiple domain-specific pre-training objectives. UltraNMR captures both intra-spectral and inter-spectral dependencies, enabling seamless simulation-to-real adaptation. We demonstrate that adapting UltraNMR to a range of molecular structure analysis tasks on experimental NMR spectra consistently yields state-of-the-art performance and clearly outperforms UltraNMR variants trained directly on downstream data without simulation pre-training. We also construct a large-scale NMR spectral vector library by encoding simulated NMR spectra using UltraNMR, covering 94 million unique molecules and enabling effective structure-aware retrieval. In real-world applications, UltraNMR facilitates the structural elucidation of two previously unknown natural products from Chinese herbal medicines recorded in the Chinese Pharmacopoeia. These results suggest that large-scale simulation pre-training can effectively bridge the simulation-to-real gap, enabling robust and generalizable molecular structure analysis of real-world NMR spectra.
- Abstract(参考訳): 核磁気共鳴分光法(NMR)は分子構造解析の強力なツールであり、スペクトル人工知能はその迅速かつ自動化された解釈に大きな可能性を秘めている。
しかし、実験的なNMRデータセットの不足により、この領域でのディープラーニングは、広範囲の一般化に欠ける狭いタスク固有のアプリケーションに制限されている。
本稿では、NMRスペクトルの固有特性を利用して一般化可能なスペクトル表現を学習するNMRの大規模基礎モデルであるUltraNMRを紹介する。
我々はUltraNMRのトレーニングに、複数のドメイン固有の事前学習目的を用いて、15800万対のシミュレーションされた$^{1}$Hと$^{13}$C NMRスペクトルを収集した。
UltraNMRは、スペクトル内およびスペクトル間依存関係の両方をキャプチャし、シームレスなシミュレーションから現実への適応を可能にする。
実験NMRスペクトル上での様々な分子構造解析タスクにUltraNMRを適用すると、常に最先端の性能が得られ、シミュレーション事前訓練なしで下流データ上で直接訓練されたUltraNMR変種よりも明らかに優れていることを示す。
また、UltraNMRを用いてNMRスペクトルを符号化し、94万個のユニークな分子をカバーし、効率的な構造認識検索を可能にする大規模NMRスペクトルベクトルライブラリを構築した。
現実世界の応用において、UltraNMRは中国薬局で記録された2つの未知の天然物の構造解明を促進する。
これらの結果は、大規模シミュレーション事前学習がシミュレーションと実際のギャップを効果的に橋渡しし、実世界のNMRスペクトルの堅牢で一般化可能な分子構造解析を可能にすることを示唆している。
関連論文リスト
- NMRTrans: Structure Elucidation from Experimental NMR Spectra via Set Transformers [41.6373573055135]
我々は化学文献から抽出した実験的な1ドルHと13ドルCのスペクトルの大規模コーパスであるNMRSpecを構築した。
NMRTransは、スペクトルを無秩序なピークセットとしてモデル化し、モデルの帰納バイアスとNMRの物理的性質を一致させる。
論文 参考訳(メタデータ) (2026-02-10T03:37:41Z) - Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.08608779794957]
本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文 参考訳(メタデータ) (2025-11-09T07:25:53Z) - NMR-Solver: Automated Structure Elucidation via Large-Scale Spectral Matching and Physics-Guided Fragment Optimization [24.714189961887215]
核磁気共鳴分光法(英: Nuclear Magnetic Resonance spectroscopy、NMR)は、有機化学において最も強力で広く用いられている分子構造解明法の一つである。
本稿では,小さな有機分子構造を1ドルHおよび13ドルCのNMRスペクトルから自動決定するための,実用的で解釈可能なフレームワークであるNMR-rについて述べる。
論文 参考訳(メタデータ) (2025-08-30T23:59:12Z) - DiffNMR: Diffusion Models for Nuclear Magnetic Resonance Spectra Elucidation [9.321270922757442]
核磁気共鳴分光法 (NMR) は分子構造解明のための中心的な評価法である。
我々は、NMRスペクトルから脱ノボ分子構造を解明する条件付き離散拡散モデルを利用する、新しいエンドツーエンドフレームワークであるDiffNMRを紹介する。
論文 参考訳(メタデータ) (2025-07-09T06:21:36Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - TransPeakNet: Solvent-Aware 2D NMR Prediction via Multi-Task Pre-Training and Unsupervised Learning [5.7279868722119325]
2次元NMRにおけるクロスピーク予測のための教師なしトレーニングフレームワークを提案する。
このアプローチでは、1Hと13Cシフトの注釈付き1Dデータセット上でMLモデルを事前トレーニングし、教師なしの方法で微調整する。
479名のエキスパートアノテートHSQCスペクトルの評価は,従来の手法よりもモデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-17T21:52:51Z) - Simulation of absorption spectra of molecular aggregates: a Hierarchy of
Stochastic Pure States approach [68.8204255655161]
純粋な状態の階層(HOPS)は、局所的な軌跡に基づく正式な正確な解を提供する。
大集合体における吸収スペクトルのシミュレーションのためにHOPSの局在を爆発させるには、正規化軌道の定式化が必要である。
論文 参考訳(メタデータ) (2021-11-01T16:59:54Z) - Confidence-guided Lesion Mask-based Simultaneous Synthesis of Anatomic
and Molecular MR Images in Patients with Post-treatment Malignant Gliomas [65.64363834322333]
信頼性ガイドSAMR(CG-SAMR)は、病変情報からマルチモーダル解剖学的配列にデータを合成する。
モジュールは中間結果に対する信頼度測定に基づいて合成をガイドする。
実際の臨床データを用いた実験により,提案モデルが最先端の合成法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-08-06T20:20:22Z) - Lesion Mask-based Simultaneous Synthesis of Anatomic and MolecularMR
Images using a GAN [59.60954255038335]
提案するフレームワークは,ストレッチアウトアップサンプリングモジュール,ブレインアトラスエンコーダ,セグメンテーション一貫性モジュール,マルチスケールラベルワイド識別器から構成される。
実際の臨床データを用いた実験により,提案モデルが最先端の合成法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-06-26T02:50:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。