論文の概要: NMRTrans: Structure Elucidation from Experimental NMR Spectra via Set Transformers
- arxiv url: http://arxiv.org/abs/2602.10158v1
- Date: Tue, 10 Feb 2026 03:37:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.198332
- Title: NMRTrans: Structure Elucidation from Experimental NMR Spectra via Set Transformers
- Title(参考訳): NMRTrans:集合変換器による実験NMRスペクトルからの構造解明
- Authors: Liujia Yang, Zhuo Yang, Jiaqing Xie, Yubin Wang, Ben Gao, Tianfan Fu, Xingjian Wei, Jiaxing Sun, Jiang Wu, Conghui He, Yuqiang Li, Qinying Gu,
- Abstract要約: 我々は化学文献から抽出した実験的な1ドルHと13ドルCのスペクトルの大規模コーパスであるNMRSpecを構築した。
NMRTransは、スペクトルを無秩序なピークセットとしてモデル化し、モデルの帰納バイアスとNMRの物理的性質を一致させる。
- 参考スコア(独自算出の注目度): 41.6373573055135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nuclear Magnetic Resonance (NMR) spectroscopy is fundamental for molecular structure elucidation, yet interpreting spectra at scale remains time-consuming and highly expertise-dependent. While recent spectrum-as-language modeling and retrieval-based methods have shown promise, they rely heavily on large corpora of computed spectra and exhibit notable performance drops when applied to experimental measurements. To address these issues, we build NMRSpec, a large-scale corpus of experimental $^1$H and $^{13}$C spectra mined from chemical literature, and propose NMRTrans, which models spectra as unordered peak sets and aligns the model's inductive bias with the physical nature of NMR. To our best knowledge, NMRTrans is the first NMR Transformer trained solely on large-scale experimental spectra and achieves state-of-the-art performance on experimental benchmarks, improving Top-10 Accuracy over the strongest baseline by +17.82 points (61.15% vs. 43.33%), and underscoring the importance of experimental data and structure-aware architectures for reliable NMR structure elucidation.
- Abstract(参考訳): 核磁気共鳴分光法(NMR)は分子構造解明の基礎であるが、スケールでのスペクトルの解釈には時間を要する。
近年のスペクトル・アズ・ランゲージ・モデリングと検索に基づく手法は有望であるが、計算されたスペクトルの大きなコーパスに大きく依存しており、実験的な測定に適用すると顕著な性能低下を示す。
これらの問題に対処するため、実験的な$^1$Hおよび$^{13}$Cスペクトルの大規模コーパスであるNMRSpecを構築し、未順序ピークセットとしてスペクトルをモデル化し、モデルの誘導バイアスをNMRの物理的性質と整合させるNMRTransを提案する。
我々の知る限り、NMRTransは大規模な実験スペクトルのみに基づいて訓練された最初のNMRトランスフォーマーであり、実験ベンチマークで最先端のパフォーマンスを達成し、+17.82ポイント(61.15%対43.33%)以上の最強ベースラインでのTop-10精度を改善し、信頼性の高いNMR構造解明のための実験データと構造認識アーキテクチャの重要性を強調した。
関連論文リスト
- NMIRacle: Multi-modal Generative Molecular Elucidation from IR and NMR Spectra [13.594833907772783]
NMIRacleは、最小限の仮定でAI駆動分光の最近のパラダイムの上に構築された、2段階の生成フレームワークである。
最初の段階では、NMIRacleはカウントアウェアの断片コードから分子構造を再構築することを学ぶ。
第2段階では、スペクトルエンコーダが入力分光測定値を潜時埋め込みにマッピングする。
この定式化はフラグメントレベルの化学モデリングをスペクトル証拠で橋渡しし、正確な分子予測をもたらす。
論文 参考訳(メタデータ) (2025-12-17T10:29:39Z) - Atomic Diffusion Models for Small Molecule Structure Elucidation from NMR Spectra [5.818797900550866]
ChefNMR (Chemical Elucidation From NMR) は、未知の分子の構造を直接予測するエンドツーエンドのフレームワークである。
天然物に含まれる複雑な化学物質群をモデル化するため,111,000以上の天然物に対してシミュレーションされた1次元NMRスペクトルのデータセットを作成した。
ChefNMRは、未通過の精度が65%を超える、挑戦的な天然物化合物の構造を予測する。
論文 参考訳(メタデータ) (2025-12-02T18:59:13Z) - Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.08608779794957]
本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文 参考訳(メタデータ) (2025-11-09T07:25:53Z) - NMR-Solver: Automated Structure Elucidation via Large-Scale Spectral Matching and Physics-Guided Fragment Optimization [24.714189961887215]
核磁気共鳴分光法(英: Nuclear Magnetic Resonance spectroscopy、NMR)は、有機化学において最も強力で広く用いられている分子構造解明法の一つである。
本稿では,小さな有機分子構造を1ドルHおよび13ドルCのNMRスペクトルから自動決定するための,実用的で解釈可能なフレームワークであるNMR-rについて述べる。
論文 参考訳(メタデータ) (2025-08-30T23:59:12Z) - DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models [68.19129717255053]
本稿では、分子構造解明を条件生成プロセスとして定式化する生成フレームワークであるDiffSpectraについて述べる。
我々の実験では、DiffSpectraが分子構造を正確に解明し、40.76%のトップ-1と99.49%のトップ10を達成している。
論文 参考訳(メタデータ) (2025-07-09T13:57:20Z) - TransPeakNet: Solvent-Aware 2D NMR Prediction via Multi-Task Pre-Training and Unsupervised Learning [5.7279868722119325]
2次元NMRにおけるクロスピーク予測のための教師なしトレーニングフレームワークを提案する。
このアプローチでは、1Hと13Cシフトの注釈付き1Dデータセット上でMLモデルを事前トレーニングし、教師なしの方法で微調整する。
479名のエキスパートアノテートHSQCスペクトルの評価は,従来の手法よりもモデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-17T21:52:51Z) - SpectralNeRF: Physically Based Spectral Rendering with Neural Radiance
Field [70.15900280156262]
本稿では,新しいスペクトルの観点から,高品質な物理ベースレンダリングのためのエンドツーエンドニューラルラジアンスフィールド(NeRF)アーキテクチャを提案する。
スペクトルNeRFは、合成データセットと実データセットの新しいビューを合成する際に、最近のNeRFベースの方法よりも優れている。
論文 参考訳(メタデータ) (2023-12-14T07:19:31Z) - Two-Dimensional Single- and Multiple-Quantum Correlation Spectroscopy in
Zero-Field Nuclear Magnetic Resonance [55.41644538483948]
Rb気相セル磁気センサを用いてゼロ磁場で検出された1量子および複数量子相関$J$-spectroscopyを示す。
ゼロフィールドでは、エタノールのスペクトルは炭素イソトポマーの混合物として現れ、相関スペクトルは2つの複合スペクトルを分離するのに有用である。
論文 参考訳(メタデータ) (2020-04-09T10:02:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。