論文の概要: NMIRacle: Multi-modal Generative Molecular Elucidation from IR and NMR Spectra
- arxiv url: http://arxiv.org/abs/2512.19733v1
- Date: Wed, 17 Dec 2025 10:29:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.606299
- Title: NMIRacle: Multi-modal Generative Molecular Elucidation from IR and NMR Spectra
- Title(参考訳): NMIRacle: IRおよびNMRスペクトルからの多モード生成分子解明
- Authors: Federico Ottomano, Yingzhen Li, Alex M. Ganose,
- Abstract要約: NMIRacleは、最小限の仮定でAI駆動分光の最近のパラダイムの上に構築された、2段階の生成フレームワークである。
最初の段階では、NMIRacleはカウントアウェアの断片コードから分子構造を再構築することを学ぶ。
第2段階では、スペクトルエンコーダが入力分光測定値を潜時埋め込みにマッピングする。
この定式化はフラグメントレベルの化学モデリングをスペクトル証拠で橋渡しし、正確な分子予測をもたらす。
- 参考スコア(独自算出の注目度): 13.594833907772783
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecular structure elucidation from spectroscopic data is a long-standing challenge in Chemistry, traditionally requiring expert interpretation. We introduce NMIRacle, a two-stage generative framework that builds upon recent paradigms in AI-driven spectroscopy with minimal assumptions. In the first stage, NMIRacle learns to reconstruct molecular structures from count-aware fragment encodings, which capture both fragment identities and their occurrences. In the second stage, a spectral encoder maps input spectroscopic measurements (IR, 1H-NMR, 13C-NMR) into a latent embedding that conditions the pre-trained generator. This formulation bridges fragment-level chemical modeling with spectral evidence, yielding accurate molecular predictions. Empirical results show that NMIRacle outperforms existing baselines on molecular elucidation, while maintaining robust performance across increasing levels of molecular complexity.
- Abstract(参考訳): 分光データから分子構造を解明することは、伝統的に専門的な解釈を必要とする化学における長年の課題である。
NMIRacleは、最小限の仮定でAI駆動分光の最近のパラダイムの上に構築された、2段階の生成フレームワークである。
最初の段階では、NMIRacleは、断片のアイデンティティとそれらの発生の両方をキャプチャするカウントアウェアの断片コードから分子構造を再構築することを学ぶ。
第2段階では、スペクトルエンコーダが入力分光測定(IR, 1H-NMR, 13C-NMR)を、事前訓練された発電機の条件を満たす潜時埋め込みにマッピングする。
この定式化はフラグメントレベルの化学モデリングをスペクトル証拠で橋渡しし、正確な分子予測をもたらす。
実証実験の結果、NMIRacleは分子の解明において既存のベースラインよりも優れており、分子の複雑さの増大にまたがる堅牢な性能を維持していることがわかった。
関連論文リスト
- Atomic Diffusion Models for Small Molecule Structure Elucidation from NMR Spectra [5.818797900550866]
ChefNMR (Chemical Elucidation From NMR) は、未知の分子の構造を直接予測するエンドツーエンドのフレームワークである。
天然物に含まれる複雑な化学物質群をモデル化するため,111,000以上の天然物に対してシミュレーションされた1次元NMRスペクトルのデータセットを作成した。
ChefNMRは、未通過の精度が65%を超える、挑戦的な天然物化合物の構造を予測する。
論文 参考訳(メタデータ) (2025-12-02T18:59:13Z) - Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.08608779794957]
本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文 参考訳(メタデータ) (2025-11-09T07:25:53Z) - NMR-Solver: Automated Structure Elucidation via Large-Scale Spectral Matching and Physics-Guided Fragment Optimization [24.714189961887215]
核磁気共鳴分光法(英: Nuclear Magnetic Resonance spectroscopy、NMR)は、有機化学において最も強力で広く用いられている分子構造解明法の一つである。
本稿では,小さな有機分子構造を1ドルHおよび13ドルCのNMRスペクトルから自動決定するための,実用的で解釈可能なフレームワークであるNMR-rについて述べる。
論文 参考訳(メタデータ) (2025-08-30T23:59:12Z) - $\text{M}^{2}$LLM: Multi-view Molecular Representation Learning with Large Language Models [59.125833618091846]
分子構造ビュー,分子タスクビュー,分子規則ビューの3つの視点を統合した多視点フレームワークを提案する。
実験によると、$textM2$LLMは、分類タスクと回帰タスクをまたいだ複数のベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-08-12T05:46:47Z) - DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models [68.19129717255053]
本稿では、分子構造解明を条件生成プロセスとして定式化する生成フレームワークであるDiffSpectraについて述べる。
我々の実験では、DiffSpectraが分子構造を正確に解明し、40.76%のトップ-1と99.49%のトップ10を達成している。
論文 参考訳(メタデータ) (2025-07-09T13:57:20Z) - DiffNMR: Diffusion Models for Nuclear Magnetic Resonance Spectra Elucidation [9.321270922757442]
核磁気共鳴分光法 (NMR) は分子構造解明のための中心的な評価法である。
我々は、NMRスペクトルから脱ノボ分子構造を解明する条件付き離散拡散モデルを利用する、新しいエンドツーエンドフレームワークであるDiffNMRを紹介する。
論文 参考訳(メタデータ) (2025-07-09T06:21:36Z) - 2DNMRGym: An Annotated Experimental Dataset for Atom-Level Molecular Representation Learning in 2D NMR via Surrogate Supervision [7.470166291890153]
2DNMRにおける機械学習に基づく表現学習のために設計された最初のアノテート実験データセットである2DNMRGymを紹介する。
2DNMRGymは、サロゲートの監視設定を採用する:モデルは、以前に検証されたメソッドからアルゴリズム生成アノテーションを使用して訓練される。
2Dおよび3D GNNおよびGNN変換器モデルを用いてベンチマーク結果を提供し、将来の作業の強力な基盤を確立する。
論文 参考訳(メタデータ) (2025-05-16T18:02:05Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - TransPeakNet: Solvent-Aware 2D NMR Prediction via Multi-Task Pre-Training and Unsupervised Learning [5.7279868722119325]
2次元NMRにおけるクロスピーク予測のための教師なしトレーニングフレームワークを提案する。
このアプローチでは、1Hと13Cシフトの注釈付き1Dデータセット上でMLモデルを事前トレーニングし、教師なしの方法で微調整する。
479名のエキスパートアノテートHSQCスペクトルの評価は,従来の手法よりもモデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-17T21:52:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。