論文の概要: NMIRacle: Multi-modal Generative Molecular Elucidation from IR and NMR Spectra
- arxiv url: http://arxiv.org/abs/2512.19733v1
- Date: Wed, 17 Dec 2025 10:29:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.606299
- Title: NMIRacle: Multi-modal Generative Molecular Elucidation from IR and NMR Spectra
- Title(参考訳): NMIRacle: IRおよびNMRスペクトルからの多モード生成分子解明
- Authors: Federico Ottomano, Yingzhen Li, Alex M. Ganose,
- Abstract要約: NMIRacleは、最小限の仮定でAI駆動分光の最近のパラダイムの上に構築された、2段階の生成フレームワークである。
最初の段階では、NMIRacleはカウントアウェアの断片コードから分子構造を再構築することを学ぶ。
第2段階では、スペクトルエンコーダが入力分光測定値を潜時埋め込みにマッピングする。
この定式化はフラグメントレベルの化学モデリングをスペクトル証拠で橋渡しし、正確な分子予測をもたらす。
- 参考スコア(独自算出の注目度): 13.594833907772783
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecular structure elucidation from spectroscopic data is a long-standing challenge in Chemistry, traditionally requiring expert interpretation. We introduce NMIRacle, a two-stage generative framework that builds upon recent paradigms in AI-driven spectroscopy with minimal assumptions. In the first stage, NMIRacle learns to reconstruct molecular structures from count-aware fragment encodings, which capture both fragment identities and their occurrences. In the second stage, a spectral encoder maps input spectroscopic measurements (IR, 1H-NMR, 13C-NMR) into a latent embedding that conditions the pre-trained generator. This formulation bridges fragment-level chemical modeling with spectral evidence, yielding accurate molecular predictions. Empirical results show that NMIRacle outperforms existing baselines on molecular elucidation, while maintaining robust performance across increasing levels of molecular complexity.
- Abstract(参考訳): 分光データから分子構造を解明することは、伝統的に専門的な解釈を必要とする化学における長年の課題である。
NMIRacleは、最小限の仮定でAI駆動分光の最近のパラダイムの上に構築された、2段階の生成フレームワークである。
最初の段階では、NMIRacleは、断片のアイデンティティとそれらの発生の両方をキャプチャするカウントアウェアの断片コードから分子構造を再構築することを学ぶ。
第2段階では、スペクトルエンコーダが入力分光測定(IR, 1H-NMR, 13C-NMR)を、事前訓練された発電機の条件を満たす潜時埋め込みにマッピングする。
この定式化はフラグメントレベルの化学モデリングをスペクトル証拠で橋渡しし、正確な分子予測をもたらす。
実証実験の結果、NMIRacleは分子の解明において既存のベースラインよりも優れており、分子の複雑さの増大にまたがる堅牢な性能を維持していることがわかった。
関連論文リスト
- How well can off-the-shelf LLMs elucidate molecular structures from mass spectra using chain-of-thought reasoning? [51.286853421822705]
大規模言語モデル (LLM) は推論集約的な科学的タスクを約束するが、化学的解釈の能力はまだ不明である。
我々は、分子構造を予測するために、LLMが質量スペクトルデータに対してどのように理由を持つかを評価する、Chain-of-Thought(CoT)プロンプトフレームワークとベンチマークを導入する。
SMILESの妥当性, 式整合性, 構造的類似性の指標による評価の結果, LLMは合成学的に有効で, 部分的に可視な構造を生成できるが, 分子予測の正確性やリンク推論を達成できないことがわかった。
論文 参考訳(メタデータ) (2026-01-09T20:08:42Z) - Atomic Diffusion Models for Small Molecule Structure Elucidation from NMR Spectra [5.818797900550866]
ChefNMR (Chemical Elucidation From NMR) は、未知の分子の構造を直接予測するエンドツーエンドのフレームワークである。
天然物に含まれる複雑な化学物質群をモデル化するため,111,000以上の天然物に対してシミュレーションされた1次元NMRスペクトルのデータセットを作成した。
ChefNMRは、未通過の精度が65%を超える、挑戦的な天然物化合物の構造を予測する。
論文 参考訳(メタデータ) (2025-12-02T18:59:13Z) - Mamba-driven multi-perspective structural understanding for molecular ground-state conformation prediction [69.32436472760712]
本稿では,マンバ駆動型多面的構造理解(MPSU-Mamba)による分子基底状態の局在化手法を提案する。
複雑で多様な分子に対しては、対応する分子構造の包括的認識を構築するために、3種類の専用の走査戦略が検討されている。
QM9 と Molecule3D データセットの実験結果から,MPSU-Mamba が既存の手法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-11-10T11:18:32Z) - Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.08608779794957]
本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文 参考訳(メタデータ) (2025-11-09T07:25:53Z) - NMR-Solver: Automated Structure Elucidation via Large-Scale Spectral Matching and Physics-Guided Fragment Optimization [24.714189961887215]
核磁気共鳴分光法(英: Nuclear Magnetic Resonance spectroscopy、NMR)は、有機化学において最も強力で広く用いられている分子構造解明法の一つである。
本稿では,小さな有機分子構造を1ドルHおよび13ドルCのNMRスペクトルから自動決定するための,実用的で解釈可能なフレームワークであるNMR-rについて述べる。
論文 参考訳(メタデータ) (2025-08-30T23:59:12Z) - $\text{M}^{2}$LLM: Multi-view Molecular Representation Learning with Large Language Models [59.125833618091846]
分子構造ビュー,分子タスクビュー,分子規則ビューの3つの視点を統合した多視点フレームワークを提案する。
実験によると、$textM2$LLMは、分類タスクと回帰タスクをまたいだ複数のベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-08-12T05:46:47Z) - DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models [68.19129717255053]
本稿では、分子構造解明を条件生成プロセスとして定式化する生成フレームワークであるDiffSpectraについて述べる。
我々の実験では、DiffSpectraが分子構造を正確に解明し、40.76%のトップ-1と99.49%のトップ10を達成している。
論文 参考訳(メタデータ) (2025-07-09T13:57:20Z) - DiffNMR: Diffusion Models for Nuclear Magnetic Resonance Spectra Elucidation [9.321270922757442]
核磁気共鳴分光法 (NMR) は分子構造解明のための中心的な評価法である。
我々は、NMRスペクトルから脱ノボ分子構造を解明する条件付き離散拡散モデルを利用する、新しいエンドツーエンドフレームワークであるDiffNMRを紹介する。
論文 参考訳(メタデータ) (2025-07-09T06:21:36Z) - 2DNMRGym: An Annotated Experimental Dataset for Atom-Level Molecular Representation Learning in 2D NMR via Surrogate Supervision [7.470166291890153]
2DNMRにおける機械学習に基づく表現学習のために設計された最初のアノテート実験データセットである2DNMRGymを紹介する。
2DNMRGymは、サロゲートの監視設定を採用する:モデルは、以前に検証されたメソッドからアルゴリズム生成アノテーションを使用して訓練される。
2Dおよび3D GNNおよびGNN変換器モデルを用いてベンチマーク結果を提供し、将来の作業の強力な基盤を確立する。
論文 参考訳(メタデータ) (2025-05-16T18:02:05Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Unraveling Molecular Structure: A Multimodal Spectroscopic Dataset for Chemistry [0.1747623282473278]
このデータセットは、特許データから化学反応から抽出された790k分子の1ドルH-NMR、13ドルC-NMR、HSQC-NMR、赤外線、質量スペクトルからなる。
本研究では, 構造解明, 対象分子のスペクトル予測, 機能群予測などの単一モダリティタスクを評価するためのベンチマークを行う。
論文 参考訳(メタデータ) (2024-07-04T12:52:48Z) - TransPeakNet: Solvent-Aware 2D NMR Prediction via Multi-Task Pre-Training and Unsupervised Learning [5.7279868722119325]
2次元NMRにおけるクロスピーク予測のための教師なしトレーニングフレームワークを提案する。
このアプローチでは、1Hと13Cシフトの注釈付き1Dデータセット上でMLモデルを事前トレーニングし、教師なしの方法で微調整する。
479名のエキスパートアノテートHSQCスペクトルの評価は,従来の手法よりもモデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-17T21:52:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。