論文の概要: DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models
- arxiv url: http://arxiv.org/abs/2507.06853v1
- Date: Wed, 09 Jul 2025 13:57:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.607155
- Title: DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models
- Title(参考訳): DiffSpectra:拡散モデルを用いたスペクトルからの分子構造解明
- Authors: Liang Wang, Yu Rong, Tingyang Xu, Zhenyi Zhong, Zhiyuan Liu, Pengju Wang, Deli Zhao, Qiang Liu, Shu Wu, Liang Wang,
- Abstract要約: スペクトルからの分子構造解明は化学の基礎的な問題である。
従来の手法は専門家の解釈に大きく依存し、拡張性に欠ける。
マルチモーダルスペクトルデータから2次元および3次元分子構造を直接推定する生成フレームワークであるDiffSpectraを提案する。
- 参考スコア(独自算出の注目度): 66.41802970528133
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular structure elucidation from spectra is a foundational problem in chemistry, with profound implications for compound identification, synthesis, and drug development. Traditional methods rely heavily on expert interpretation and lack scalability. Pioneering machine learning methods have introduced retrieval-based strategies, but their reliance on finite libraries limits generalization to novel molecules. Generative models offer a promising alternative, yet most adopt autoregressive SMILES-based architectures that overlook 3D geometry and struggle to integrate diverse spectral modalities. In this work, we present DiffSpectra, a generative framework that directly infers both 2D and 3D molecular structures from multi-modal spectral data using diffusion models. DiffSpectra formulates structure elucidation as a conditional generation process. Its denoising network is parameterized by Diffusion Molecule Transformer, an SE(3)-equivariant architecture that integrates topological and geometric information. Conditioning is provided by SpecFormer, a transformer-based spectral encoder that captures intra- and inter-spectral dependencies from multi-modal spectra. Extensive experiments demonstrate that DiffSpectra achieves high accuracy in structure elucidation, recovering exact structures with 16.01% top-1 accuracy and 96.86% top-20 accuracy through sampling. The model benefits significantly from 3D geometric modeling, SpecFormer pre-training, and multi-modal conditioning. These results highlight the effectiveness of spectrum-conditioned diffusion modeling in addressing the challenge of molecular structure elucidation. To our knowledge, DiffSpectra is the first framework to unify multi-modal spectral reasoning and joint 2D/3D generative modeling for de novo molecular structure elucidation.
- Abstract(参考訳): スペクトルからの分子構造解明は化学の基礎的な問題であり、化合物の同定、合成、薬物開発に深く影響している。
従来の手法は専門家の解釈に大きく依存し、拡張性に欠ける。
ピオネリング機械学習手法は検索に基づく手法を導入しているが、有限ライブラリに依存しているため、新しい分子への一般化が制限されている。
生成モデルは有望な代替手段を提供するが、ほとんどのものは3D幾何学を見落とし、多様なスペクトルモードを統合するのに苦労する自動回帰SMILESベースのアーキテクチャを採用する。
本研究では,拡散モデルを用いた多モードスペクトルデータから2次元および3次元分子構造を直接推論する生成フレームワークDiffSpectraを提案する。
DiffSpectraは条件生成プロセスとして構造解明を定式化している。
微分分子変換器(Diffusion Molecule Transformer)は、位相情報と幾何学情報を統合するSE(3)等価なアーキテクチャである。
コンディショニングは、マルチモーダルスペクトルからスペクトル内およびスペクトル間の依存関係をキャプチャするトランスフォーマーベースのスペクトルエンコーダであるSpecFormerによって提供される。
大規模な実験では、DiffSpectraは構造解明の精度が高く、16.01%のトップ1の精度と96.86%のトップ20の精度で正確な構造を復元している。
このモデルは3次元幾何モデリング、SpecFormer事前トレーニング、マルチモーダル条件付けから大きな恩恵を受ける。
これらの結果は,分子構造解明の課題に対処するためのスペクトル条件拡散モデルの有効性を強調した。
我々の知る限り、DiffSpectraはマルチモーダルスペクトル推論を統一する最初のフレームワークであり、デノボ分子構造解明のための2D/3次元共同生成モデルである。
関連論文リスト
- PharMolixFM: All-Atom Foundation Models for Molecular Modeling and Generation [4.402280157389038]
我々は全原子基盤モデルを構築するための統一フレームワークであるPharMolixFMを提案する。
我々のフレームワークは、最先端のマルチモーダル生成モデルを用いた3つの変種を含む。
PharMolixFM-Diffはタンパク質-小分子ドッキングにおける競合予測精度を実現する。
論文 参考訳(メタデータ) (2025-03-12T12:53:43Z) - MolSpectra: Pre-training 3D Molecular Representation with Multi-modal Energy Spectra [48.52871465095181]
エネルギースペクトルを利用して3次元分子表現(MolSpectra)の事前学習を強化することを提案する。
具体的には,マルチスペクトルエンコーダのSpecFormerを提案する。
コントラスト目標を用いた3Dエンコーダとスペクトルエンコーダの出力の調整により,分子の3Dエンコーダの理解を深める。
論文 参考訳(メタデータ) (2025-02-22T16:34:32Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Equivariant Blurring Diffusion for Hierarchical Molecular Conformer Generation [18.394348744611662]
Equivariant Blurring Diffusion (EBD) と呼ばれる新しい生成モデルを導入する。
EBDは、コンフォーマーの微細な原子の詳細をぼかすことによって、断片レベルの粗い粒状構造に向かって進む前進過程を定義する。
薬物様分子のベンチマークにおいて, 最先端デノナイジング拡散モデルとの幾何的および化学的比較によるEBDの有効性を実証した。
論文 参考訳(メタデータ) (2024-10-26T19:17:31Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - Learning transformer-based heterogeneously salient graph representation for multimodal remote sensing image classification [42.15709954199397]
本稿では,変圧器を用いたヘテロジニアサリエントグラフ表現法(THSGR)を提案する。
まず、多モード不均一グラフエンコーダを用いて、非ユークリッド構造の特徴を異種データから符号化する。
自己アテンションフリーなマルチ畳み込み変調器は、効果的かつ効率的な長期依存性モデリングのために設計されている。
論文 参考訳(メタデータ) (2023-11-17T04:06:20Z) - Decoding Structure-Spectrum Relationships with Physically Organized
Latent Spaces [6.36075035468233]
構造スペクトル関係の発見のための半教師付き機械学習手法を開発し,実証した。
本手法は,個々の構造記述子とスペクトル傾向の1対1マッピングを構成する。
RankAAE法は連続的かつ解釈可能な潜在空間を生成し、各次元は個々の構造記述子を追跡することができる。
論文 参考訳(メタデータ) (2023-01-11T21:30:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。