論文の概要: DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models
- arxiv url: http://arxiv.org/abs/2507.06853v2
- Date: Wed, 05 Nov 2025 11:17:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-06 16:07:39.676224
- Title: DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models
- Title(参考訳): DiffSpectra:拡散モデルを用いたスペクトルからの分子構造解明
- Authors: Liang Wang, Yu Rong, Tingyang Xu, Zhenyi Zhong, Zhiyuan Liu, Pengju Wang, Deli Zhao, Qiang Liu, Shu Wu, Liang Wang, Yang Zhang,
- Abstract要約: 本稿では、分子構造解明を条件生成プロセスとして定式化する生成フレームワークであるDiffSpectraについて述べる。
我々の実験では、DiffSpectraが分子構造を正確に解明し、40.76%のトップ-1と99.49%のトップ10を達成している。
- 参考スコア(独自算出の注目度): 68.19129717255053
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular structure elucidation from spectra is a fundamental challenge in molecular science. Conventional approaches rely heavily on expert interpretation and lack scalability, while retrieval-based machine learning approaches remain constrained by limited reference libraries. Generative models offer a promising alternative, yet most adopt autoregressive architectures that overlook 3D geometry and struggle to integrate diverse spectral modalities. In this work, we present DiffSpectra, a generative framework that formulates molecular structure elucidation as a conditional generation process, directly inferring 2D and 3D molecular structures from multi-modal spectra using diffusion models. Its denoising network is parameterized by the Diffusion Molecule Transformer, an SE(3)-equivariant architecture for geometric modeling, conditioned by SpecFormer, a Transformer-based spectral encoder capturing multi-modal spectral dependencies. Extensive experiments demonstrate that DiffSpectra accurately elucidates molecular structures, achieving 40.76% top-1 and 99.49% top-10 accuracy. Its performance benefits substantially from 3D geometric modeling, SpecFormer pre-training, and multi-modal conditioning. To our knowledge, DiffSpectra is the first framework that unifies multi-modal spectral reasoning and joint 2D/3D generative modeling for de novo molecular structure elucidation.
- Abstract(参考訳): スペクトルからの分子構造解明は分子科学における根本的な課題である。
従来のアプローチは専門家の解釈とスケーラビリティの欠如に大きく依存しているが、検索ベースの機械学習アプローチは限られた参照ライブラリによって制約されている。
生成モデルは有望な代替手段を提供するが、ほとんどの場合、3D幾何学を見落とし、多様なスペクトルモダリティを統合するのに苦労する自動回帰アーキテクチャを採用する。
本研究では,分子構造解明を条件生成プロセスとして定式化する生成フレームワークであるDiffSpectraについて,拡散モデルを用いた多モードスペクトルから直接2次元および3次元分子構造を推定する。
ディフュージョン・モレクル・トランスフォーマー(Diffusion Molecule Transformer, SE(3)-equivariant architecture for geometry modeling)は、トランスフォーマーベースのスペクトルエンコーダであり、マルチモーダルなスペクトル依存をキャプチャする。
大規模な実験により、DiffSpectraは分子構造を正確に解明し、40.76%のトップ-1と99.49%のトップ10の精度を達成した。
その性能は3D幾何モデリング、SpecFormer事前トレーニング、マルチモーダル条件付けから大きく恩恵を受ける。
我々の知る限り、DiffSpectraはデノボ分子構造解明のためのマルチモーダルスペクトル推論と2D/3D共同生成モデリングを統合する最初のフレームワークである。
関連論文リスト
- PharMolixFM: All-Atom Foundation Models for Molecular Modeling and Generation [4.402280157389038]
我々は全原子基盤モデルを構築するための統一フレームワークであるPharMolixFMを提案する。
我々のフレームワークは、最先端のマルチモーダル生成モデルを用いた3つの変種を含む。
PharMolixFM-Diffはタンパク質-小分子ドッキングにおける競合予測精度を実現する。
論文 参考訳(メタデータ) (2025-03-12T12:53:43Z) - MolSpectra: Pre-training 3D Molecular Representation with Multi-modal Energy Spectra [48.52871465095181]
エネルギースペクトルを利用して3次元分子表現(MolSpectra)の事前学習を強化することを提案する。
具体的には,マルチスペクトルエンコーダのSpecFormerを提案する。
コントラスト目標を用いた3Dエンコーダとスペクトルエンコーダの出力の調整により,分子の3Dエンコーダの理解を深める。
論文 参考訳(メタデータ) (2025-02-22T16:34:32Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Equivariant Blurring Diffusion for Hierarchical Molecular Conformer Generation [18.394348744611662]
Equivariant Blurring Diffusion (EBD) と呼ばれる新しい生成モデルを導入する。
EBDは、コンフォーマーの微細な原子の詳細をぼかすことによって、断片レベルの粗い粒状構造に向かって進む前進過程を定義する。
薬物様分子のベンチマークにおいて, 最先端デノナイジング拡散モデルとの幾何的および化学的比較によるEBDの有効性を実証した。
論文 参考訳(メタデータ) (2024-10-26T19:17:31Z) - Structure Language Models for Protein Conformation Generation [66.42864253026053]
伝統的な物理学に基づくシミュレーション手法は、しばしばサンプリング平衡整合に苦しむ。
深い生成モデルは、より効率的な代替としてタンパク質のコンホメーションを生成することを約束している。
本稿では,効率的なタンパク質コンホメーション生成のための新しいフレームワークとして構造言語モデリングを紹介する。
論文 参考訳(メタデータ) (2024-10-24T03:38:51Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - Learning transformer-based heterogeneously salient graph representation for multimodal remote sensing image classification [42.15709954199397]
本稿では,変圧器を用いたヘテロジニアサリエントグラフ表現法(THSGR)を提案する。
まず、多モード不均一グラフエンコーダを用いて、非ユークリッド構造の特徴を異種データから符号化する。
自己アテンションフリーなマルチ畳み込み変調器は、効果的かつ効率的な長期依存性モデリングのために設計されている。
論文 参考訳(メタデータ) (2023-11-17T04:06:20Z) - MUDiff: Unified Diffusion for Complete Molecule Generation [104.7021929437504]
本稿では,原子の特徴,2次元離散分子構造,および3次元連続分子座標を含む分子の包括的表現を生成する新しいモデルを提案する。
拡散過程を認知するための新しいグラフトランスフォーマーアーキテクチャを提案する。
我々のモデルは、安定で多様な分子を設計するための有望なアプローチであり、分子モデリングの幅広いタスクに適用できる。
論文 参考訳(メタデータ) (2023-04-28T04:25:57Z) - Decoding Structure-Spectrum Relationships with Physically Organized
Latent Spaces [6.36075035468233]
構造スペクトル関係の発見のための半教師付き機械学習手法を開発し,実証した。
本手法は,個々の構造記述子とスペクトル傾向の1対1マッピングを構成する。
RankAAE法は連続的かつ解釈可能な潜在空間を生成し、各次元は個々の構造記述子を追跡することができる。
論文 参考訳(メタデータ) (2023-01-11T21:30:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。