論文の概要: De Novo Molecular Generation from Mass Spectra via Many-Body Enhanced Diffusion
- arxiv url: http://arxiv.org/abs/2602.01643v1
- Date: Mon, 02 Feb 2026 05:00:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.912086
- Title: De Novo Molecular Generation from Mass Spectra via Many-Body Enhanced Diffusion
- Title(参考訳): 多体拡散による質量スペクトルからのデノボ分子生成
- Authors: Xichen Sun, Wentao Wei, Jiahua Rao, Jiancong Xie, Yuedong Yang,
- Abstract要約: 質量スペクトルからのデノボ分子構造生成のための多値拡散フレームワークMBGenを提案する。
多体アテンション機構と高次エッジモデリングを統合することで、MBGenはMS/MSスペクトルに符号化された豊富な構造情報を包括的に活用する。
提案手法は,高次相互作用を効果的に捉え,複雑な異性体および非局所断片化情報に対する感度を高める。
- 参考スコア(独自算出の注目度): 10.739105148401629
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecular structure generation from mass spectrometry is fundamental for understanding cellular metabolism and discovering novel compounds. Although tandem mass spectrometry (MS/MS) enables the high-throughput acquisition of fragment fingerprints, these spectra often reflect higher-order interactions involving the concerted cleavage of multiple atoms and bonds-crucial for resolving complex isomers and non-local fragmentation mechanisms. However, most existing methods adopt atom-centric and pairwise interaction modeling, overlooking higher-order edge interactions and lacking the capacity to systematically capture essential many-body characteristics for structure generation. To overcome these limitations, we present MBGen, a Many-Body enhanced diffusion framework for de novo molecular structure Generation from mass spectra. By integrating a many-body attention mechanism and higher-order edge modeling, MBGen comprehensively leverages the rich structural information encoded in MS/MS spectra, enabling accurate de novo generation and isomer differentiation for novel molecules. Experimental results on the NPLIB1 and MassSpecGym benchmarks demonstrate that MBGen achieves superior performance, with improvements of up to 230% over state-of-the-art methods, highlighting the scientific value and practical utility of many-body modeling for mass spectrometry-based molecular generation. Further analysis and ablation studies show that our approach effectively captures higher-order interactions and exhibits enhanced sensitivity to complex isomeric and non-local fragmentation information.
- Abstract(参考訳): 質量分析から分子構造を生成することは、細胞の代謝を理解し、新しい化合物を発見するのに重要である。
タンデム質量分析法(MS/MS)は、フラグメント指紋の高スループット取得を可能にするが、これらのスペクトルは、複雑な異性体や非局所的なフラグメント化機構を解決するために、複数の原子の連成切断と結合-クレシアルを含む高次相互作用を反映することが多い。
しかし、既存のほとんどの手法では原子中心・対相互作用モデリングを採用しており、高次エッジ相互作用を見落とし、構造生成に不可欠な多体特性を体系的に捉える能力が欠如している。
これらの制約を克服するために,質量スペクトルからデノボ分子構造を生成するためのMulti-Body拡張拡散フレームワークMBGenを提案する。
多体アテンション機構と高次エッジモデリングを統合することで、MBGenはMS/MSスペクトルに符号化された豊富な構造情報を包括的に活用し、新規分子の正確なデノボ生成と異性化を可能にする。
NPLIB1およびMassSpecGymベンチマーク実験の結果、MBGenは最先端の手法よりも最大230%向上し、質量分析に基づく分子生成のための多体モデリングの科学的価値と実用性を強調した。
さらなる分析およびアブレーション研究により,本手法は高次相互作用を効果的に捉え,複素異性体および非局所断片化情報に対する高感度性を示すことが明らかとなった。
関連論文リスト
- NMIRacle: Multi-modal Generative Molecular Elucidation from IR and NMR Spectra [13.594833907772783]
NMIRacleは、最小限の仮定でAI駆動分光の最近のパラダイムの上に構築された、2段階の生成フレームワークである。
最初の段階では、NMIRacleはカウントアウェアの断片コードから分子構造を再構築することを学ぶ。
第2段階では、スペクトルエンコーダが入力分光測定値を潜時埋め込みにマッピングする。
この定式化はフラグメントレベルの化学モデリングをスペクトル証拠で橋渡しし、正確な分子予測をもたらす。
論文 参考訳(メタデータ) (2025-12-17T10:29:39Z) - Mamba-driven multi-perspective structural understanding for molecular ground-state conformation prediction [69.32436472760712]
本稿では,マンバ駆動型多面的構造理解(MPSU-Mamba)による分子基底状態の局在化手法を提案する。
複雑で多様な分子に対しては、対応する分子構造の包括的認識を構築するために、3種類の専用の走査戦略が検討されている。
QM9 と Molecule3D データセットの実験結果から,MPSU-Mamba が既存の手法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-11-10T11:18:32Z) - Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.08608779794957]
本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文 参考訳(メタデータ) (2025-11-09T07:25:53Z) - Test-Time Tuned Language Models Enable End-to-end De Novo Molecular Structure Generation from MS/MS Spectra [31.563216077422084]
タンデム質量分析法は、代謝学、天然物発見、環境分析などの重要な分野における未知化合物の同定を可能にする。
テスト時間チューニングを活用することで,事前学習されたトランスフォーマーモデルの学習を向上し,このギャップに対処するフレームワークを導入する。
我々は、NPLIB1とMassSpecGymの2つの人気のあるベンチマークで、DiffMSのデファクトステート・オブ・ザ・アーティカルアプローチを100%と20%上回った。
論文 参考訳(メタデータ) (2025-10-27T18:25:36Z) - MS-BART: Unified Modeling of Mass Spectra and Molecules for Structure Elucidation [20.973121120131875]
大規模事前学習は、他の領域におけるデータの不足に対処するのに有効であることが証明されている。
質量スペクトルと分子構造を共有トークン語彙にマッピングする統合モデリングフレームワークMS-BARTを提案する。
大規模な評価では、MS-BARTはMassSpecGymとNPLIB1の5/12キーメトリクスでSOTA性能を達成している。
論文 参考訳(メタデータ) (2025-10-23T14:45:28Z) - DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models [68.19129717255053]
本稿では、分子構造解明を条件生成プロセスとして定式化する生成フレームワークであるDiffSpectraについて述べる。
我々の実験では、DiffSpectraが分子構造を正確に解明し、40.76%のトップ-1と99.49%のトップ10を達成している。
論文 参考訳(メタデータ) (2025-07-09T13:57:20Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - MADGEN: Mass-Spec attends to De Novo Molecular generation [16.89017809745962]
質量分析データを用いたデノボ分子構造生成のための足場に基づく手法を提案する。
MADGENは、足場検索とスペクトル条件分子生成の2段階で動作する。
我々は3つのデータセット(NIST23、CANOPUS、MassSpecGym)上でMADGENを評価する。
論文 参考訳(メタデータ) (2025-01-03T18:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。