論文の概要: FlowMS: Flow Matching for De Novo Structure Elucidation from Mass Spectra
- arxiv url: http://arxiv.org/abs/2603.18397v1
- Date: Thu, 19 Mar 2026 01:41:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:05.907007
- Title: FlowMS: Flow Matching for De Novo Structure Elucidation from Mass Spectra
- Title(参考訳): FlowMS:質量スペクトルからのDe Novo構造解析のためのフローマッチング
- Authors: Jianan Nie, Peng Gao,
- Abstract要約: FlowMSは、スペクトル条件付きデノボ分子生成のための最初の離散フローマッチングフレームワークである。
NPLIB1ベンチマークの6つのメトリクスのうち5つで最先端のパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 6.255932418151384
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mass spectrometry (MS) stands as a cornerstone analytical technique for molecular identification, yet de novo structure elucidation from spectra remains challenging due to the combinatorial complexity of chemical space and the inherent ambiguity of spectral fragmentation patterns. Recent deep learning approaches, including autoregressive sequence models, scaffold-based methods, and graph diffusion models, have made progress. However, diffusion-based generation for this task remains computationally demanding. Meanwhile, discrete flow matching, which has shown strong performance for graph generation, has not yet been explored for spectrum-conditioned structure elucidation. In this work, we introduce FlowMS, the first discrete flow matching framework for spectrum-conditioned de novo molecular generation. FlowMS generates molecular graphs through iterative refinement in probability space, enforcing chemical formula constraints while conditioning on spectral embeddings from a pretrained formula transformer encoder. Notably, it achieves state-of-the-art performance on 5 out of 6 metrics on the NPLIB1 benchmark: 9.15% top-1 accuracy (9.7% relative improvement over DiffMS) and 7.96 top-10 MCES (4.2% improvement over MS-BART). We also visualize the generated molecules, which further demonstrate that FlowMS produces structurally plausible candidates closely resembling ground truth structures. These results establish discrete flow matching as a promising paradigm for mass spectrometry-based structure elucidation in metabolomics and natural product discovery.
- Abstract(参考訳): 質量分析法 (MS) は分子同定の基盤となる解析手法であるが, 化学空間の組合せ的複雑さとスペクトル断片化パターンの性質的曖昧さにより, スペクトルからのデ・ノボ構造の解明は依然として困難である。
近年, 自己回帰シーケンスモデル, 足場に基づく手法, グラフ拡散モデルなど, 深層学習のアプローチが進展している。
しかし、このタスクの拡散に基づく生成は依然として計算的に要求される。
一方、グラフ生成に強い性能を示す離散フローマッチングは、スペクトル条件による構造解明のためにはまだ検討されていない。
本研究では、スペクトル条件付きデノボ分子生成のための最初の離散フローマッチングフレームワークであるFlowMSを紹介する。
FlowMSは、事前訓練された式変換器エンコーダからのスペクトル埋め込みを条件に、化学式制約を強制し、確率空間における反復的な洗練を通じて分子グラフを生成する。
特に、NPLIB1ベンチマークの6つの指標のうち、9.15%のトップ-1精度(DiffMSよりも9.7%改善)と7.96のトップ10MCES(MS-BARTより4.2%改善)で最先端のパフォーマンスを達成した。
また、生成した分子を可視化し、FlowMSが基底の真理構造によく似た構造的証明可能な候補を生成することを示した。
これらの結果は, メタボロミクスと天然物発見における質量分析に基づく構造解明に期待できるパラダイムとして, 離散フローマッチングを確立した。
関連論文リスト
- De novo molecular structure elucidation from mass spectra via flow matching [5.274388013166468]
我々は,2段階のエンコーダデコーダフローマッチング生成モデルであるMSFlowを開発した。
MSFlowは、分子質量スペクトルの最大45%を対応する分子表現に変換することができる。
論文 参考訳(メタデータ) (2026-02-23T14:52:53Z) - From Static Spectra to Operando Infrared Dynamics: Physics Informed Flow Modeling and a Benchmark [67.29937933325849]
Operando IR Predictionは、1つの静的スペクトルからスペクトル指紋の時間分解進化を予測することを目的としている。
OpIRSpec-7Kは、10の異なるバッテリーシステムにわたる7,118の高品質なサンプルで構成されている。
ABCCは最先端の静的、シーケンシャル、および生成的ベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-02-20T18:58:43Z) - Generative structural elucidation from mass spectra as an iterative optimization problem [23.97077717251806]
本稿では,LC-MS/MSから構造決定を行う計算ワークフローを反復最適化問題として導入する。
我々は,NIST'20およびMassSpecGymデータセットにおけるクロマトグラフィーの性能を,スタンドアロンの解明パイプラインと既存の逆モデルの補完として示す。
論文 参考訳(メタデータ) (2026-02-07T21:34:38Z) - Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.08608779794957]
本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文 参考訳(メタデータ) (2025-11-09T07:25:53Z) - Test-Time Tuned Language Models Enable End-to-end De Novo Molecular Structure Generation from MS/MS Spectra [31.563216077422084]
タンデム質量分析法は、代謝学、天然物発見、環境分析などの重要な分野における未知化合物の同定を可能にする。
テスト時間チューニングを活用することで,事前学習されたトランスフォーマーモデルの学習を向上し,このギャップに対処するフレームワークを導入する。
我々は、NPLIB1とMassSpecGymの2つの人気のあるベンチマークで、DiffMSのデファクトステート・オブ・ザ・アーティカルアプローチを100%と20%上回った。
論文 参考訳(メタデータ) (2025-10-27T18:25:36Z) - DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models [68.19129717255053]
本稿では、分子構造解明を条件生成プロセスとして定式化する生成フレームワークであるDiffSpectraについて述べる。
我々の実験では、DiffSpectraが分子構造を正確に解明し、40.76%のトップ-1と99.49%のトップ10を達成している。
論文 参考訳(メタデータ) (2025-07-09T13:57:20Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。