論文の概要: FRIGID: Scaling Diffusion-Based Molecular Generation from Mass Spectra at Training and Inference Time
- arxiv url: http://arxiv.org/abs/2604.16648v1
- Date: Fri, 17 Apr 2026 19:11:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.113424
- Title: FRIGID: Scaling Diffusion-Based Molecular Generation from Mass Spectra at Training and Inference Time
- Title(参考訳): FRIGID: 質量スペクトルからの拡散に基づく分子のスケーリング
- Authors: Montgomery Bohde, Hongxuan Liu, Mrunali Manjrekar, Magdalena Lederbauer, Shuiwang Ji, Runzhong Wang, Connor W. Coley,
- Abstract要約: 本稿では,質量スペクトルに条件付き構造を生成する新しい拡散言語モデルを用いたフレームワークFRIGIDを提案する。
スペクトル非一貫性フラグメントを同定することにより、前方フラグメンテーションモデルが推論時間スケーリングを実現する方法を示す。
さらなる実証分析により、FRIGIDは推論時間の増大を伴う対数線形性能のスケーリングを示すことが示された。
- 参考スコア(独自算出の注目度): 52.735012862324766
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this work, we present FRIGID, a framework with a novel diffusion language model that generates molecular structures conditioned on mass spectra via intermediate fingerprint representations and determined chemical formulae, training at the scale of hundreds of millions of unlabeled structures. We then demonstrate how forward fragmentation models enable inference-time scaling by identifying spectrum-inconsistent fragments and refining them through targeted remasking and denoising. While FRIGID already achieves strong performance with its diffusion base, inference-time scaling significantly improves its accuracy, surpassing 18% Top-1 accuracy on the challenging MassSpecGym benchmark and tripling the Top-1 accuracy of the leading methods on NPLIB1. Further empirical analyses show that FRIGID exhibits log-linear performance scaling with increasing inference-time compute, opening a promising new direction for continued improvements in de novo structural elucidation. FRIGID code is publicly available at https://github.com/coleygroup/FRIGID
- Abstract(参考訳): 本研究では,中間的な指紋表現と化学式を用いて,質量スペクトルに条件付けされた分子構造を生成する新しい拡散言語モデルを用いたフレームワークFRIGIDについて述べる。
次に、スペクトル非一貫性のフラグメントを識別し、ターゲットのリマッシングとデノーミングによってそれらを精錬することにより、前方フラグメントモデルが推論時間スケーリングを実現する方法を示す。
FRIGIDはすでに拡散ベースで高い性能を達成しているが、推論時間スケーリングは精度を大幅に向上し、挑戦的なMassSpecGymベンチマークでは18%のTop-1精度を上回り、NPLIB1ではリードメソッドのTop-1精度を3倍にしている。
さらなる実験的な分析により、FRIGIDは推論時間の増大に伴う対数線形性能のスケーリングを示し、de novo構造解明の継続的な改善に期待できる新しい方向を開くことが示されている。
FRIGIDコードはhttps://github.com/coleygroup/FRIGIDで公開されている。
関連論文リスト
- FlowMS: Flow Matching for De Novo Structure Elucidation from Mass Spectra [6.255932418151384]
FlowMSは、スペクトル条件付きデノボ分子生成のための最初の離散フローマッチングフレームワークである。
NPLIB1ベンチマークの6つのメトリクスのうち5つで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-03-19T01:41:52Z) - Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.08608779794957]
本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文 参考訳(メタデータ) (2025-11-09T07:25:53Z) - Test-Time Tuned Language Models Enable End-to-end De Novo Molecular Structure Generation from MS/MS Spectra [31.563216077422084]
タンデム質量分析法は、代謝学、天然物発見、環境分析などの重要な分野における未知化合物の同定を可能にする。
テスト時間チューニングを活用することで,事前学習されたトランスフォーマーモデルの学習を向上し,このギャップに対処するフレームワークを導入する。
我々は、NPLIB1とMassSpecGymの2つの人気のあるベンチマークで、DiffMSのデファクトステート・オブ・ザ・アーティカルアプローチを100%と20%上回った。
論文 参考訳(メタデータ) (2025-10-27T18:25:36Z) - MS-BART: Unified Modeling of Mass Spectra and Molecules for Structure Elucidation [20.973121120131875]
大規模事前学習は、他の領域におけるデータの不足に対処するのに有効であることが証明されている。
質量スペクトルと分子構造を共有トークン語彙にマッピングする統合モデリングフレームワークMS-BARTを提案する。
大規模な評価では、MS-BARTはMassSpecGymとNPLIB1の5/12キーメトリクスでSOTA性能を達成している。
論文 参考訳(メタデータ) (2025-10-23T14:45:28Z) - ReDiSC: A Reparameterized Masked Diffusion Model for Scalable Node Classification with Structured Predictions [64.17845687013434]
本稿では,構造化ノード分類のための構造拡散モデルであるReDiSCを提案する。
本稿では,ReDiSCが最先端のGNN,ラベル伝搬,拡散ベースラインと比較して,優れた,あるいは高い競争力を発揮することを示す。
特にReDiSCは、従来の構造化拡散法が計算制約によって失敗する大規模データセットに効果的にスケールする。
論文 参考訳(メタデータ) (2025-07-19T04:46:53Z) - Inference-Time Scaling of Diffusion Language Models with Particle Gibbs Sampling [70.8832906871441]
我々は、モデルを再訓練することなく、所望の報酬に向けて世代を操る方法を研究する。
従来の手法では、通常は1つの認知軌道内でサンプリングやフィルタを行い、軌道レベルの改善なしに報酬をステップバイステップで最適化する。
本稿では,拡散言語モデル(PG-DLM)の粒子ギブスサンプリングについて紹介する。
論文 参考訳(メタデータ) (2025-07-11T08:00:47Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。