論文の概要: Generative structural elucidation from mass spectra as an iterative optimization problem
- arxiv url: http://arxiv.org/abs/2602.07709v1
- Date: Sat, 07 Feb 2026 21:34:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.769698
- Title: Generative structural elucidation from mass spectra as an iterative optimization problem
- Title(参考訳): 反復最適化問題としての質量スペクトルからの生成的構造解明
- Authors: Mrunali Manjrekar, Runzhong Wang, Samuel Goldman, Jenna C. Fromer, Connor W. Coley,
- Abstract要約: 本稿では,LC-MS/MSから構造決定を行う計算ワークフローを反復最適化問題として導入する。
我々は,NIST'20およびMassSpecGymデータセットにおけるクロマトグラフィーの性能を,スタンドアロンの解明パイプラインと既存の逆モデルの補完として示す。
- 参考スコア(独自算出の注目度): 23.97077717251806
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Liquid chromatography tandem mass spectrometry (LC-MS/MS) is a critical analytical technique for molecular identification across metabolomics, environmental chemistry, and chemical forensics. A variety of computational methods have emerged for structural annotation of spectral features of interest, but many of these features cannot be confidently annotated with reference structures or spectra. Here, we introduce FOAM (Formula-constrained Optimization for Annotating Metabolites), a computational workflow that poses structure elucidation from LC-MS/MS as an iterative optimization problem. FOAM couples a formula-constrained graph genetic algorithm with spectral simulation to explore candidate annotations given an experimental spectrum. We demonstrate FOAM's performance on the NIST'20 and MassSpecGym datasets as both a standalone elucidation pipeline and as a complement to existing inverse models. This work establishes iterative optimization as an effective and extensible paradigm for structural elucidation.
- Abstract(参考訳): 液体クロマトグラフィータンデム質量分析法(LC-MS/MS)は、代謝学、環境化学、化学法医学における分子識別のための重要な分析手法である。
様々な計算手法が興味のあるスペクトルの特徴の構造的アノテーションとして登場したが、これらの特徴の多くは基準構造やスペクトルに自信を持って注釈を付けることはできない。
本稿では,LC-MS/MSから構造解明を行う計算ワークフローであるFOAM(Formula-Constrained Optimization for Annotating Metabolites)を紹介する。
FOAMは定式制約付きグラフ遺伝アルゴリズムとスペクトルシミュレーションを組み合わせ、実験スペクトルが与えられた候補アノテーションを探索する。
NIST'20およびMassSpecGymデータセット上でのFOAMの性能をスタンドアロンの解明パイプラインと既存の逆モデルの補完として示す。
この研究は、構造解明のための効果的で拡張可能なパラダイムとして反復最適化を確立する。
関連論文リスト
- SIGMA: Scalable Spectral Insights for LLM Collapse [51.863164847253366]
SIGMA(Spectral Inequalities for Gram Matrix Analysis)は,モデル崩壊のための統一的なフレームワークである。
行列のスペクトル上の決定論的境界を導出するベンチマークを利用することで、SIGMAは表現空間の収縮を追跡するために数学的に基底化された計量を提供する。
我々は、SIGMAが状態への遷移を効果的に捉え、崩壊のメカニズムに関する理論的知見の両方を提供することを示した。
論文 参考訳(メタデータ) (2026-01-06T19:47:11Z) - Language Models Can Understand Spectra: A Multimodal Model for Molecular Structure Elucidation [9.987376780022345]
マルチモーダル分光関節推論をサポートするために設計された,最初の大規模言語モデルであるSpectraLLMを提案する。
連続的および離散的な分光モジュラリティを共有意味空間に統合することにより、SpectraLLMはスペクトル間で一貫性があり相補的な構造パターンを明らかにすることを学ぶ。
我々は、小分子領域におけるSpectraLLMの事前学習と微調整を行い、6つの標準化された公開化学データセットで評価する。
論文 参考訳(メタデータ) (2025-08-04T13:33:38Z) - DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models [68.19129717255053]
本稿では、分子構造解明を条件生成プロセスとして定式化する生成フレームワークであるDiffSpectraについて述べる。
我々の実験では、DiffSpectraが分子構造を正確に解明し、40.76%のトップ-1と99.49%のトップ10を達成している。
論文 参考訳(メタデータ) (2025-07-09T13:57:20Z) - Towards a Unified Textual Graph Framework for Spectral Reasoning via Physical and Chemical Information Fusion [44.90118820073463]
本稿では,先行知識グラフと大規模言語モデルを統合する,新しいマルチモーダルスペクトル分析フレームワークを提案する。
本手法は,物理スペクトル測定と化学構造セマンティクスを統一的なテクスチャグラフ形式で表現することで橋渡しする。
本フレームワークは,ノードレベル,エッジレベル,グラフレベルなど,複数のスペクトル分析タスクにおいて一貫したパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-06-21T16:58:30Z) - Unraveling Molecular Structure: A Multimodal Spectroscopic Dataset for Chemistry [0.1747623282473278]
このデータセットは、特許データから化学反応から抽出された790k分子の1ドルH-NMR、13ドルC-NMR、HSQC-NMR、赤外線、質量スペクトルからなる。
本研究では, 構造解明, 対象分子のスペクトル予測, 機能群予測などの単一モダリティタスクを評価するためのベンチマークを行う。
論文 参考訳(メタデータ) (2024-07-04T12:52:48Z) - Spectral Phase Transition and Optimal PCA in Block-Structured Spiked
models [20.742571160909456]
種々の学習シナリオにおける構造化雑音の研究のために最近導入された理論フレームワークである不均質スパイクド・ウィグナーモデルについて論じる。
我々の主な目的は、最適スペクトル法を探し出し、不均質でブロック構造を持つウィグナーモデルに有望な citeBBP (BBP) 相転移基準を拡張することである。
論文 参考訳(メタデータ) (2024-03-06T13:23:55Z) - Datacube segmentation via Deep Spectral Clustering [76.48544221010424]
拡張ビジョン技術は、しばしばその解釈に挑戦する。
データ立方体スペクトルの巨大な次元性は、その統計的解釈において複雑なタスクを生じさせる。
本稿では,符号化空間における教師なしクラスタリング手法の適用の可能性について検討する。
統計的次元削減はアドホック訓練(可変)オートエンコーダで行い、クラスタリング処理は(学習可能な)反復K-Meansクラスタリングアルゴリズムで行う。
論文 参考訳(メタデータ) (2024-01-31T09:31:28Z) - Spectral Decomposition Representation for Reinforcement Learning [100.0424588013549]
本稿では, スペクトル分解表現法(SPEDER)を提案する。この手法は, データ収集ポリシーに急激な依存を生じさせることなく, ダイナミックスから状態-作用の抽象化を抽出する。
理論的解析により、オンライン設定とオフライン設定の両方において提案アルゴリズムのサンプル効率が確立される。
実験により、いくつかのベンチマークで現在の最先端アルゴリズムよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-08-19T19:01:30Z) - Gaussian Process Regression for Absorption Spectra Analysis of Molecular
Dimers [68.8204255655161]
本稿では、ガウス過程回帰(GPR)から数値計算のパラメータを選択する機械学習技術に基づくアプローチについて議論する。
このアプローチは最適パラメータ集合に素早く収束するだけでなく、完全なパラメータ空間に関する情報を提供する。
実際、GPRは量子化学法を用いてこれらのパラメータの直接計算と一致した信頼性の高い結果を与える。
論文 参考訳(メタデータ) (2021-12-14T17:46:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。