論文の概要: Comparative Analysis of Formula and Structure Prediction from Tandem Mass Spectra
- arxiv url: http://arxiv.org/abs/2601.00941v1
- Date: Fri, 02 Jan 2026 16:20:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:21.875504
- Title: Comparative Analysis of Formula and Structure Prediction from Tandem Mass Spectra
- Title(参考訳): タンデム質量スペクトルによる定式化と構造予測の比較解析
- Authors: Xujun Che, Xiuxia Du, Depeng Xu,
- Abstract要約: 液体クロマトグラフィー質量分析法 (LC-MS) によるメタボロミクスとエポゾミックは、生物学的試料中の検出可能な小さな分子を測定することを目的としている。
発見者は、現実的なパフォーマンスベースラインを確立し、重要なボトルネックを特定し、MSに基づいた複合予測をさらに改善するためのガイダンスを提供した。
- 参考スコア(独自算出の注目度): 3.2243643829769586
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Liquid chromatography mass spectrometry (LC-MS)-based metabolomics and exposomics aim to measure detectable small molecules in biological samples. The results facilitate hypothesis-generating discovery of metabolic changes and disease mechanisms and provide information about environmental exposures and their effects on human health. Metabolomics and exposomics are made possible by the high resolving power of LC and high mass measurement accuracy of MS. However, a majority of the signals from such studies still cannot be identified or annotated using conventional library searching because existing spectral libraries are far from covering the vast chemical space captured by LC-MS/MS. To address this challenge and unleash the full potential of metabolomics and exposomics, a number of computational approaches have been developed to predict compounds based on tandem mass spectra. Published assessment of these approaches used different datasets and evaluation. To select prediction workflows for practical applications and identify areas for further improvements, we have carried out a systematic evaluation of the state-of-the-art prediction algorithms. Specifically, the accuracy of formula prediction and structure prediction was evaluated for different types of adducts. The resulting findings have established realistic performance baselines, identified critical bottlenecks, and provided guidance to further improve compound predictions based on MS.
- Abstract(参考訳): 液体クロマトグラフィー質量分析法 (LC-MS) によるメタボロミクスとエポゾミックは、生物学的試料中の検出可能な小さな分子を測定することを目的としている。
この結果は代謝変化と疾患のメカニズムの仮説生成を促進し、環境暴露とそのヒトの健康への影響に関する情報を提供する。
LCの高分解能とMSの高質量測定精度によりメタボロミクスとエクソソミクスが可能であるが,既存のスペクトルライブラリーはLC-MS/MSが捕捉した広大な化学物質空間をカバーできないため,従来のライブラリー検索では,これらの研究からの信号のほとんどを同定あるいは注釈できない。
この課題に対処し、代謝学と博物学の可能性を解き放つために、タンデム質量スペクトルに基づいて化合物を予測するための多くの計算手法が開発されている。
これらのアプローチの評価は、異なるデータセットと評価を使用した。
実用化のための予測ワークフローを選択し、さらなる改善のための領域を特定するため、我々は最先端の予測アルゴリズムを体系的に評価した。
具体的には, 異なる種類の付加物に対して, 公式予測と構造予測の精度を評価した。
その結果、現実的なパフォーマンスベースラインを確立し、重要なボトルネックを特定し、MSに基づく複合予測をさらに改善するためのガイダンスが得られた。
関連論文リスト
- Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.08608779794957]
本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文 参考訳(メタデータ) (2025-11-09T07:25:53Z) - LSM-MS2: A Foundation Model Bridging Spectral Identification and Biological Interpretation [0.179762320774136]
本稿では,数百万のスペクトルをベースとした大規模深層学習基盤モデル LSM-MS2 について述べる。
LSM-MS2は、スペクトル同定における最先端性能を達成し、既存の方法では、難解な異性体化合物を同定する精度を30%向上させる。
論文 参考訳(メタデータ) (2025-10-30T17:13:58Z) - MS-BART: Unified Modeling of Mass Spectra and Molecules for Structure Elucidation [20.973121120131875]
大規模事前学習は、他の領域におけるデータの不足に対処するのに有効であることが証明されている。
質量スペクトルと分子構造を共有トークン語彙にマッピングする統合モデリングフレームワークMS-BARTを提案する。
大規模な評価では、MS-BARTはMassSpecGymとNPLIB1の5/12キーメトリクスでSOTA性能を達成している。
論文 参考訳(メタデータ) (2025-10-23T14:45:28Z) - Foundation Models for Discovery and Exploration in Chemical Space [57.97784111110166]
MISTは、大規模なラベルなしデータセットに基づいて訓練された分子基盤モデルのファミリーである。
我々は、これらのモデルが化学空間をまたいだ現実世界の問題を解決する能力を実証する。
論文 参考訳(メタデータ) (2025-10-20T17:56:01Z) - Drug classification based on X-ray spectroscopy combined with machine learning [11.985793625437546]
X線吸収分光法は、操作の容易さ、透過性観察、強い物質分化能力などの利点を提供する。
本研究では、畳み込みニューラルネットワーク(CNN)、サポートベクトルマシン(SVM)、パーティクルスワーム最適化(PSO)を用いた分類モデルを構築した。
実験の結果、このモデルは他の2つの一般的な手法と比較して高い分類精度を達成し、予測精度は99.14%であった。
論文 参考訳(メタデータ) (2025-05-04T04:49:55Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Combination of Raman spectroscopy and chemometrics: A review of recent
studies published in the Spectrochimica Acta, Part A: Molecular and
Biomolecular Spectroscopy Journal [0.0]
本稿では,ラマン分光法とケモメトリックスを併用して,試料とその異なる因子による変化について検討する。
我々は、分類モデルを作成するための最良の戦略を要約し、化学計測技術の適用に関して、いくつかの共通の欠点を強調した。
論文 参考訳(メタデータ) (2022-10-18T13:08:20Z) - Low cost prediction of probability distributions of molecular properties
for early virtual screening [0.8702432681310399]
本稿では, 階層的相関再構築手法を適用し, 人口統計, 財務, 天文学的データの解析に応用した。
この手法は、望まれる物理化学的/ADMET特性の可能性が低い化合物の迅速な拒絶を可能にするため、医薬化学者にとって大きな支援となる。
論文 参考訳(メタデータ) (2022-07-21T13:29:26Z) - Unsupervised Machine Learning for Exploratory Data Analysis of Exoplanet
Transmission Spectra [68.8204255655161]
我々は、通過する太陽系外惑星のスペクトルデータを解析するための教師なし手法に焦点をあてる。
スペクトルデータには、適切な低次元表現を要求する高い相関関係があることが示される。
主成分に基づく興味深い構造、すなわち、異なる化学状態に対応する明確に定義された分岐を明らかにする。
論文 参考訳(メタデータ) (2022-01-07T22:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。