論文の概要: MS2MetGAN: Latent-space adversarial training for metabolite-spectrum matching in MS/MS database search
- arxiv url: http://arxiv.org/abs/2603.13342v1
- Date: Sat, 07 Mar 2026 04:33:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.099952
- Title: MS2MetGAN: Latent-space adversarial training for metabolite-spectrum matching in MS/MS database search
- Title(参考訳): MS2MetGAN:MS/MSデータベース検索におけるメタボライトスペクトルマッチングのための潜時空間対位トレーニング
- Authors: Meng Tsai, Alexzander Dwyer, Estelle Nuckels, Yingfeng Wang,
- Abstract要約: 負のトレーニングサンプルを生成するための新しいフレームワークを提案する。
我々のツールであるMS2MetGANは,既存の代謝物同定法よりも全体的な性能が向上していることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Database search is a widely used approach for identifying metabolites from tandem mass spectra (MS/MS). In this strategy, an experimental spectrum is matched against a user-specified database of candidate metabolites, and candidates are ranked such that true metabolite-spectrum matches receive the highest scores. Machine-learning methods have been widely incorporated into database-search-based identification tools and have substantially improved performance. To further improve identification accuracy, we propose a new framework for generating negative training samples. The framework first uses autoencoders to learn latent representations of metabolite structures and MS/MS spectra, thereby recasting metabolite-spectrum matching as matching between latent vectors. It then uses a GAN to generate latent vectors of decoy metabolites and constructs decoy metabolite-spectrum matches as negative samples for training. Experimental results show that our tool, MS2MetGAN, achieves better overall performance than existing metabolite identification methods.
- Abstract(参考訳): データベース検索はタンデム質量スペクトル(MS/MS)から代謝物を特定するために広く用いられている手法である。
本戦略では, 候補メタボライトのユーザ指定データベースと実験スペクトルをマッチングし, 真のメタボライト-スペクトル一致が最も高いスコアを得るように候補をランク付けする。
機械学習手法はデータベース検索に基づく識別ツールに広く取り入れられ、性能が大幅に向上した。
識別精度をより高めるために、負のトレーニングサンプルを生成するための新しいフレームワークを提案する。
このフレームワークは、まずオートエンコーダを使用してメタボライト構造とMS/MSスペクトルの潜在表現を学習し、それによってメタボライト-スペクトルマッチングを潜在ベクトル間のマッチングとして再キャストする。
その後、GANを使用してデコイ代謝物の潜伏ベクトルを生成し、デコイ代謝物-スペクトルマッチングをトレーニングのための負のサンプルとして構成する。
実験の結果,MS2MetGANは既存の代謝物同定法よりも全体的な性能が向上していることがわかった。
関連論文リスト
- Beyond Raw Detection Scores: Markov-Informed Calibration for Boosting Machine-Generated Text Detection [105.14032334647932]
機械生成テキスト(MGT)は偽情報やフィッシングなどのリスクを生じさせ、信頼性の高い検出の必要性を強調している。
MGTの統計的に区別可能な特徴を抽出するメトリックベース法は、オーバーフィットしがちな複雑なモデルベース法よりも実用的であることが多い。
本稿では,2つのコンテキスト検出スコアの関係をモデル化したマルコフ情報を用いたスコアキャリブレーション手法を提案する。
論文 参考訳(メタデータ) (2026-02-08T16:06:12Z) - Comparative Analysis of Formula and Structure Prediction from Tandem Mass Spectra [3.2243643829769586]
液体クロマトグラフィー質量分析法 (LC-MS) によるメタボロミクスとエポゾミックは、生物学的試料中の検出可能な小さな分子を測定することを目的としている。
発見者は、現実的なパフォーマンスベースラインを確立し、重要なボトルネックを特定し、MSに基づいた複合予測をさらに改善するためのガイダンスを提供した。
論文 参考訳(メタデータ) (2026-01-02T16:20:13Z) - Strategies to Minimize Out-of-Distribution Effects in Data-Driven MRS Quantification [16.060904490566383]
磁気共鳴分光法(MRS)における代謝物定量化のためのデータ駆動型およびモデルベース戦略を系統的に比較した。
教師付き学習はトレーニング分布と同様のスペクトルの精度を達成したが,トレーニング分布を超えて外挿した場合に顕著な劣化が認められた。
テスト時間適応は、OoD効果に対してより弾力性を示し、自己教師型学習は中間的性能を達成した。
論文 参考訳(メタデータ) (2025-11-28T12:33:05Z) - Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.08608779794957]
本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文 参考訳(メタデータ) (2025-11-09T07:25:53Z) - MetaBench: A Multi-task Benchmark for Assessing LLMs in Metabolomics [23.71774159970153]
LLM(Large Language Models)は、一般的なテキストで顕著な機能を示す。
メタボロミクスは、その複雑な生化学的経路、異種識別子システム、断片化されたデータベースで固有の課題を提示する。
メタボロミクス評価のための最初のベンチマークであるMetaBenchを紹介する。
論文 参考訳(メタデータ) (2025-10-16T17:55:14Z) - Gene-Metabolite Association Prediction with Interactive Knowledge Transfer Enhanced Graph for Metabolite Production [49.814615043389864]
メタボリックグラフに基づく遺伝子メタボリック・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション
2474の代謝産物と1947年の2つの一般的な微生物の遺伝子を含む最初のベンチマークを提示する。
提案手法は,各種リンク予測フレームワークのベースラインを最大12.3%向上させる。
論文 参考訳(メタデータ) (2024-10-24T06:54:27Z) - Optimizing OOD Detection in Molecular Graphs: A Novel Approach with Diffusion Models [71.39421638547164]
本稿では,入力分子と再構成グラフの類似性を比較する補助拡散モデルに基づくフレームワークを用いてOOD分子を検出することを提案する。
IDトレーニングサンプルの再構成に向けた生成バイアスのため、OOD分子の類似度スコアは検出を容易にするためにはるかに低い。
本研究は,PGR-MOOD(PGR-MOOD)とよばれる分子OOD検出のためのプロトタイプグラフ再構成のアプローチを開拓し,3つのイノベーションを生かした。
論文 参考訳(メタデータ) (2024-04-24T03:25:53Z) - Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - Multi-View Variational Autoencoder for Missing Value Imputation in
Untargeted Metabolomics [17.563099908890013]
本稿では,WGSデータと参照代謝産物の情報を利用して未知の代謝産物をインプットする新しい手法を提案する。
両オミクスデータの潜伏表現を学習することにより,欠落したメタボロミクス値を効果的にインプットすることができる。
論文 参考訳(メタデータ) (2023-10-12T02:34:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。