論文の概要: MassFormer: Tandem Mass Spectrum Prediction for Small Molecules using
Graph Transformers
- arxiv url: http://arxiv.org/abs/2111.04824v3
- Date: Mon, 1 May 2023 19:19:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-03 18:34:12.561056
- Title: MassFormer: Tandem Mass Spectrum Prediction for Small Molecules using
Graph Transformers
- Title(参考訳): MassFormer:グラフ変換器を用いた小分子のタンデム質量スペクトル予測
- Authors: Adamo Young, Bo Wang, Hannes R\"ost
- Abstract要約: タンデム質量スペクトルは、分子に関する重要な構造情報を提供する断片化パターンをキャプチャする。
70年以上にわたり、スペクトル予測はこの分野において重要な課題であり続けている。
我々はタンデム質量スペクトルを正確に予測する新しいモデルMassFormerを提案する。
- 参考スコア(独自算出の注目度): 3.2951121243459522
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tandem mass spectra capture fragmentation patterns that provide key
structural information about a molecule. Although mass spectrometry is applied
in many areas, the vast majority of small molecules lack experimental reference
spectra. For over seventy years, spectrum prediction has remained a key
challenge in the field. Existing deep learning methods do not leverage global
structure in the molecule, potentially resulting in difficulties when
generalizing to new data. In this work we propose a new model, MassFormer, for
accurately predicting tandem mass spectra. MassFormer uses a graph transformer
architecture to model long-distance relationships between atoms in the
molecule. The transformer module is initialized with parameters obtained
through a chemical pre-training task, then fine-tuned on spectral data.
MassFormer outperforms competing approaches for spectrum prediction on multiple
datasets, and is able to recover prior knowledge about the effect of collision
energy on the spectrum. By employing gradient-based attribution methods, we
demonstrate that the model can identify relationships between fragment peaks.
To further highlight MassFormer's utility, we show that it can match or exceed
existing prediction-based methods on two spectrum identification tasks. We
provide open-source implementations of our model and baseline approaches, with
the goal of encouraging future research in this area.
- Abstract(参考訳): タンデム質量スペクトルは、分子に関する重要な構造情報を提供する断片化パターンをキャプチャする。
質量分析法は多くの領域で適用されているが、ほとんどの小さな分子は実験的参照スペクトルを欠いている。
70年以上にわたって、スペクトラム予測はこの分野の重要な課題であり続けている。
既存の深層学習法は分子のグローバル構造を利用せず、新しいデータへの一般化に困難をもたらす可能性がある。
本研究では,タンデム質量スペクトルを正確に予測する新しいモデルであるmassformerを提案する。
MassFormerはグラフトランスフォーマーアーキテクチャを使用して、分子内の原子間の長距離関係をモデル化する。
トランスフォーマーモジュールは、化学前訓練タスクによって得られたパラメータで初期化され、スペクトルデータに基づいて微調整される。
MassFormerは、複数のデータセットにおけるスペクトル予測の競合するアプローチよりも優れており、衝突エネルギーがスペクトルに与える影響に関する事前知識を回復することができる。
勾配に基づく帰属法を用いることで,モデルがフラグメントピーク間の関係を識別できることを実証する。
MassFormerの実用性をさらに強調するため、2つのスペクトル識別タスクにおいて既存の予測に基づく手法に適合または超過可能であることを示す。
当社のモデルとベースラインアプローチのオープンソース実装を提供し、この分野の今後の研究を促進することを目標にしています。
関連論文リスト
- Machine learning meets mass spectrometry: a focused perspective [0.0]
質量分析法 (Mass Spectrometry) は、医学、生命科学、化学、工業製品の品質管理などの分野で広く用いられている方法である。
いくつかの質量分析技術の主な特徴の1つは、広範囲のキャラクタリゼーションレベルと、測定毎に生成される大量のデータである。
機械学習の手法の開発によって、これらのデータの可能性を解き放つ機会が生まれ、これまでアクセス不能だった発見が可能になる。
論文 参考訳(メタデータ) (2024-06-27T14:18:23Z) - Mass Spectra Prediction with Structural Motif-based Graph Neural
Networks [21.71309513265843]
MoMS-Netは、構造モチーフから得られる情報とグラフニューラルネットワーク(GNN)の実装を用いて質量スペクトルを予測するシステムである。
我々は、様々な質量スペクトルでモデルを試験し、既存のモデルよりもその優位性を観察した。
論文 参考訳(メタデータ) (2023-06-28T10:33:57Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Prefix-Tree Decoding for Predicting Mass Spectra from Molecules [12.868704267691125]
我々は、質量スペクトルを分子公式の集合として扱うことにより、分子からの質量スペクトルを予測するための新しい中間戦略を用いる。
質量スペクトル予測タスクにおける有望な実験結果を示す。
論文 参考訳(メタデータ) (2023-03-11T17:44:28Z) - Multiresolution Graph Transformers and Wavelet Positional Encoding for
Learning Hierarchical Structures [6.875312133832078]
複数のスケールで大きな分子を表現できる最初のグラフトランスアーキテクチャであるMulti resolution Graph Transformer (MGT)を提案する。
MGTは原子の表現を学習し、それらを有意義な官能基または繰り返し単位に分類することができる。
提案モデルでは, 高分子とペプチドからなるマクロ分子データセットと, 薬物様分子データセットの2つの結果を得た。
論文 参考訳(メタデータ) (2023-02-17T01:32:44Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Efficiently predicting high resolution mass spectra with graph neural
networks [28.387227518307604]
質量スペクトルから小さな分子を同定することは、計算メタボロミクスにおける主要な開問題である。
未知のスペクトルは、化学構造の大規模なデータベースから予測されるスペクトルと一致している。
我々は、入力分子グラフから分子式上の確率分布への写像としてスペクトル予測をキャストすることで、このトレードオフを解決する。
論文 参考訳(メタデータ) (2023-01-26T21:10:26Z) - Unsupervised Spectral Unmixing For Telluric Correction Using A Neural
Network Autoencoder [58.720142291102135]
本研究では,HARPS-N線速度スペクトルから高精度の太陽スペクトルを抽出するニューラルネットワークオートエンコーダ手法を提案する。
論文 参考訳(メタデータ) (2021-11-17T12:54:48Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。