論文の概要: Prefix-Tree Decoding for Predicting Mass Spectra from Molecules
- arxiv url: http://arxiv.org/abs/2303.06470v3
- Date: Sun, 3 Dec 2023 22:29:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-06 01:27:05.318197
- Title: Prefix-Tree Decoding for Predicting Mass Spectra from Molecules
- Title(参考訳): 分子からの質量スペクトル予測のためのプリフィックストレーデコーディング
- Authors: Samuel Goldman, John Bradshaw, Jiayi Xin, and Connor W. Coley
- Abstract要約: 我々は、質量スペクトルを分子公式の集合として扱うことにより、分子からの質量スペクトルを予測するための新しい中間戦略を用いる。
質量スペクトル予測タスクにおける有望な実験結果を示す。
- 参考スコア(独自算出の注目度): 12.868704267691125
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Computational predictions of mass spectra from molecules have enabled the
discovery of clinically relevant metabolites. However, such predictive tools
are still limited as they occupy one of two extremes, either operating (a) by
fragmenting molecules combinatorially with overly rigid constraints on
potential rearrangements and poor time complexity or (b) by decoding lossy and
nonphysical discretized spectra vectors. In this work, we use a new
intermediate strategy for predicting mass spectra from molecules by treating
mass spectra as sets of molecular formulae, which are themselves multisets of
atoms. After first encoding an input molecular graph, we decode a set of
molecular subformulae, each of which specify a predicted peak in the mass
spectrum, the intensities of which are predicted by a second model. Our key
insight is to overcome the combinatorial possibilities for molecular
subformulae by decoding the formula set using a prefix tree structure,
atom-type by atom-type, representing a general method for ordered multiset
decoding. We show promising empirical results on mass spectra prediction tasks.
- Abstract(参考訳): 分子からの質量スペクトルの計算学的予測により、臨床的に関連する代謝物の発見が可能となった。
しかし、これらの予測ツールはまだ2つの極端の1つを占めるため、運用に制限がある。
(a)分子を断片的に断片化し、潜在的な再配列や時間的複雑さに過度に厳格な制約を課すこと
(b)損失および非物理的離散スペクトルベクトルの復号による。
本研究では、質量スペクトルを原子の多重集合である分子公式の集合として扱うことにより、分子からの質量スペクトルを予測するための新しい中間戦略を用いる。
まず、入力された分子グラフを符号化した後、分子サブフォーミュラの集合をデコードし、それぞれが質量スペクトルの予測ピークを指定し、その強度を第2のモデルで予測する。
我々の重要な洞察は、プレフィックスツリー構造であるatom-type by atom-typeを用いて式集合をデコードすることにより、分子サブフォルムの組合せ可能性の克服である。
質量スペクトル予測タスクにおける有望な実験結果を示す。
関連論文リスト
- Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。
KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。
この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文 参考訳(メタデータ) (2025-02-17T11:53:58Z) - To Bin or not to Bin: Alternative Representations of Mass Spectra [0.0]
我々は、下流機械学習タスク、すなわちセットベースおよびグラフベース表現の前に、マススペクトルの双対化の2つの選択肢について検討する。
提案した2つの表現を比較して、回帰タスクにおいて、セット変換器とグラフニューラルネットワークをトレーニングし、それぞれが、バイナリデータに基づいてトレーニングされた多層パーセプトロンよりもかなり優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2025-02-15T16:52:36Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。
我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。
実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Unraveling Molecular Structure: A Multimodal Spectroscopic Dataset for Chemistry [0.1747623282473278]
このデータセットは、特許データから化学反応から抽出された790k分子の1ドルH-NMR、13ドルC-NMR、HSQC-NMR、赤外線、質量スペクトルからなる。
本研究では, 構造解明, 対象分子のスペクトル予測, 機能群予測などの単一モダリティタスクを評価するためのベンチマークを行う。
論文 参考訳(メタデータ) (2024-07-04T12:52:48Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Efficiently predicting high resolution mass spectra with graph neural
networks [28.387227518307604]
質量スペクトルから小さな分子を同定することは、計算メタボロミクスにおける主要な開問題である。
未知のスペクトルは、化学構造の大規模なデータベースから予測されるスペクトルと一致している。
我々は、入力分子グラフから分子式上の確率分布への写像としてスペクトル予測をキャストすることで、このトレードオフを解決する。
論文 参考訳(メタデータ) (2023-01-26T21:10:26Z) - Ensemble Spectral Prediction (ESP) Model for Metabolite Annotation [10.640447979978436]
メタボロミクスの鍵となる課題は、化学的なアイデンティティを持つ生物学的サンプルから測定されたスペクトルを注釈付けすることである。
メタボライトアノテーションのための新しい機械学習モデルEnsemble Spectral Prediction (ESP)を提案する。
論文 参考訳(メタデータ) (2022-03-25T17:05:41Z) - Unsupervised Spectral Unmixing For Telluric Correction Using A Neural
Network Autoencoder [58.720142291102135]
本研究では,HARPS-N線速度スペクトルから高精度の太陽スペクトルを抽出するニューラルネットワークオートエンコーダ手法を提案する。
論文 参考訳(メタデータ) (2021-11-17T12:54:48Z) - MassFormer: Tandem Mass Spectrum Prediction for Small Molecules using
Graph Transformers [3.2951121243459522]
タンデム質量スペクトルは、分子に関する重要な構造情報を提供する断片化パターンをキャプチャする。
70年以上にわたり、スペクトル予測はこの分野において重要な課題であり続けている。
我々はタンデム質量スペクトルを正確に予測する新しいモデルMassFormerを提案する。
論文 参考訳(メタデータ) (2021-11-08T20:55:15Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。