論文の概要: Prefix-tree Decoding for Predicting Mass Spectra from Molecules
- arxiv url: http://arxiv.org/abs/2303.06470v1
- Date: Sat, 11 Mar 2023 17:44:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 18:53:15.035118
- Title: Prefix-tree Decoding for Predicting Mass Spectra from Molecules
- Title(参考訳): 分子からの質量スペクトル予測のためのプレフィックスツリーデコーディング
- Authors: Samuel Goldman, John Bradshaw, Jiayi Xin, and Connor W. Coley
- Abstract要約: 我々は、質量スペクトルを原子の多元集合である化学式として扱うことにより、分子から質量スペクトルを予測する新しい中間戦略を導入する。
質量スペクトル予測タスクにおける有望な実験結果を示す。
- 参考スコア(独自算出の注目度): 6.6203317601687575
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Computational predictions of mass spectra from molecules have enabled the
discovery of clinically relevant metabolites. However, such predictive tools
are still limited as they occupy one of two extremes, either operating (a) by
fragmenting molecules combinatorially with overly rigid constraints on
potential rearrangements and poor time complexity or (b) by decoding lossy and
nonphysical discretized spectra vectors. In this work, we introduce a new
intermediate strategy for predicting mass spectra from molecules by treating
mass spectra as sets of chemical formulae, which are themselves multisets of
atoms. After first encoding an input molecular graph, we decode a set of
chemical subformulae, each of which specify a predicted peak in the mass
spectra, the intensities of which are predicted by a second model. Our key
insight is to overcome the combinatorial possibilities for chemical subformulae
by decoding the formula set using a prefix tree structure, atom-type by
atom-type, representing a general method for ordered multiset decoding. We show
promising empirical results on mass spectra prediction tasks.
- Abstract(参考訳): 分子からの質量スペクトルの計算学的予測により、臨床的に関連する代謝物の発見が可能となった。
しかし、これらの予測ツールはまだ2つの極端の1つを占めるため、運用に制限がある。
(a)分子を断片的に断片化し、潜在的な再配列や時間的複雑さに過度に厳格な制約を課すこと
(b)損失および非物理的離散スペクトルベクトルの復号による。
本研究では, 質量スペクトルを原子の多元集合である化学式として扱うことにより, 分子からの質量スペクトルを予測するための新しい中間戦略を導入する。
入力分子グラフをまずエンコードした後、質量スペクトルの予測ピークを指定する一連の化学サブフォルムをデコードし、その強度を第2のモデルにより予測する。
我々の重要な洞察は、プレフィックスツリー構造(原子型原子型)を用いて式セットを復号化することで、化学サブフォーミュラの組合せ可能性の克服である。
質量スペクトル予測タスクにおける有望な実験結果を示す。
関連論文リスト
- Unraveling Molecular Structure: A Multimodal Spectroscopic Dataset for Chemistry [0.1747623282473278]
このデータセットは、特許データから化学反応から抽出された790k分子の1ドルH-NMR、13ドルC-NMR、HSQC-NMR、赤外線、質量スペクトルからなる。
本研究では, 構造解明, 対象分子のスペクトル予測, 機能群予測などの単一モダリティタスクを評価するためのベンチマークを行う。
論文 参考訳(メタデータ) (2024-07-04T12:52:48Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Efficiently predicting high resolution mass spectra with graph neural
networks [28.387227518307604]
質量スペクトルから小さな分子を同定することは、計算メタボロミクスにおける主要な開問題である。
未知のスペクトルは、化学構造の大規模なデータベースから予測されるスペクトルと一致している。
我々は、入力分子グラフから分子式上の確率分布への写像としてスペクトル予測をキャストすることで、このトレードオフを解決する。
論文 参考訳(メタデータ) (2023-01-26T21:10:26Z) - Ensemble Spectral Prediction (ESP) Model for Metabolite Annotation [10.640447979978436]
メタボロミクスの鍵となる課題は、化学的なアイデンティティを持つ生物学的サンプルから測定されたスペクトルを注釈付けすることである。
メタボライトアノテーションのための新しい機械学習モデルEnsemble Spectral Prediction (ESP)を提案する。
論文 参考訳(メタデータ) (2022-03-25T17:05:41Z) - Unsupervised Spectral Unmixing For Telluric Correction Using A Neural
Network Autoencoder [58.720142291102135]
本研究では,HARPS-N線速度スペクトルから高精度の太陽スペクトルを抽出するニューラルネットワークオートエンコーダ手法を提案する。
論文 参考訳(メタデータ) (2021-11-17T12:54:48Z) - MassFormer: Tandem Mass Spectrum Prediction for Small Molecules using
Graph Transformers [3.2951121243459522]
タンデム質量スペクトルは、分子に関する重要な構造情報を提供する断片化パターンをキャプチャする。
70年以上にわたり、スペクトル予測はこの分野において重要な課題であり続けている。
我々はタンデム質量スペクトルを正確に予測する新しいモデルMassFormerを提案する。
論文 参考訳(メタデータ) (2021-11-08T20:55:15Z) - Flexible dual-branched message passing neural network for quantum
mechanical property prediction with molecular conformation [16.08677447593939]
メッセージパッシングフレームワークに基づく分子特性予測のための二重分岐ニューラルネットワークを提案する。
本モデルでは,様々なスケールで異種分子の特徴を学習し,予測対象に応じて柔軟に学習する。
論文 参考訳(メタデータ) (2021-06-14T10:00:39Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。