論文の概要: To Bin or not to Bin: Alternative Representations of Mass Spectra
- arxiv url: http://arxiv.org/abs/2502.10851v1
- Date: Sat, 15 Feb 2025 16:52:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:08:21.868522
- Title: To Bin or not to Bin: Alternative Representations of Mass Spectra
- Title(参考訳): ビンか否か:質量スペクトルの代替表現
- Authors: Niek de Jonge, Justin J. J. van der Hooft, Daniel Probst,
- Abstract要約: 我々は、下流機械学習タスク、すなわちセットベースおよびグラフベース表現の前に、マススペクトルの双対化の2つの選択肢について検討する。
提案した2つの表現を比較して、回帰タスクにおいて、セット変換器とグラフニューラルネットワークをトレーニングし、それぞれが、バイナリデータに基づいてトレーニングされた多層パーセプトロンよりもかなり優れた性能を示すことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Mass spectrometry, especially so-called tandem mass spectrometry, is commonly used to assess the chemical diversity of samples. The resulting mass fragmentation spectra are representations of molecules of which the structure may have not been determined. This poses the challenge of experimentally determining or computationally predicting molecular structures from mass spectra. An alternative option is to predict molecular properties or molecular similarity directly from spectra. Various methodologies have been proposed to embed mass spectra for further use in machine learning tasks. However, these methodologies require preprocessing of the spectra, which often includes binning or sub-sampling peaks with the main reasoning of creating uniform vector sizes and removing noise. Here, we investigate two alternatives to the binning of mass spectra before down-stream machine learning tasks, namely, set-based and graph-based representations. Comparing the two proposed representations to train a set transformer and a graph neural network on a regression task, respectively, we show that they both perform substantially better than a multilayer perceptron trained on binned data.
- Abstract(参考訳): 質量分析法、特にタンデム質量分析法は、試料の化学的多様性を評価するために一般的に用いられる。
結果として生じる質量分解スペクトルは、構造が決定されなかったかもしれない分子の表現である。
これは、質量スペクトルから分子構造を実験的に決定または計算的に予測することの課題である。
別の選択肢は、スペクトルから直接分子特性や分子類似性を予測することである。
機械学習タスクにマススペクトルを埋め込むための様々な手法が提案されている。
しかしながら、これらの手法にはスペクトルの事前処理が必要であり、これはしばしば一様ベクトルサイズを作成し、ノイズを除去する主な理由として、ビンニングやサブサンプリングのピークを含む。
本稿では、下流機械学習タスク、すなわちセットベースおよびグラフベース表現の前に、マススペクトルの双対化の2つの選択肢について検討する。
提案した2つの表現を比較して, 回帰タスクにおいて, セットトランスフォーマとグラフニューラルネットワークを訓練し, それぞれが, バイナリデータに基づいてトレーニングされた多層パーセプトロンよりも有意に優れた性能を示すことを示す。
関連論文リスト
- DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。
我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。
実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Unraveling Molecular Structure: A Multimodal Spectroscopic Dataset for Chemistry [0.1747623282473278]
このデータセットは、特許データから化学反応から抽出された790k分子の1ドルH-NMR、13ドルC-NMR、HSQC-NMR、赤外線、質量スペクトルからなる。
本研究では, 構造解明, 対象分子のスペクトル予測, 機能群予測などの単一モダリティタスクを評価するためのベンチマークを行う。
論文 参考訳(メタデータ) (2024-07-04T12:52:48Z) - Datacube segmentation via Deep Spectral Clustering [76.48544221010424]
拡張ビジョン技術は、しばしばその解釈に挑戦する。
データ立方体スペクトルの巨大な次元性は、その統計的解釈において複雑なタスクを生じさせる。
本稿では,符号化空間における教師なしクラスタリング手法の適用の可能性について検討する。
統計的次元削減はアドホック訓練(可変)オートエンコーダで行い、クラスタリング処理は(学習可能な)反復K-Meansクラスタリングアルゴリズムで行う。
論文 参考訳(メタデータ) (2024-01-31T09:31:28Z) - Mass Spectra Prediction with Structural Motif-based Graph Neural
Networks [21.71309513265843]
MoMS-Netは、構造モチーフから得られる情報とグラフニューラルネットワーク(GNN)の実装を用いて質量スペクトルを予測するシステムである。
我々は、様々な質量スペクトルでモデルを試験し、既存のモデルよりもその優位性を観察した。
論文 参考訳(メタデータ) (2023-06-28T10:33:57Z) - Prefix-Tree Decoding for Predicting Mass Spectra from Molecules [12.868704267691125]
我々は、質量スペクトルを分子公式の集合として扱うことにより、分子からの質量スペクトルを予測するための新しい中間戦略を用いる。
質量スペクトル予測タスクにおける有望な実験結果を示す。
論文 参考訳(メタデータ) (2023-03-11T17:44:28Z) - Ensemble Spectral Prediction (ESP) Model for Metabolite Annotation [10.640447979978436]
メタボロミクスの鍵となる課題は、化学的なアイデンティティを持つ生物学的サンプルから測定されたスペクトルを注釈付けすることである。
メタボライトアノテーションのための新しい機械学習モデルEnsemble Spectral Prediction (ESP)を提案する。
論文 参考訳(メタデータ) (2022-03-25T17:05:41Z) - Unsupervised Machine Learning for Exploratory Data Analysis of Exoplanet
Transmission Spectra [68.8204255655161]
我々は、通過する太陽系外惑星のスペクトルデータを解析するための教師なし手法に焦点をあてる。
スペクトルデータには、適切な低次元表現を要求する高い相関関係があることが示される。
主成分に基づく興味深い構造、すなわち、異なる化学状態に対応する明確に定義された分岐を明らかにする。
論文 参考訳(メタデータ) (2022-01-07T22:26:33Z) - Gaussian Process Regression for Absorption Spectra Analysis of Molecular
Dimers [68.8204255655161]
本稿では、ガウス過程回帰(GPR)から数値計算のパラメータを選択する機械学習技術に基づくアプローチについて議論する。
このアプローチは最適パラメータ集合に素早く収束するだけでなく、完全なパラメータ空間に関する情報を提供する。
実際、GPRは量子化学法を用いてこれらのパラメータの直接計算と一致した信頼性の高い結果を与える。
論文 参考訳(メタデータ) (2021-12-14T17:46:45Z) - Unsupervised Spectral Unmixing For Telluric Correction Using A Neural
Network Autoencoder [58.720142291102135]
本研究では,HARPS-N線速度スペクトルから高精度の太陽スペクトルを抽出するニューラルネットワークオートエンコーダ手法を提案する。
論文 参考訳(メタデータ) (2021-11-17T12:54:48Z) - MassFormer: Tandem Mass Spectrum Prediction for Small Molecules using
Graph Transformers [3.2951121243459522]
タンデム質量スペクトルは、分子に関する重要な構造情報を提供する断片化パターンをキャプチャする。
70年以上にわたり、スペクトル予測はこの分野において重要な課題であり続けている。
我々はタンデム質量スペクトルを正確に予測する新しいモデルMassFormerを提案する。
論文 参考訳(メタデータ) (2021-11-08T20:55:15Z) - Spectral Analysis Network for Deep Representation Learning and Image
Clustering [53.415803942270685]
本稿ではスペクトル分析に基づく教師なし深層表現学習のための新しいネットワーク構造を提案する。
パッチレベルで画像間の局所的な類似性を識別できるため、閉塞に対してより堅牢である。
クラスタリングに親しみやすい表現を学習し、データサンプル間の深い相関を明らかにすることができる。
論文 参考訳(メタデータ) (2020-09-11T05:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。