論文の概要: JESTR: Joint Embedding Space Technique for Ranking Candidate Molecules for the Annotation of Untargeted Metabolomics Data
- arxiv url: http://arxiv.org/abs/2411.14464v1
- Date: Mon, 18 Nov 2024 03:03:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-25 15:03:37.634247
- Title: JESTR: Joint Embedding Space Technique for Ranking Candidate Molecules for the Annotation of Untargeted Metabolomics Data
- Title(参考訳): JESTR:未ターゲット代謝データのアノテーションのための候補分子のランク付けのための共同埋め込み空間技術
- Authors: Apurva Kalia, Dilip Krishnan, Soha Hassoun,
- Abstract要約: アノテーションのための新しいパラダイム(JESTR)を導入する。
分子指紋やスペクトルを明示的に構築する以前のアプローチとは異なり、JESTRはそれらの表現を共同空間に埋め込む。
JESTRを3つのデータセット上でmol-to-specおよびspec-to-FPアノテーションツールに対して評価する。
- 参考スコア(独自算出の注目度): 8.964879518873591
- License:
- Abstract: Motivation: A major challenge in metabolomics is annotation: assigning molecular structures to mass spectral fragmentation patterns. Despite recent advances in molecule-to-spectra and in spectra-to-molecular fingerprint prediction (FP), annotation rates remain low. Results: We introduce in this paper a novel paradigm (JESTR) for annotation. Unlike prior approaches that explicitly construct molecular fingerprints or spectra, JESTR leverages the insight that molecules and their corresponding spectra are views of the same data and effectively embeds their representations in a joint space. Candidate structures are ranked based on cosine similarity between the embeddings of query spectrum and each candidate. We evaluate JESTR against mol-to-spec and spec-to-FP annotation tools on three datasets. On average, for rank@[1-5], JESTR outperforms other tools by 23.6%-71.6%. We further demonstrate the strong value of regularization with candidate molecules during training, boosting rank@1 performance by 11.4% and enhancing the model's ability to discern between target and candidate molecules. Through JESTR, we offer a novel promising avenue towards accurate annotation, therefore unlocking valuable insights into the metabolome.
- Abstract(参考訳): モチベーション(Motivation): メタボロミクスにおける大きな課題は、質量スペクトルの断片化パターンに分子構造を割り当てることである。
近年の分子対分光法やスペクトル対分子の指紋予測(FP)の進歩にもかかわらず、アノテーション率は低いままである。
結果:本論文ではアノテーションのための新しいパラダイム(JESTR)を紹介する。
分子指紋やスペクトルを明示的に構築する以前のアプローチとは異なり、JESTRは分子とその対応するスペクトルが同じデータのビューであり、それらの表現を共同空間に効果的に埋め込むという知見を利用する。
候補構造は、クエリスペクトルの埋め込みと各候補とのコサイン類似性に基づいてランク付けされる。
JESTRを3つのデータセット上でmol-to-specおよびspec-to-FPアノテーションツールに対して評価する。
ランク@[1-5]では、JESTRは他のツールを23.6%から71.6%上回っている。
さらに、トレーニング中の候補分子による正則化の強い価値を示し、ランク@1のパフォーマンスを11.4%向上させ、ターゲット分子と候補分子を識別するモデルの能力を高める。
JESTRを通じて、正確なアノテーションへの新たな道程を提供し、メタボロームに関する貴重な知見を解放する。
関連論文リスト
- Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。
KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。
この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文 参考訳(メタデータ) (2025-02-17T11:53:58Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。
我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。
実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Graph-based Molecular In-context Learning Grounded on Morgan Fingerprints [28.262593876388397]
In-context Learning (ICL) では、プロパティ予測や分子キャプションなどの分子タスクのための大規模言語モデル(LLM)を、慎重に選択された実演例を入力プロンプトに埋め込む。
しかし、現在の分子タスクのプロンプト検索法は、モーガン指紋のような分子の特徴的類似性に依存しており、これはグローバル分子と原子結合の関係を適切に捉えていない。
本稿では,グローバル分子構造をグラフニューラルネットワーク(GNN)とテキストキャプション(記述)に整合させ,モーガン指紋による局所的特徴類似性を活用する自己教師付き学習手法GAMICを提案する。
論文 参考訳(メタデータ) (2025-02-08T02:46:33Z) - SpecTUS: Spectral Translator for Unknown Structures annotation from EI-MS spectra [0.0]
我々は、小分子の構造アノテーションのタスクに対処するディープニューラルネットワークであるSpecTUS: Spectral Translator for Unknown Structuresを提案する。
我々のモデルは、スペクトルから2次元表現への直接変換である構造的テクスムデノボの方法でスペクトルを解析する。
異なるライブラリにまたがる新規構造アノテーションタスクのモデルに対する厳密な評価では,標準データベース検索手法よりも広い範囲で性能が向上した。
論文 参考訳(メタデータ) (2025-02-07T17:36:13Z) - MADGEN: Mass-Spec attends to De Novo Molecular generation [16.89017809745962]
質量分析データを用いたデノボ分子構造生成のための足場に基づく手法を提案する。
MADGENは、足場検索とスペクトル条件分子生成の2段階で動作する。
我々は3つのデータセット(NIST23、CANOPUS、MassSpecGym)上でMADGENを評価する。
論文 参考訳(メタデータ) (2025-01-03T18:54:26Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Graph neural networks for the prediction of molecular structure-property
relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。
GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。
本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文 参考訳(メタデータ) (2022-07-25T11:30:44Z) - Ensemble Spectral Prediction (ESP) Model for Metabolite Annotation [10.640447979978436]
メタボロミクスの鍵となる課題は、化学的なアイデンティティを持つ生物学的サンプルから測定されたスペクトルを注釈付けすることである。
メタボライトアノテーションのための新しい機械学習モデルEnsemble Spectral Prediction (ESP)を提案する。
論文 参考訳(メタデータ) (2022-03-25T17:05:41Z) - Unsupervised Machine Learning for Exploratory Data Analysis of Exoplanet
Transmission Spectra [68.8204255655161]
我々は、通過する太陽系外惑星のスペクトルデータを解析するための教師なし手法に焦点をあてる。
スペクトルデータには、適切な低次元表現を要求する高い相関関係があることが示される。
主成分に基づく興味深い構造、すなわち、異なる化学状態に対応する明確に定義された分岐を明らかにする。
論文 参考訳(メタデータ) (2022-01-07T22:26:33Z) - MassFormer: Tandem Mass Spectrum Prediction for Small Molecules using
Graph Transformers [3.2951121243459522]
タンデム質量スペクトルは、分子に関する重要な構造情報を提供する断片化パターンをキャプチャする。
70年以上にわたり、スペクトル予測はこの分野において重要な課題であり続けている。
我々はタンデム質量スペクトルを正確に予測する新しいモデルMassFormerを提案する。
論文 参考訳(メタデータ) (2021-11-08T20:55:15Z) - Distance-aware Molecule Graph Attention Network for Drug-Target Binding
Affinity Prediction [54.93890176891602]
薬物標的結合親和性予測に適したDiStance-aware Molecule graph Attention Network (S-MAN)を提案する。
そこで,我々はまず,構築したポケットリガンドグラフに位相構造と空間位置情報を統合する位置符号化機構を提案する。
また,エッジレベルアグリゲーションとノードレベルアグリゲーションを有するエッジノード階層的アグリゲーション構造を提案する。
論文 参考訳(メタデータ) (2020-12-17T17:44:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。