論文の概要: NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics
- arxiv url: http://arxiv.org/abs/2406.11906v2
- Date: Thu, 31 Oct 2024 08:54:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-01 16:56:51.185091
- Title: NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics
- Title(参考訳): NovoBench: プロテオミクスにおけるDe Novo Peptideシークエンシング手法のベンチマーク
- Authors: Jingbo Zhou, Shaorong Chen, Jun Xia, Sizhe Liu, Tianze Ling, Wenjie Du, Yue Liu, Jianwei Yin, Stan Z. Li,
- Abstract要約: Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
- 参考スコア(独自算出の注目度): 58.03989832372747
- License:
- Abstract: Tandem mass spectrometry has played a pivotal role in advancing proteomics, enabling the high-throughput analysis of protein composition in biological tissues. Many deep learning methods have been developed for \emph{de novo} peptide sequencing task, i.e., predicting the peptide sequence for the observed mass spectrum. However, two key challenges seriously hinder the further advancement of this important task. Firstly, since there is no consensus for the evaluation datasets, the empirical results in different research papers are often not comparable, leading to unfair comparison. Secondly, the current methods are usually limited to amino acid-level or peptide-level precision and recall metrics. In this work, we present the first unified benchmark NovoBench for \emph{de novo} peptide sequencing, which comprises diverse mass spectrum data, integrated models, and comprehensive evaluation metrics. Recent impressive methods, including DeepNovo, PointNovo, Casanovo, InstaNovo, AdaNovo and $\pi$-HelixNovo are integrated into our framework. In addition to amino acid-level and peptide-level precision and recall, we evaluate the models' performance in terms of identifying post-tranlational modifications (PTMs), efficiency and robustness to peptide length, noise peaks and missing fragment ratio, which are important influencing factors while seldom be considered. Leveraging this benchmark, we conduct a large-scale study of current methods, report many insightful findings that open up new possibilities for future development.
- Abstract(参考訳): タンデム質量分析法はプロテオミクスの進行において重要な役割を担い、生体組織におけるタンパク質組成の高スループット解析を可能にした。
多くのディープラーニング法が、観測された質量スペクトルのペプチド配列を予測するために、emph{de novo}ペプチドシークエンシングタスクのために開発された。
しかし、2つの重要な課題は、この重要なタスクのさらなる進歩を著しく妨げている。
第一に、評価データセットにはコンセンサスがないため、異なる研究論文における実証結果は、しばしば比較されないため、不公平な比較に繋がる。
第二に、現在の方法は通常アミノ酸レベルまたはペプチドレベルの精度とリコール基準に制限される。
本研究では,多種多様な質量スペクトルデータ,統合モデル,総合的評価指標を含む,最初の統一ベンチマークであるNovoBenchを,<emph{de novo}ペプチドシークエンシングのために提示する。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、および$\pi$-HelixNovoといった最近の素晴らしい方法が私たちのフレームワークに統合されています。
アミノ酸レベルおよびペプチドレベルの精度とリコールに加えて, 翻訳後修飾 (PTM) の同定, ペプチド長, ノイズピーク, フラグメントの欠落率などのモデルの性能評価を行った。
このベンチマークを利用して、我々は現在の手法を大規模に研究し、多くの洞察に富んだ発見を報告し、今後の発展への新たな可能性を開く。
関連論文リスト
- MeToken: Uniform Micro-environment Token Boosts Post-Translational Modification Prediction [65.33218256339151]
翻訳後修飾(PTM)はプロテオームの複雑さと機能を大幅に拡張する。
既存の計算手法は主に、配列依存的なモチーフの認識によって引き起こされる、PTM部位を予測するタンパク質配列に焦点を当てている。
本稿では,各酸のマイクロ環境をトークン化し,シーケンス情報と構造情報を統一された離散トークンに統合するMeTokenモデルを提案する。
論文 参考訳(メタデータ) (2024-11-04T07:14:28Z) - AdaNovo: Adaptive \emph{De Novo} Peptide Sequencing with Conditional Mutual Information [46.23980841020632]
本稿では,各アミノ酸/ペプチド間の条件付き相互情報(CMI)を計算する新しいフレームワークであるAdaNovoを提案する。
AdaNovoは翻訳後修飾(PTM)によるアミノ酸の同定に優れ、データノイズに対する堅牢性を示す。
論文 参考訳(メタデータ) (2024-03-09T11:54:58Z) - Transformer-based de novo peptide sequencing for data-independent acquisition mass spectrometry [1.338778493151964]
本稿では,変換器アーキテクチャに基づくディープラーニングモデルであるDiaTransを紹介する。
DIA質量分析データからペプチド配列を解読する。
その結果,既存のSTOA法よりも大幅に改善した。
論文 参考訳(メタデータ) (2024-02-17T19:04:23Z) - ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide
Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。
ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文 参考訳(メタデータ) (2023-12-18T12:49:46Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - DePS: An improved deep learning model for de novo peptide sequencing [7.468176246958974]
そこで本研究では,de novoペプチドシークエンシングの精度を向上させる改良モデルであるDePSを提案する。
同じDeepNovoV2の試験セットでは、DePSモデルは、それぞれ74.22%、74.21%、および41.68%の優れた結果を得た。
論文 参考訳(メタデータ) (2022-03-16T16:45:48Z) - PointIso: Point Cloud Based Deep Learning Model for Detecting
Arbitrary-Precision Peptide Features in LC-MS Map through Attention Based
Segmentation [5.495506445661776]
PointIsoは、ペプチドの特徴検出の問題を解決するために、ポイントクラウドベースの任意の精度のディープラーニングネットワークである。
ベンチマークデータセットにおいて、高品質なMS/MS識別を98%検出する。
論文 参考訳(メタデータ) (2020-09-15T17:34:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。