論文の概要: Towards Less Biased Data-driven Scoring with Deep Learning-Based End-to-end Database Search in Tandem Mass Spectrometry
- arxiv url: http://arxiv.org/abs/2405.06511v1
- Date: Wed, 8 May 2024 19:39:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-13 15:38:11.176505
- Title: Towards Less Biased Data-driven Scoring with Deep Learning-Based End-to-end Database Search in Tandem Mass Spectrometry
- Title(参考訳): タンデム質量分析法における深層学習に基づくエンド・ツー・エンドデータベース探索によるバイアスの少ないデータ駆動スコーリング
- Authors: Yonghan Yu, Ming Li,
- Abstract要約: DeepSearchは、タンデム質量分析のための最初のディープラーニングベースのエンドツーエンドデータベース検索手法である。
イオン対イオンマッチングに依存する従来の方法とは異なり、DeepSearchはペプチドスペクトルマッチングをスコアするデータ駆動アプローチを採用している。
また、DeepSearchは、変数の翻訳後の修正をゼロショットでプロファイルできる、最初のディープラーニングベースの方法である。
- 参考スコア(独自算出の注目度): 5.830420622355277
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Peptide identification in mass spectrometry-based proteomics is crucial for understanding protein function and dynamics. Traditional database search methods, though widely used, rely on heuristic scoring functions and statistical estimations have to be introduced for a higher identification rate. Here, we introduce DeepSearch, the first deep learning-based end-to-end database search method for tandem mass spectrometry. DeepSearch leverages a modified transformer-based encoder-decoder architecture under the contrastive learning framework. Unlike conventional methods that rely on ion-to-ion matching, DeepSearch adopts a data-driven approach to score peptide spectrum matches. DeepSearch is also the first deep learning-based method that can profile variable post-translational modifications in a zero-shot manner. We showed that DeepSearch's scoring scheme expressed less bias and did not require any statistical estimation. We validated DeepSearch's accuracy and robustness across various datasets, including those from species with diverse protein compositions and a modification-enriched dataset. DeepSearch sheds new light on database search methods in tandem mass spectrometry.
- Abstract(参考訳): 質量分析に基づくプロテオミクスにおけるペプチドの同定はタンパク質の機能や力学を理解する上で重要である。
従来のデータベース検索手法は広く使われているが、ヒューリスティックスコアリング機能に依存しており、高い識別率のために統計的推定を導入する必要がある。
本稿では,タンデム質量分析のためのディープラーニングベースのエンドツーエンドデータベース検索手法であるDeepSearchを紹介する。
DeepSearchは、改良されたトランスフォーマーベースのエンコーダ-デコーダアーキテクチャを、対照的な学習フレームワークの下で活用する。
イオン対イオンマッチングに依存する従来の方法とは異なり、DeepSearchはペプチドスペクトルマッチングをスコアするデータ駆動アプローチを採用している。
また、DeepSearchは、変数の翻訳後の修正をゼロショットでプロファイルできる、最初のディープラーニングベースの方法である。
We showed that DeepSearch's score scheme expressed less bias and not required any statistics estimation。
DeepSearchの正確性と堅牢性は,多様なタンパク質組成を持つ種や改良されたデータセットを含む,さまざまなデータセットにわたって検証した。
DeepSearchはタンデム質量分析法でデータベース検索方法に新たな光を放つ。
関連論文リスト
- NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - Robust Depth Enhancement via Polarization Prompt Fusion Tuning [112.88371907047396]
様々な深度センサによる不正確な深度測定を改善するために偏光イメージングを利用するフレームワークを提案する。
まず、偏光データとセンサ深度マップから高密度で完全な深度マップを推定するために、ニューラルネットワークを訓練した学習ベースの戦略を採用する。
大規模データセット上で事前学習したRGBモデルを有効に活用するためのPPFT(Polarization Prompt Fusion Tuning)戦略を提案する。
論文 参考訳(メタデータ) (2024-04-05T17:55:33Z) - ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide
Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。
ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文 参考訳(メタデータ) (2023-12-18T12:49:46Z) - Quantum search algorithm on weighted databases [5.229564709919574]
グロバーアルゴリズムは非構造化探索問題に対処するための重要な解法である。
本研究は,非一様分散データベースにおけるGroverの探索手法を幅広く検討する。
この進化によって促進される探索過程が、常にスピードアップするわけではないことが観察された。
論文 参考訳(メタデータ) (2023-12-04T03:15:02Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - Generalized Approach to Matched Filtering using Neural Networks [4.535489275919893]
我々は,新たな深層学習と従来の技術との関係について重要な観察を行う。
一致するフィルタリングは、特定のニューラルネットワークと正式に等価です。
提案するニューラルネットワークアーキテクチャがマッチングフィルタリングよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-08T17:59:07Z) - On tuning deep learning models: a data mining perspective [0.0]
4種類のディープラーニングアルゴリズムをチューニングとデータマイニングの観点から検討した。
特徴の数は、ディープラーニングアルゴリズムの精度の低下に寄与していない。
データマイニングの観点で、信頼できる結果に到達するためには、均一な分布がより重要である。
論文 参考訳(メタデータ) (2020-11-19T14:40:42Z) - PointIso: Point Cloud Based Deep Learning Model for Detecting
Arbitrary-Precision Peptide Features in LC-MS Map through Attention Based
Segmentation [5.495506445661776]
PointIsoは、ペプチドの特徴検出の問題を解決するために、ポイントクラウドベースの任意の精度のディープラーニングネットワークである。
ベンチマークデータセットにおいて、高品質なMS/MS識別を98%検出する。
論文 参考訳(メタデータ) (2020-09-15T17:34:14Z) - A Hierarchical Approach to Scaling Batch Active Search Over Structured
Data [0.5076419064097732]
本稿では,能動探索を大規模なバッチサイズに拡張するために,帯域幅アルゴリズムに基づく汎用階層型フレームワークを提案する。
HBBSの応用は、大規模なバッチ実験が研究プロセスに欠かせない現代生物学に重点を置いている。
論文 参考訳(メタデータ) (2020-07-20T16:50:25Z) - PyODDS: An End-to-end Outlier Detection System with Automated Machine
Learning [55.32009000204512]
PyODDSは、データベースサポート付きアウトレイラ検出のための、エンドツーエンドのPythonシステムである。
具体的には,探索空間を外乱検出パイプラインで定義し,与えられた探索空間内で探索戦略を作成する。
また、データサイエンスや機械学習のバックグラウンドの有無に関わらず、統一されたインターフェイスと視覚化を提供する。
論文 参考訳(メタデータ) (2020-03-12T03:30:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。