論文の概要: Towards Less Biased Data-driven Scoring with Deep Learning-Based End-to-end Database Search in Tandem Mass Spectrometry
- arxiv url: http://arxiv.org/abs/2405.06511v1
- Date: Wed, 8 May 2024 19:39:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-13 15:38:11.176505
- Title: Towards Less Biased Data-driven Scoring with Deep Learning-Based End-to-end Database Search in Tandem Mass Spectrometry
- Title(参考訳): タンデム質量分析法における深層学習に基づくエンド・ツー・エンドデータベース探索によるバイアスの少ないデータ駆動スコーリング
- Authors: Yonghan Yu, Ming Li,
- Abstract要約: DeepSearchは、タンデム質量分析のための最初のディープラーニングベースのエンドツーエンドデータベース検索手法である。
イオン対イオンマッチングに依存する従来の方法とは異なり、DeepSearchはペプチドスペクトルマッチングをスコアするデータ駆動アプローチを採用している。
また、DeepSearchは、変数の翻訳後の修正をゼロショットでプロファイルできる、最初のディープラーニングベースの方法である。
- 参考スコア(独自算出の注目度): 5.830420622355277
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Peptide identification in mass spectrometry-based proteomics is crucial for understanding protein function and dynamics. Traditional database search methods, though widely used, rely on heuristic scoring functions and statistical estimations have to be introduced for a higher identification rate. Here, we introduce DeepSearch, the first deep learning-based end-to-end database search method for tandem mass spectrometry. DeepSearch leverages a modified transformer-based encoder-decoder architecture under the contrastive learning framework. Unlike conventional methods that rely on ion-to-ion matching, DeepSearch adopts a data-driven approach to score peptide spectrum matches. DeepSearch is also the first deep learning-based method that can profile variable post-translational modifications in a zero-shot manner. We showed that DeepSearch's scoring scheme expressed less bias and did not require any statistical estimation. We validated DeepSearch's accuracy and robustness across various datasets, including those from species with diverse protein compositions and a modification-enriched dataset. DeepSearch sheds new light on database search methods in tandem mass spectrometry.
- Abstract(参考訳): 質量分析に基づくプロテオミクスにおけるペプチドの同定はタンパク質の機能や力学を理解する上で重要である。
従来のデータベース検索手法は広く使われているが、ヒューリスティックスコアリング機能に依存しており、高い識別率のために統計的推定を導入する必要がある。
本稿では,タンデム質量分析のためのディープラーニングベースのエンドツーエンドデータベース検索手法であるDeepSearchを紹介する。
DeepSearchは、改良されたトランスフォーマーベースのエンコーダ-デコーダアーキテクチャを、対照的な学習フレームワークの下で活用する。
イオン対イオンマッチングに依存する従来の方法とは異なり、DeepSearchはペプチドスペクトルマッチングをスコアするデータ駆動アプローチを採用している。
また、DeepSearchは、変数の翻訳後の修正をゼロショットでプロファイルできる、最初のディープラーニングベースの方法である。
We showed that DeepSearch's score scheme expressed less bias and not required any statistics estimation。
DeepSearchの正確性と堅牢性は,多様なタンパク質組成を持つ種や改良されたデータセットを含む,さまざまなデータセットにわたって検証した。
DeepSearchはタンデム質量分析法でデータベース検索方法に新たな光を放つ。
関連論文リスト
- Approaching Metaheuristic Deep Learning Combos for Automated Data Mining [0.5419570023862531]
本研究では,メタヒューリスティック手法を従来の分類器やニューラルネットワークと組み合わせて自動データマイニングを行う手法を提案する。
手書き文字認識のためのMNISTデータセットの実験を行った。
根拠真理ラベル付きデータセットの検証精度は、これまで見つからなかった他のデータインスタンスのラベルを修正するのに不十分である、という実証的な観察がなされた。
論文 参考訳(メタデータ) (2024-10-16T10:28:22Z) - VectorSearch: Enhancing Document Retrieval with Semantic Embeddings and
Optimized Search [1.0411820336052784]
本稿では、高度なアルゴリズム、埋め込み、インデックス化技術を活用して洗練された検索を行うVectorSearchを提案する。
提案手法は,革新的なマルチベクタ探索操作と高度な言語モデルによる検索の符号化を利用して,検索精度を大幅に向上させる。
実世界のデータセットの実験では、VectorSearchがベースラインのメトリクスを上回っている。
論文 参考訳(メタデータ) (2024-09-25T21:58:08Z) - Leveraging Mixture of Experts for Improved Speech Deepfake Detection [53.69740463004446]
スピーチのディープフェイクは、個人のセキュリティとコンテンツの信頼性に重大な脅威をもたらす。
本研究では,Mixture of Expertsアーキテクチャを用いた音声深度検出性能の向上のための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-24T13:24:03Z) - Robust Depth Enhancement via Polarization Prompt Fusion Tuning [112.88371907047396]
様々な深度センサによる不正確な深度測定を改善するために偏光イメージングを利用するフレームワークを提案する。
まず、偏光データとセンサ深度マップから高密度で完全な深度マップを推定するために、ニューラルネットワークを訓練した学習ベースの戦略を採用する。
大規模データセット上で事前学習したRGBモデルを有効に活用するためのPPFT(Polarization Prompt Fusion Tuning)戦略を提案する。
論文 参考訳(メタデータ) (2024-04-05T17:55:33Z) - ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide
Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。
ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文 参考訳(メタデータ) (2023-12-18T12:49:46Z) - Quantum search algorithm on weighted databases [5.229564709919574]
グロバーアルゴリズムは非構造化探索問題に対処するための重要な解法である。
本研究は,非一様分散データベースにおけるGroverの探索手法を幅広く検討する。
この進化によって促進される探索過程が、常にスピードアップするわけではないことが観察された。
論文 参考訳(メタデータ) (2023-12-04T03:15:02Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - On tuning deep learning models: a data mining perspective [0.0]
4種類のディープラーニングアルゴリズムをチューニングとデータマイニングの観点から検討した。
特徴の数は、ディープラーニングアルゴリズムの精度の低下に寄与していない。
データマイニングの観点で、信頼できる結果に到達するためには、均一な分布がより重要である。
論文 参考訳(メタデータ) (2020-11-19T14:40:42Z) - A Hierarchical Approach to Scaling Batch Active Search Over Structured
Data [0.5076419064097732]
本稿では,能動探索を大規模なバッチサイズに拡張するために,帯域幅アルゴリズムに基づく汎用階層型フレームワークを提案する。
HBBSの応用は、大規模なバッチ実験が研究プロセスに欠かせない現代生物学に重点を置いている。
論文 参考訳(メタデータ) (2020-07-20T16:50:25Z) - PyODDS: An End-to-end Outlier Detection System with Automated Machine
Learning [55.32009000204512]
PyODDSは、データベースサポート付きアウトレイラ検出のための、エンドツーエンドのPythonシステムである。
具体的には,探索空間を外乱検出パイプラインで定義し,与えられた探索空間内で探索戦略を作成する。
また、データサイエンスや機械学習のバックグラウンドの有無に関わらず、統一されたインターフェイスと視覚化を提供する。
論文 参考訳(メタデータ) (2020-03-12T03:30:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。