Fugu-MT 論文翻訳(概要): AdaNovo: Adaptive \emph{De Novo} Peptide Sequencing with Conditional Mutual Information

論文の概要: AdaNovo: Adaptive \emph{De Novo} Peptide Sequencing with Conditional Mutual Information

arxiv url: http://arxiv.org/abs/2403.07013v1
Date: Sat, 9 Mar 2024 11:54:58 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-14 00:11:42.673642
Title: AdaNovo: Adaptive \emph{De Novo} Peptide Sequencing with Conditional Mutual Information
Title（参考訳）: AdaNovo: 条件付き相互情報を用いたアダプティブ \emph{De Novo} ペプチドシークエンシング
Authors: Jun Xia, Shaorong Chen, Jingbo Zhou, Tianze Lin, Wenjie Du, Sizhe Liu, Stan Z. Li
Abstract要約: 本稿では,各アミノ酸/ペプチド間の条件付き相互情報(CMI)を計算する新しいフレームワークであるAdaNovoを提案する。 AdaNovoは翻訳後修飾(PTM)によるアミノ酸の同定に優れ、データノイズに対する堅牢性を示す。
参考スコア（独自算出の注目度）: 48.55853692544708
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Tandem mass spectrometry has played a pivotal role in advancing proteomics, enabling the analysis of protein composition in biological samples. Despite the development of various deep learning methods for identifying amino acid sequences (peptides) responsible for observed spectra, challenges persist in \emph{de novo} peptide sequencing. Firstly, prior methods struggle to identify amino acids with post-translational modifications (PTMs) due to their lower frequency in training data compared to canonical amino acids, further resulting in decreased peptide-level identification precision. Secondly, diverse types of noise and missing peaks in mass spectra reduce the reliability of training data (peptide-spectrum matches, PSMs). To address these challenges, we propose AdaNovo, a novel framework that calculates conditional mutual information (CMI) between the spectrum and each amino acid/peptide, using CMI for adaptive model training. Extensive experiments demonstrate AdaNovo's state-of-the-art performance on a 9-species benchmark, where the peptides in the training set are almost completely disjoint from the peptides of the test sets. Moreover, AdaNovo excels in identifying amino acids with PTMs and exhibits robustness against data noise. The supplementary materials contain the official code.
Abstract（参考訳）: タンデム質量分析はプロテオミクスの進歩において重要な役割を担い、生体試料中のタンパク質組成の分析を可能にした。観察されたスペクトルに責任を持つアミノ酸配列(ペプチド)を同定するための様々な深層学習法の開発にもかかわらず、課題は 'emph{de novo} peptide sequencing' に持続する。第一に、以前の方法は、標準アミノ酸と比較してトレーニングデータの頻度が低いため、翻訳後修飾(ptm)によってアミノ酸の同定に苦労し、さらにペプチドレベルの同定精度が低下した。第二に、質量スペクトルにおける様々なノイズやピークの欠如により、トレーニングデータの信頼性が低下する(ペプチド-スペクトルマッチング、PSMs)。これらの課題に対処するために、適応モデルトレーニングにCMIを用いて、スペクトルと各アミノ酸/ペプチド間の条件相互情報(CMI)を計算する新しいフレームワークであるAdaNovoを提案する。広範な実験により、アダノヴォの9種ベンチマークにおける最先端のパフォーマンスが示され、トレーニングセット内のペプチドがテストセットのペプチドとほぼ完全に無関係である。さらに、AdaNovoはアミノ酸をPTMで同定し、データノイズに対して堅牢性を示す。補充資料には公式コードが含まれている。

関連論文リスト

PLAME: Leveraging Pretrained Language Models to Generate Enhanced Protein Multiple Sequence Alignments [53.55710514466851]
タンパク質構造予測は、薬物の発見と生物学的機能の理解に不可欠である。ほとんどの折り畳みモデルは予測性能を高めるために多重シーケンスアライメント(MSA)に大きく依存している。我々は、事前学習されたタンパク質言語モデルからの進化的埋め込みを利用する新しいMSA設計モデルPLAMEを提案する。
論文参考訳（メタデータ） (2025-06-17T04:11:30Z)
MeToken: Uniform Micro-environment Token Boosts Post-Translational Modification Prediction [65.33218256339151]
翻訳後修飾(PTM)はプロテオームの複雑さと機能を大幅に拡張する。既存の計算手法は主に、配列依存的なモチーフの認識によって引き起こされる、PTM部位を予測するタンパク質配列に焦点を当てている。本稿では,各酸のマイクロ環境をトークン化し,シーケンス情報と構造情報を統一された離散トークンに統合するMeTokenモデルを提案する。
論文参考訳（メタデータ） (2024-11-04T07:14:28Z)
Peptide Sequencing Via Protein Language Models [0.0]
アミノ酸の限られた配列の測定に基づいてペプチドの完全配列を決定するためのタンパク質言語モデルを提案する。本手法は, 特定が困難であるアミノ酸を選択的にマスキングすることにより, 部分的シークエンシングデータをシミュレートする。アミノ酸が4つしか知られていない場合、アミノ酸当たりの精度は90.5%に達する。
論文参考訳（メタデータ） (2024-08-01T20:12:49Z)
NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。 DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文参考訳（メタデータ） (2024-06-16T08:23:21Z)
Transformer-based de novo peptide sequencing for data-independent acquisition mass spectrometry [1.338778493151964]
本稿では,変換器アーキテクチャに基づくディープラーニングモデルであるDiaTransを紹介する。 DIA質量分析データからペプチド配列を解読する。その結果,既存のSTOA法よりも大幅に改善した。
論文参考訳（メタデータ） (2024-02-17T19:04:23Z)
PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。 CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-13T03:51:10Z)
ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。 ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文参考訳（メタデータ） (2023-12-18T12:49:46Z)
Efficient Prediction of Peptide Self-assembly through Sequential and Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文参考訳（メタデータ） (2023-07-17T00:43:33Z)
DPST: De Novo Peptide Sequencing with Amino-Acid-Aware Transformers [11.527280359634524]
デノボペプチドシークエンシングは、タンデム質量分析(MS)データからペプチドのアミノ酸配列を復元することを目的としている。デノボ分析のための既存のアプローチは、推論中に全てのアミノ酸のクラスについてMSの証拠を列挙している。我々のアプローチであるDPSTは、これらの制限を2つの重要なコンポーネントで回避する。
論文参考訳（メタデータ） (2022-03-23T08:01:06Z)
DePS: An improved deep learning model for de novo peptide sequencing [7.468176246958974]
そこで本研究では,de novoペプチドシークエンシングの精度を向上させる改良モデルであるDePSを提案する。同じDeepNovoV2の試験セットでは、DePSモデルは、それぞれ74.22%、74.21%、および41.68%の優れた結果を得た。
論文参考訳（メタデータ） (2022-03-16T16:45:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。