論文の概要: Universal Biological Sequence Reranking for Improved De Novo Peptide Sequencing
- arxiv url: http://arxiv.org/abs/2505.17552v1
- Date: Fri, 23 May 2025 06:56:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.884474
- Title: Universal Biological Sequence Reranking for Improved De Novo Peptide Sequencing
- Title(参考訳): 改良型デノボペプチドシークエンシングのためのユニバーサルバイオシークエンス
- Authors: Zijie Qiu, Jiaqi Wei, Xiang Zhang, Sheng Xu, Kai Zou, Zhi Jin, Zhiqiang Gao, Nanqing Dong, Siqi Sun,
- Abstract要約: RankNovoは、de novoペプチドシークエンシングを強化する最初の深層構造である。
我々の研究は、既存のシングルモデルパラダイムに挑戦し、正確なde novoシークエンシングのフロンティアを前進させる新しい戦略を提示する。
- 参考スコア(独自算出の注目度): 32.29218860420551
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: De novo peptide sequencing is a critical task in proteomics. However, the performance of current deep learning-based methods is limited by the inherent complexity of mass spectrometry data and the heterogeneous distribution of noise signals, leading to data-specific biases. We present RankNovo, the first deep reranking framework that enhances de novo peptide sequencing by leveraging the complementary strengths of multiple sequencing models. RankNovo employs a list-wise reranking approach, modeling candidate peptides as multiple sequence alignments and utilizing axial attention to extract informative features across candidates. Additionally, we introduce two new metrics, PMD (Peptide Mass Deviation) and RMD (residual Mass Deviation), which offer delicate supervision by quantifying mass differences between peptides at both the sequence and residue levels. Extensive experiments demonstrate that RankNovo not only surpasses its base models used to generate training candidates for reranking pre-training, but also sets a new state-of-the-art benchmark. Moreover, RankNovo exhibits strong zero-shot generalization to unseen models whose generations were not exposed during training, highlighting its robustness and potential as a universal reranking framework for peptide sequencing. Our work presents a novel reranking strategy that fundamentally challenges existing single-model paradigms and advances the frontier of accurate de novo sequencing. Our source code is provided on GitHub.
- Abstract(参考訳): デノボペプチドシークエンシングはプロテオミクスにおいて重要な課題である。
しかし、現在の深層学習法の性能は、質量分析データの本質的な複雑さとノイズ信号の不均一分布によって制限され、データ固有のバイアスをもたらす。
複数塩基配列モデルの相補的強みを活用することにより,de novoペプチドシークエンシングを強化する最初の深層構造である RankNovo を提示する。
RankNovoはリストワイドのアプローチを採用し、候補ペプチドを複数の配列アライメントとしてモデル化し、軸方向の注意を利用して候補間の情報的特徴を抽出する。
さらに, PMD (Peptide Mass Deviation) と RMD (Residual Mass Deviation) という2つの新しい指標を導入する。
大規模な実験では、RangNovoは事前トレーニングのトレーニング候補を生成するために使用されるベースモデルを上回るだけでなく、新しい最先端のベンチマークも設定している。
さらに、RandNovoは、トレーニング中に世代が明らかにされていない未確認モデルに対して強力なゼロショット一般化を示し、ペプチドシークエンシングの普遍的な再分類フレームワークとして、その堅牢性と可能性を強調している。
我々の研究は、既存のシングルモデルパラダイムに根本的に挑戦し、正確なde novoシークエンシングのフロンティアを前進させる新しい戦略を提示する。
ソースコードはGitHubで提供されている。
関連論文リスト
- NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide
Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。
ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文 参考訳(メタデータ) (2023-12-18T12:49:46Z) - TWINS: A Fine-Tuning Framework for Improved Transferability of
Adversarial Robustness and Generalization [89.54947228958494]
本稿では,様々な分類タスクにおいて,逆向きに事前訓練されたモデルの微調整に焦点を当てる。
本稿では,TWINS(Two-WIng NormliSation)ファインチューニングフレームワークを提案する。
TWINSは、一般化とロバスト性の両方の観点から、幅広い画像分類データセットに有効であることが示されている。
論文 参考訳(メタデータ) (2023-03-20T14:12:55Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Diversifying Design of Nucleic Acid Aptamers Using Unsupervised Machine
Learning [54.247560894146105]
短い一本鎖RNAとDNA配列(アプタマー)の逆設計は、一連の望ましい基準を満たす配列を見つけるタスクである。
我々は、Pottsモデルとして知られる教師なし機械学習モデルを用いて、制御可能なシーケンスの多様性を持つ新しい有用なシーケンスを発見することを提案する。
論文 参考訳(メタデータ) (2022-08-10T13:30:58Z) - Predicting the Binding of SARS-CoV-2 Peptides to the Major
Histocompatibility Complex with Recurrent Neural Networks [0.40040974874482094]
我々は、繰り返しニューラルネットワークに基づく概念的にシンプルな予測アルゴリズムであるUSMPepを適応し、拡張する。
最近リリースされたSARS-CoV-2データセットの性能をバインディング安定性測定で評価します。
論文 参考訳(メタデータ) (2021-04-16T17:16:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。