論文の概要: Accurate de novo sequencing of the modified proteome with OmniNovo
- arxiv url: http://arxiv.org/abs/2512.12272v1
- Date: Sat, 13 Dec 2025 10:27:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.192898
- Title: Accurate de novo sequencing of the modified proteome with OmniNovo
- Title(参考訳): OmniNovoによる修飾プロテオームの正確なnovoシークエンシング
- Authors: Yuhan Chen, Shang Qu, Zhiqiang Gao, Yuejin Yang, Xiang Zhang, Sheng Xu, Xinjie Mao, Liujia Qian, Jiaqi Wei, Zijie Qiu, Chenyu You, Lei Bai, Ning Ding, Tiannan Guo, Bowen Zhou, Siqi Sun,
- Abstract要約: タンデム質量スペクトルから直接ペプチドの参照なしシークエンシングのための統合ディープラーニングフレームワークであるOmniNovoを紹介する。
オムニノヴォは、質量制限された復号アルゴリズムと厳密な偽発見率の推定を統合することで、最先端の精度を達成し、1%の偽発見率で標準アプローチよりも51%多くのペプチドを同定する。
重要なことに、このモデルは、トレーニング中に見えない生物の部位に一般化し、プロテオームの暗黒物質を照らし、細胞制御の偏りのない包括的解析を可能にする。
- 参考スコア(独自算出の注目度): 39.43336836259004
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Post-translational modifications (PTMs) serve as a dynamic chemical language regulating protein function, yet current proteomic methods remain blind to a vast portion of the modified proteome. Standard database search algorithms suffer from a combinatorial explosion of search spaces, limiting the identification of uncharacterized or complex modifications. Here we introduce OmniNovo, a unified deep learning framework for reference-free sequencing of unmodified and modified peptides directly from tandem mass spectra. Unlike existing tools restricted to specific modification types, OmniNovo learns universal fragmentation rules to decipher diverse PTMs within a single coherent model. By integrating a mass-constrained decoding algorithm with rigorous false discovery rate estimation, OmniNovo achieves state-of-the-art accuracy, identifying 51\% more peptides than standard approaches at a 1\% false discovery rate. Crucially, the model generalizes to biological sites unseen during training, illuminating the dark matter of the proteome and enabling unbiased comprehensive analysis of cellular regulation.
- Abstract(参考訳): 翻訳後修飾(PTM)は動的化学言語制御タンパク質の機能として機能するが、現在のプロテオミクス法は修飾プロテオームの大部分に盲目のままである。
標準的なデータベース検索アルゴリズムは、検索空間の組合せ的な爆発に悩まされ、非文字化または複雑な修正の識別が制限される。
ここでは,未修飾および修飾ペプチドのタンデム質量スペクトルから直接の参照なしシークエンシングのための統合ディープラーニングフレームワークであるOmniNovoを紹介する。
特定の修正タイプに限定された既存のツールとは異なり、OmniNovoは単一のコヒーレントモデル内で多様なPTMを解読する普遍的な断片化規則を学ぶ。
オムニノヴォは、質量制限された復号アルゴリズムと厳密な偽発見率推定を統合することにより、最先端の精度を達成し、標準手法よりも51倍のペプチドを1倍の偽発見率で同定する。
重要なことに、このモデルは、トレーニング中に見えない生物の部位に一般化し、プロテオームの暗黒物質を照らし、細胞制御の偏りのない包括的解析を可能にする。
関連論文リスト
- Self Distillation Fine-Tuning of Protein Language Models Improves Versatility in Protein Design [61.2846583160056]
Supervised Fine-tuning (SFT) は、大規模言語モデルを特殊なドメインに適応するための標準的なアプローチである。
これは、高品質なアノテートされたデータは、自然言語よりもタンパク質の入手がはるかに難しいためである。
生成したタンパク質配列の忠実度,信頼性,新規性を改善するために設計された,PLMの高速SFTのための簡易かつ汎用的なレシピを提案する。
論文 参考訳(メタデータ) (2025-12-10T05:34:47Z) - Meta-Learning for Cross-Task Generalization in Protein Mutation Property Prediction [9.083239192939661]
モデル非依存型メタラーニング(MAML)のタンパク質突然変異特性予測への応用について紹介する。
また,シークエンスに変異を直接組み込むために,セパレータトークンを用いた新規な突然変異符号化戦略を導入する。
我々の突然変異エンコーディングは、標準的なトランスフォーマーが未知のトークンとして突然変異位置を扱い、性能を著しく低下させる限界に対処する。
論文 参考訳(メタデータ) (2025-10-23T19:09:06Z) - pUniFind: a unified large pre-trained deep learning model pushing the limit of mass spectra interpretation [9.27319322606124]
pUniFindは、エンド・ツー・エンドのペプチド・スペクトルスコアとオープン・ゼロショット・デ・ノボシークエンシングを統合している。
免疫ペプチドミクスでは、同定されたペプチドの数が42.6%増加する。
pUniFindは、300倍の検索スペースがあるにもかかわらず、既存のde novoメソッドよりも60%多いPSMを識別する。
論文 参考訳(メタデータ) (2025-06-30T08:32:39Z) - Peptide Sequencing Via Protein Language Models [0.0]
アミノ酸の限られた配列の測定に基づいてペプチドの完全配列を決定するためのタンパク質言語モデルを提案する。
本手法は, 特定が困難であるアミノ酸を選択的にマスキングすることにより, 部分的シークエンシングデータをシミュレートする。
アミノ酸が4つしか知られていない場合、アミノ酸当たりの精度は90.5%に達する。
論文 参考訳(メタデータ) (2024-08-01T20:12:49Z) - NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - AdaNovo: Adaptive \emph{De Novo} Peptide Sequencing with Conditional Mutual Information [46.23980841020632]
本稿では,各アミノ酸/ペプチド間の条件付き相互情報(CMI)を計算する新しいフレームワークであるAdaNovoを提案する。
AdaNovoは翻訳後修飾(PTM)によるアミノ酸の同定に優れ、データノイズに対する堅牢性を示す。
論文 参考訳(メタデータ) (2024-03-09T11:54:58Z) - ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide
Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。
ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文 参考訳(メタデータ) (2023-12-18T12:49:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。