論文の概要: Regressor-guided Diffusion Model for De Novo Peptide Sequencing with Explicit Mass Control
- arxiv url: http://arxiv.org/abs/2602.20209v1
- Date: Mon, 23 Feb 2026 03:26:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.469203
- Title: Regressor-guided Diffusion Model for De Novo Peptide Sequencing with Explicit Mass Control
- Title(参考訳): デノボペプチドシークエンシングにおける質量制御による回帰誘導拡散モデル
- Authors: Shaorong Chen, Jingbo Zhou, Jun Xia,
- Abstract要約: 本稿では,デノボペプチド配列決定のための回帰誘導拡散モデルであるDiffuNovoを紹介した。
提案手法は, トレーニング中に新しいペプチドレベルの質量損失がモデル最適化を誘導する一方で, 遅延空間における勾配に基づく更新からの回帰に基づくガイダンスは, 予測されたペプチドを質量制約に固執するように生成する。
- 参考スコア(独自算出の注目度): 21.55210993203977
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The discovery of novel proteins relies on sensitive protein identification, for which de novo peptide sequencing (DNPS) from mass spectra is a crucial approach. While deep learning has advanced DNPS, existing models inadequately enforce the fundamental mass consistency constraint, that a predicted peptide's mass must match the experimental measured precursor mass. Previous DNPS methods often treat this critical information as a simple input feature or use it in post-processing, leading to numerous implausible predictions that do not adhere to this fundamental physical property. To address this limitation, we introduce DiffuNovo, a novel regressor-guided diffusion model for de novo peptide sequencing that provides explicit peptide-level mass control. Our approach integrates the mass constraint at two critical stages: during training, a novel peptide-level mass loss guides model optimization, while at inference, regressor-based guidance from gradient-based updates in the latent space steers the generation to compel the predicted peptide adheres to the mass constraint. Comprehensive evaluations on established benchmarks demonstrate that DiffuNovo surpasses state-of-the-art methods in DNPS accuracy. Additionally, as the first DNPS model to employ a diffusion model as its core backbone, DiffuNovo leverages the powerful controllability of diffusion architecture and achieves a significant reduction in mass error, thereby producing much more physically plausible peptides. These innovations represent a substantial advancement toward robust and broadly applicable DNPS. The source code is available in the supplementary material.
- Abstract(参考訳): 新規タンパク質の発見は、質量スペクトルからのde novoペプチドシークエンシング(DNPS)が重要なアプローチであるセンシティブなタンパク質の同定に依存している。
深層学習はDNPSを進歩させてきたが、既存のモデルは、予測されたペプチドの質量が実験的に測定された前駆体質量と一致しなければならないという基本的な質量一貫性の制約を不適切に強制している。
以前のDNPS法では、この重要な情報を単純な入力の特徴として扱ったり、後処理で使ったりすることが多かったため、この基本的な物理的性質に固執しない多くの予測が導かれる。
この制限に対処するためにDiffuNovoを紹介した。DiffuNovoはデノボペプチドシークエンシングのための新規なレグレクター誘導拡散モデルであり、明確なペプチドレベルの質量制御を提供する。
提案手法は, トレーニング中に新しいペプチドレベルの質量損失がモデル最適化を誘導する一方で, 遅延空間における勾配に基づく更新からの回帰に基づくガイダンスは, 予測されたペプチドを質量制約に固執するように生成する。
確立されたベンチマークに関する総合的な評価は、DiffuNovoがDNPSの精度で最先端の手法を超越していることを示している。
さらに、拡散モデルを使用した最初のDNPSモデルとして、拡散アーキテクチャの強力な制御性を活用し、質量誤差の大幅な低減を実現し、より物理的に可塑性なペプチドを生成する。
これらの革新は、堅牢で広く適用可能なDNPSへの実質的な進歩を表している。
ソースコードは補足資料で入手できる。
関連論文リスト
- PepEDiff: Zero-Shot Peptide Binder Design via Protein Embedding Diffusion [3.9876702935151225]
本稿では、標的受容体タンパク質配列とそのポケット残基の結合配列を設計する新規ペプチドバインダージェネレータであるPepediffを紹介する。
本手法は, 予め訓練されたタンパク質の埋め込みモデルから導かれる連続潜伏空間において, バインダー配列を直接生成することによって既存の手法から逸脱する。
その単純さにもかかわらず、ベンチマークテストやTIGITケーススタディにおいて、我々の手法は最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2026-01-19T19:07:32Z) - Training-Free Stein Diffusion Guidance: Posterior Correction for Sampling Beyond High-Density Regions [46.59494117137471]
自由拡散誘導の訓練は、追加の訓練なしに既成の分類器を活用する柔軟な方法を提供する。
本稿では,SOC を対象とする新たなトレーニングフリーフレームワークである Stein Diffusion Guidance (SDG) を紹介する。
分子低密度サンプリングタスクの実験は、SDGが標準のトレーニングフリーガイダンス手法を一貫して上回っていることを示唆している。
論文 参考訳(メタデータ) (2025-07-07T21:14:27Z) - Reimagining Target-Aware Molecular Generation through Retrieval-Enhanced Aligned Diffusion [22.204642926984526]
Retrieval-Augmented GenerationとSE(3)-同変拡散モデルとを融合した最初のREADが導入された。
CBGBenchでは非常に競争力があり、最先端のジェネレーティブモデルやネイティブな足場を超越している。
論文 参考訳(メタデータ) (2025-06-17T13:09:11Z) - Universal Biological Sequence Reranking for Improved De Novo Peptide Sequencing [32.29218860420551]
RankNovoは、de novoペプチドシークエンシングを強化する最初の深層構造である。
我々の研究は、既存のシングルモデルパラダイムに挑戦し、正確なde novoシークエンシングのフロンティアを前進させる新しい戦略を提示する。
論文 参考訳(メタデータ) (2025-05-23T06:56:55Z) - Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。
私たちのフレームワークは、3つの新しい目標のファミリーにつながります。
Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文 参考訳(メタデータ) (2024-10-10T17:18:30Z) - NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。