論文の概要: Diffusion Decoding for Peptide De Novo Sequencing
- arxiv url: http://arxiv.org/abs/2507.10955v1
- Date: Tue, 15 Jul 2025 03:38:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:02.969769
- Title: Diffusion Decoding for Peptide De Novo Sequencing
- Title(参考訳): ペプチドデノボシークエンシングのための拡散復号法
- Authors: Chi-en Amy Tai, Alexander Wong,
- Abstract要約: 本稿では,離散データ領域に適応した拡散デコーダについて検討する。
これらのデコーダは異なるアプローチを提供し、任意のペプチドセグメントからシーケンス生成を開始することができる。
ペプチドの精度とリコールは依然として0であったが, DINOISER損失関数を用いた最も優れた拡散デコーダ設計により, 0.373でアミノ酸リコールの統計的改善が得られた。
- 参考スコア(独自算出の注目度): 71.91773485443125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Peptide de novo sequencing is a method used to reconstruct amino acid sequences from tandem mass spectrometry data without relying on existing protein sequence databases. Traditional deep learning approaches, such as Casanovo, mainly utilize autoregressive decoders and predict amino acids sequentially. Subsequently, they encounter cascading errors and fail to leverage high-confidence regions effectively. To address these issues, this paper investigates using diffusion decoders adapted for the discrete data domain. These decoders provide a different approach, allowing sequence generation to start from any peptide segment, thereby enhancing prediction accuracy. We experiment with three different diffusion decoder designs, knapsack beam search, and various loss functions. We find knapsack beam search did not improve performance metrics and simply replacing the transformer decoder with a diffusion decoder lowered performance. Although peptide precision and recall were still 0, the best diffusion decoder design with the DINOISER loss function obtained a statistically significant improvement in amino acid recall by 0.373 compared to the baseline autoregressive decoder-based Casanovo model. These findings highlight the potential of diffusion decoders to not only enhance model sensitivity but also drive significant advancements in peptide de novo sequencing.
- Abstract(参考訳): ペプチドデノボシークエンシング(Peptide de novo Sequencing)は、タンデム質量分析データから既存のタンパク質配列データベースに頼ることなくアミノ酸配列を再構成する手法である。
Casanovoのような伝統的なディープラーニングアプローチは、主に自己回帰デコーダを使用し、アミノ酸を逐次予測する。
その後、カスケードエラーに遭遇し、高信頼領域を効果的に活用できない。
これらの問題に対処するために,離散データ領域に適応した拡散デコーダについて検討する。
これらのデコーダは異なるアプローチを提供し、シーケンス生成が任意のペプチドセグメントから開始され、予測精度が向上する。
我々は,3種類の拡散デコーダ設計,クナップサックビーム探索,各種損失関数の実験を行った。
我々は、knapsackビームサーチは性能指標を改善せず、単にトランスフォーマーデコーダを拡散デコーダに置き換えて性能を低下させた。
ペプチドの精度とリコールは依然として0であったが, DINOISER損失関数を用いた最も優れた拡散デコーダ設計は, 塩基性自己回帰デコーダをベースとしたCasanovoモデルと比較して, 0.373で統計的に有意な改善が得られた。
これらの知見は,拡散デコーダがモデル感度を高めるだけでなく,ペプチドデノボシークエンシングの大幅な進歩をもたらす可能性を示唆している。
関連論文リスト
- Geometry-Preserving Encoder/Decoder in Latent Generative Models [13.703752179071333]
本稿では,VAEと異なる理論的特性を持つ新しいエンコーダ/デコーダフレームワークを提案する。
エンコーダとデコーダの両方のトレーニングプロセスにおいて,この幾何保存エンコーダの重要な利点を示す。
論文 参考訳(メタデータ) (2025-01-16T23:14:34Z) - Estimating the Decoding Failure Rate of Binary Regular Codes Using Iterative Decoding [84.0257274213152]
並列ビットフリップデコーダのDFRを高精度に推定する手法を提案する。
本研究は,本症候群のモデル化およびシミュレーションによる重み比較,第1イテレーション終了時の誤りビット分布の誤検出,復号化復号化率(DFR)について検証した。
論文 参考訳(メタデータ) (2024-01-30T11:40:24Z) - ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide
Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。
ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文 参考訳(メタデータ) (2023-12-18T12:49:46Z) - Graph Neural Networks for Enhanced Decoding of Quantum LDPC Codes [6.175503577352742]
量子低密度パリティチェック(LDPC)符号に対する微分可能な反復デコーダを提案する。
提案アルゴリズムは,古典的信念伝達(BP)復号段階と中間グラフニューラルネットワーク(GNN)層から構成される。
論文 参考訳(メタデータ) (2023-10-26T19:56:25Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - Diffusion-Based Speech Enhancement with Joint Generative and Predictive
Decoders [38.78712921188612]
本稿では,2段階にわたる共同生成型および予測型デコーダを用いた統合システムを提案する。
Voice-Bankデータセットで実施された実験は、予測情報を組み込むことで、より高速な復号化とより高いPSSQスコアが得られることを示した。
論文 参考訳(メタデータ) (2023-05-18T06:10:49Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Denoising Diffusion Error Correction Codes [92.10654749898927]
近年、ニューラルデコーダは古典的デコーダ技術に対する優位性を実証している。
最近の最先端のニューラルデコーダは複雑で、多くのレガシデコーダの重要な反復的スキームが欠如している。
本稿では,任意のブロック長の線形符号のソフトデコードにデノナイズ拡散モデルを適用することを提案する。
論文 参考訳(メタデータ) (2022-09-16T11:00:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。