論文の概要: PepHarmony: A Multi-View Contrastive Learning Framework for Integrated
Sequence and Structure-Based Peptide Encoding
- arxiv url: http://arxiv.org/abs/2401.11360v1
- Date: Sun, 21 Jan 2024 01:16:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 16:56:15.529962
- Title: PepHarmony: A Multi-View Contrastive Learning Framework for Integrated
Sequence and Structure-Based Peptide Encoding
- Title(参考訳): PepHarmony: 統合シーケンスと構造に基づくペプチドエンコーディングのための多視点コントラスト学習フレームワーク
- Authors: Ruochi Zhang, Haoran Wu, Chang Liu, Huaping Li, Yuqian Wu, Kewei Li,
Yifan Wang, Yifan Deng, Jiahui Chen, Fengfeng Zhou, Xin Gao
- Abstract要約: 本研究は、配列に基づくペプチド符号化タスクのための、新しいマルチビューコントラスト学習フレームワークであるPepHarmonyを紹介する。
タンパク質データバンク(PDB)とAlphaFoldデータベースから、幅広いペプチド配列と構造を含むデータセットを慎重に選択する。
実験データではペプハーモニーのペプチド配列と構造の間の複雑な関係を捉える能力が強調されている。
- 参考スコア(独自算出の注目度): 21.126660909515607
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advances in protein language models have catalyzed significant
progress in peptide sequence representation. Despite extensive exploration in
this field, pre-trained models tailored for peptide-specific needs remain
largely unaddressed due to the difficulty in capturing the complex and
sometimes unstable structures of peptides. This study introduces a novel
multi-view contrastive learning framework PepHarmony for the sequence-based
peptide encoding task. PepHarmony innovatively combines both sequence- and
structure-level information into a sequence-level encoding module through
contrastive learning. We carefully select datasets from the Protein Data Bank
(PDB) and AlphaFold database to encompass a broad spectrum of peptide sequences
and structures. The experimental data highlights PepHarmony's exceptional
capability in capturing the intricate relationship between peptide sequences
and structures compared with the baseline and fine-tuned models. The robustness
of our model is confirmed through extensive ablation studies, which emphasize
the crucial roles of contrastive loss and strategic data sorting in enhancing
predictive performance. The proposed PepHarmony framework serves as a notable
contribution to peptide representations, and offers valuable insights for
future applications in peptide drug discovery and peptide engineering. We have
made all the source code utilized in this study publicly accessible via GitHub
at https://github.com/zhangruochi/PepHarmony or
http://www.healthinformaticslab.org/supp/.
- Abstract(参考訳): タンパク質言語モデルの最近の進歩は、ペプチド配列の表現に大きな進歩をもたらした。
この分野での広範な探索にもかかわらず、ペプチド特有のニーズに合わせた事前訓練されたモデルは、ペプチドの複雑な構造や不安定な構造を捉えるのが難しいため、ほとんど役に立たないままである。
本研究では,配列に基づくペプチドエンコーディングタスクのための,新しい多視点コントラスト学習フレームワークPepHarmonyを紹介する。
pepharmonyは、コントラスト学習を通じて、シーケンスレベルおよび構造レベルの情報をシーケンスレベルのエンコーディングモジュールに革新的に結合する。
タンパク質データバンク(pdb)とアルファフォールドデータベースからデータセットを慎重に選択し、ペプチド配列と構造を包含する。
実験データでは、ペプハーモニーがペプチド配列と構造の間の複雑な関係をベースラインモデルと微調整モデルと比較する際、異常な能力を示した。
本モデルのロバスト性は広範なアブレーション研究によって確認され,予測性能向上におけるコントラスト損失と戦略データソートの重要な役割を強調する。
提案されたPepHarmonyフレームワークはペプチド表現への顕著な貢献であり、ペプチド薬物発見およびペプチド工学における将来の応用に有用な洞察を提供する。
この研究で使われているすべてのソースコードは、githubのhttps://github.com/zhangruochi/pepharmonyまたはhttp://www.healthinformaticslab.org/supp/で公開されている。
関連論文リスト
- NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - Full-Atom Peptide Design based on Multi-modal Flow Matching [32.58558711545861]
フル原子ペプチドの設計のためのフローマッチングフレームワークを基盤とした,最初のマルチモーダル深層生成モデルであるPepFlowについて述べる。
高次元トーラス上で,$mathrmSE(3)$多様体内の剛性バックボーンフレームと側鎖角を用いてペプチド構造を特徴付ける。
提案手法は,固定バックボーンシーケンス設計や部分サンプリングによるサイドチェーンパッキングなど,様々なタスクに順応的に取り組む。
論文 参考訳(メタデータ) (2024-06-02T12:59:54Z) - PPFlow: Target-aware Peptide Design with Torsional Flow Matching [52.567714059931646]
ペプチド構造設計のためのねじれ角の内部構造をモデル化するために,textscPPFlowと呼ばれるターゲット認識型ペプチド設計手法を提案する。
さらに, PPBench2024というタンパク質-ペプチド結合データセットを構築した。
論文 参考訳(メタデータ) (2024-03-05T13:26:42Z) - PepGB: Facilitating peptide drug discovery via graph neural networks [36.744839520938825]
ペプチド-タンパク質相互作用(PepPIs)を予測することにより、ペプチドの早期発見を容易にする深層学習フレームワークPepGBを提案する。
我々は、リード生成と最適化プロセスでよく見られる高度に不均衡なデータのモデリングのボトルネックに取り組むために、拡張バージョンの diPepGB を導出する。
論文 参考訳(メタデータ) (2024-01-26T06:13:09Z) - ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide
Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。
ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文 参考訳(メタデータ) (2023-12-18T12:49:46Z) - Co-modeling the Sequential and Graphical Routes for Peptide
Representation Learning [67.66393016797181]
本稿では,表現の相互情報を強化するためのペプチド共モデリング手法RepConを提案する。
RepConは、正のサンプルペア間の表現の一貫性を高め、負のペア間の表現を撃退することを学ぶ。
この結果から,コモデリング手法が独立モデルよりも優れていること,コモデリングフレームワーク下での他の手法よりもRepConの方が優れていることが示唆された。
論文 参考訳(メタデータ) (2023-10-04T16:58:25Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - Pre-training Co-evolutionary Protein Representation via A Pairwise
Masked Language Model [93.9943278892735]
タンパク質配列表現学習の鍵となる問題は、配列中の残基間の共変量によって反映される共進化情報をキャプチャすることである。
Pairwise Masked Language Model (PMLM) と呼ばれる専用言語モデルによる事前学習により,この情報を直接キャプチャする新しい手法を提案する。
提案手法は, 相互関係を効果的に把握し, ベースラインと比較して, 接触予測性能を最大9%向上できることを示す。
論文 参考訳(メタデータ) (2021-10-29T04:01:32Z) - Interpretable Structured Learning with Sparse Gated Sequence Encoder for
Protein-Protein Interaction Prediction [2.9488233765621295]
アミノ酸配列から情報表現を学習することでタンパク質-タンパク質相互作用(PPI)を予測することは、生物学において難しいが重要な問題である。
我々は、シーケンスのみからPPIをモデル化し、予測するための新しいディープフレームワークを提案する。
本モデルでは,シーケンスからコンテキスト化およびシーケンシャル情報を活用することによってシーケンス表現を学習するための双方向ゲート再帰ユニットを組み込んだ。
論文 参考訳(メタデータ) (2020-10-16T17:13:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。