論文の概要: Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding
- arxiv url: http://arxiv.org/abs/2307.09169v1
- Date: Mon, 17 Jul 2023 00:43:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 15:02:28.635378
- Title: Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding
- Title(参考訳): 逐次および図形エンコーディングによるペプチド自己組織化の効率的予測
- Authors: Zihan Liu, Jiaqi Wang, Yun Luo, Shuang Zhao, Wenbin Li, Stan Z. Li
- Abstract要約: この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
- 参考スコア(独自算出の注目度): 57.89530563948755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, there has been an explosion of research on the application
of deep learning to the prediction of various peptide properties, due to the
significant development and market potential of peptides. Molecular dynamics
has enabled the efficient collection of large peptide datasets, providing
reliable training data for deep learning. However, the lack of systematic
analysis of the peptide encoding, which is essential for AI-assisted
peptide-related tasks, makes it an urgent problem to be solved for the
improvement of prediction accuracy. To address this issue, we first collect a
high-quality, colossal simulation dataset of peptide self-assembly containing
over 62,000 samples generated by coarse-grained molecular dynamics (CGMD).
Then, we systematically investigate the effect of peptide encoding of amino
acids into sequences and molecular graphs using state-of-the-art sequential
(i.e., RNN, LSTM, and Transformer) and structural deep learning models (i.e.,
GCN, GAT, and GraphSAGE), on the accuracy of peptide self-assembly prediction,
an essential physiochemical process prior to any peptide-related applications.
Extensive benchmarking studies have proven Transformer to be the most powerful
sequence-encoding-based deep learning model, pushing the limit of peptide
self-assembly prediction to decapeptides. In summary, this work provides a
comprehensive benchmark analysis of peptide encoding with advanced deep
learning models, serving as a guide for a wide range of peptide-related
predictions such as isoelectric points, hydration free energy, etc.
- Abstract(参考訳): 近年,様々なペプチド特性の予測への深層学習の応用に関する研究が爆発的に増えている。
分子動力学は大きなペプチドデータセットの効率的な収集を可能にし、ディープラーニングのための信頼性の高いトレーニングデータを提供する。
しかし、AIによるペプチド関連タスクに不可欠なペプチドエンコーディングの体系的解析が欠如しているため、予測精度の向上のためには緊急に解決すべき課題である。
この問題に対処するため,我々はまず,粗粒分子動力学(cgmd)によって生成された62,000以上のサンプルを含むペプチド自己組織化の高品質なコロッサルシミュレーションデータセットを収集した。
そこで本研究では, ペプチド自己組織化予測の精度, ペプチド関連応用に先立って, ペプチド自己組織化予測の精度について, 最先端シーケンシャル(rnn, lstm, トランスフォーマー)と構造深層学習モデル(gcn, gat, グラフセージ)を用いて, アミノ酸を配列や分子グラフにコードするペプチドが与える影響を体系的に検討した。
広範なベンチマーク研究により、transformerは最も強力なシーケンスエンコーディングベースのディープラーニングモデルであることが証明され、ペプチド自己組織化予測の限界をデカペプチドに押し上げている。
要約すると、この研究は高度なディープラーニングモデルを用いたペプチドエンコーディングの総合的なベンチマーク分析を提供し、等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
関連論文リスト
- MeToken: Uniform Micro-environment Token Boosts Post-Translational Modification Prediction [65.33218256339151]
翻訳後修飾(PTM)はプロテオームの複雑さと機能を大幅に拡張する。
既存の計算手法は主に、配列依存的なモチーフの認識によって引き起こされる、PTM部位を予測するタンパク質配列に焦点を当てている。
本稿では,各酸のマイクロ環境をトークン化し,シーケンス情報と構造情報を統一された離散トークンに統合するMeTokenモデルを提案する。
論文 参考訳(メタデータ) (2024-11-04T07:14:28Z) - Exploring Latent Space for Generating Peptide Analogs Using Protein Language Models [1.5146068448101742]
提案手法は,大規模データセットの必要を回避し,関心の連続を1つだけ要求する。
ペプチド構造, 転写因子, 生体活性の類似度指標では, ベースラインモデルよりも有意に改善した。
論文 参考訳(メタデータ) (2024-08-15T13:37:27Z) - Multi-Peptide: Multimodality Leveraged Language-Graph Learning of Peptide Properties [5.812284760539713]
Multi-Peptideは、トランスフォーマーベースの言語モデルとグラフニューラルネットワーク(GNN)を組み合わせてペプチドの性質を予測する革新的なアプローチである。
溶血性データセットおよび非汚泥性データセットの評価は、多ペプチドの堅牢性を示し、溶血性予測における最先端86.185%の精度を達成する。
本研究は, 生体情報学におけるマルチモーダル学習の可能性を強調し, ペプチドを用いた研究・応用における正確かつ信頼性の高い予測方法を模索する。
論文 参考訳(メタデータ) (2024-07-02T20:13:47Z) - NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - PPFlow: Target-aware Peptide Design with Torsional Flow Matching [52.567714059931646]
ペプチド構造設計のためのねじれ角の内部構造をモデル化するために,textscPPFlowと呼ばれるターゲット認識型ペプチド設計手法を提案する。
さらに, PPBench2024というタンパク質-ペプチド結合データセットを構築した。
論文 参考訳(メタデータ) (2024-03-05T13:26:42Z) - PepGB: Facilitating peptide drug discovery via graph neural networks [36.744839520938825]
ペプチド-タンパク質相互作用(PepPIs)を予測することにより、ペプチドの早期発見を容易にする深層学習フレームワークPepGBを提案する。
我々は、リード生成と最適化プロセスでよく見られる高度に不均衡なデータのモデリングのボトルネックに取り組むために、拡張バージョンの diPepGB を導出する。
論文 参考訳(メタデータ) (2024-01-26T06:13:09Z) - PepHarmony: A Multi-View Contrastive Learning Framework for Integrated
Sequence and Structure-Based Peptide Encoding [21.126660909515607]
本研究は、配列に基づくペプチド符号化タスクのための、新しいマルチビューコントラスト学習フレームワークであるPepHarmonyを紹介する。
タンパク質データバンク(PDB)とAlphaFoldデータベースから、幅広いペプチド配列と構造を含むデータセットを慎重に選択する。
実験データではペプハーモニーのペプチド配列と構造の間の複雑な関係を捉える能力が強調されている。
論文 参考訳(メタデータ) (2024-01-21T01:16:53Z) - ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide
Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。
ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文 参考訳(メタデータ) (2023-12-18T12:49:46Z) - Reprogramming Pretrained Language Models for Protein Sequence
Representation Learning [68.75392232599654]
エンドツーエンドの表現学習フレームワークである辞書学習(R2DL)による表現学習を提案する。
R2DLは、タンパク質配列の埋め込みを学ぶために、事前訓練された英語モデルを再プログラムする。
我々のモデルは,事前訓練および標準教師付き手法によって設定されたベースラインに対して,最大105ドルの精度でデータ効率を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-01-05T15:55:18Z) - Interpretable Structured Learning with Sparse Gated Sequence Encoder for
Protein-Protein Interaction Prediction [2.9488233765621295]
アミノ酸配列から情報表現を学習することでタンパク質-タンパク質相互作用(PPI)を予測することは、生物学において難しいが重要な問題である。
我々は、シーケンスのみからPPIをモデル化し、予測するための新しいディープフレームワークを提案する。
本モデルでは,シーケンスからコンテキスト化およびシーケンシャル情報を活用することによってシーケンス表現を学習するための双方向ゲート再帰ユニットを組み込んだ。
論文 参考訳(メタデータ) (2020-10-16T17:13:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。