論文の概要: Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding
- arxiv url: http://arxiv.org/abs/2307.09169v1
- Date: Mon, 17 Jul 2023 00:43:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 15:02:28.635378
- Title: Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding
- Title(参考訳): 逐次および図形エンコーディングによるペプチド自己組織化の効率的予測
- Authors: Zihan Liu, Jiaqi Wang, Yun Luo, Shuang Zhao, Wenbin Li, Stan Z. Li
- Abstract要約: この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
- 参考スコア(独自算出の注目度): 57.89530563948755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, there has been an explosion of research on the application
of deep learning to the prediction of various peptide properties, due to the
significant development and market potential of peptides. Molecular dynamics
has enabled the efficient collection of large peptide datasets, providing
reliable training data for deep learning. However, the lack of systematic
analysis of the peptide encoding, which is essential for AI-assisted
peptide-related tasks, makes it an urgent problem to be solved for the
improvement of prediction accuracy. To address this issue, we first collect a
high-quality, colossal simulation dataset of peptide self-assembly containing
over 62,000 samples generated by coarse-grained molecular dynamics (CGMD).
Then, we systematically investigate the effect of peptide encoding of amino
acids into sequences and molecular graphs using state-of-the-art sequential
(i.e., RNN, LSTM, and Transformer) and structural deep learning models (i.e.,
GCN, GAT, and GraphSAGE), on the accuracy of peptide self-assembly prediction,
an essential physiochemical process prior to any peptide-related applications.
Extensive benchmarking studies have proven Transformer to be the most powerful
sequence-encoding-based deep learning model, pushing the limit of peptide
self-assembly prediction to decapeptides. In summary, this work provides a
comprehensive benchmark analysis of peptide encoding with advanced deep
learning models, serving as a guide for a wide range of peptide-related
predictions such as isoelectric points, hydration free energy, etc.
- Abstract(参考訳): 近年,様々なペプチド特性の予測への深層学習の応用に関する研究が爆発的に増えている。
分子動力学は大きなペプチドデータセットの効率的な収集を可能にし、ディープラーニングのための信頼性の高いトレーニングデータを提供する。
しかし、AIによるペプチド関連タスクに不可欠なペプチドエンコーディングの体系的解析が欠如しているため、予測精度の向上のためには緊急に解決すべき課題である。
この問題に対処するため,我々はまず,粗粒分子動力学(cgmd)によって生成された62,000以上のサンプルを含むペプチド自己組織化の高品質なコロッサルシミュレーションデータセットを収集した。
そこで本研究では, ペプチド自己組織化予測の精度, ペプチド関連応用に先立って, ペプチド自己組織化予測の精度について, 最先端シーケンシャル(rnn, lstm, トランスフォーマー)と構造深層学習モデル(gcn, gat, グラフセージ)を用いて, アミノ酸を配列や分子グラフにコードするペプチドが与える影響を体系的に検討した。
広範なベンチマーク研究により、transformerは最も強力なシーケンスエンコーディングベースのディープラーニングモデルであることが証明され、ペプチド自己組織化予測の限界をデカペプチドに押し上げている。
要約すると、この研究は高度なディープラーニングモデルを用いたペプチドエンコーディングの総合的なベンチマーク分析を提供し、等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
関連論文リスト
- AdaNovo: Adaptive \emph{De Novo} Peptide Sequencing with Conditional
Mutual Information [48.55853692544708]
本稿では,各アミノ酸/ペプチド間の条件付き相互情報(CMI)を計算する新しいフレームワークであるAdaNovoを提案する。
AdaNovoは翻訳後修飾(PTM)によるアミノ酸の同定に優れ、データノイズに対する堅牢性を示す。
論文 参考訳(メタデータ) (2024-03-09T11:54:58Z) - PepGB: Facilitating peptide drug discovery via graph neural networks [36.744839520938825]
ペプチド-タンパク質相互作用(PepPIs)を予測することにより、ペプチドの早期発見を容易にする深層学習フレームワークPepGBを提案する。
我々は、リード生成と最適化プロセスでよく見られる高度に不均衡なデータのモデリングのボトルネックに取り組むために、拡張バージョンの diPepGB を導出する。
論文 参考訳(メタデータ) (2024-01-26T06:13:09Z) - PepHarmony: A Multi-View Contrastive Learning Framework for Integrated
Sequence and Structure-Based Peptide Encoding [21.126660909515607]
本研究は、配列に基づくペプチド符号化タスクのための、新しいマルチビューコントラスト学習フレームワークであるPepHarmonyを紹介する。
タンパク質データバンク(PDB)とAlphaFoldデータベースから、幅広いペプチド配列と構造を含むデータセットを慎重に選択する。
実験データではペプハーモニーのペプチド配列と構造の間の複雑な関係を捉える能力が強調されている。
論文 参考訳(メタデータ) (2024-01-21T01:16:53Z) - ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide
Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。
ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文 参考訳(メタデータ) (2023-12-18T12:49:46Z) - pLMFPPred: a novel approach for accurate prediction of functional
peptides integrating embedding from pre-trained protein language model and
imbalanced learning [7.5449239162950965]
pLPredは、機能性ペプチドを予測し、有毒ペプチドを同定するためのツールである。
検証された独立テストセットでは、pLPredは精度、曲線下エリア - 受信者動作特性、F1スコア値はそれぞれ0.974、0.99、0.974が達成された。
論文 参考訳(メタデータ) (2023-09-25T17:57:39Z) - Fast and Functional Structured Data Generators Rooted in
Out-of-Equilibrium Physics [62.997667081978825]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - Reprogramming Pretrained Language Models for Protein Sequence
Representation Learning [68.75392232599654]
エンドツーエンドの表現学習フレームワークである辞書学習(R2DL)による表現学習を提案する。
R2DLは、タンパク質配列の埋め込みを学ぶために、事前訓練された英語モデルを再プログラムする。
我々のモデルは,事前訓練および標準教師付き手法によって設定されたベースラインに対して,最大105ドルの精度でデータ効率を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-01-05T15:55:18Z) - Low cost prediction of probability distributions of molecular properties
for early virtual screening [0.8702432681310399]
本稿では, 階層的相関再構築手法を適用し, 人口統計, 財務, 天文学的データの解析に応用した。
この手法は、望まれる物理化学的/ADMET特性の可能性が低い化合物の迅速な拒絶を可能にするため、医薬化学者にとって大きな支援となる。
論文 参考訳(メタデータ) (2022-07-21T13:29:26Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Interpretable Structured Learning with Sparse Gated Sequence Encoder for
Protein-Protein Interaction Prediction [2.9488233765621295]
アミノ酸配列から情報表現を学習することでタンパク質-タンパク質相互作用(PPI)を予測することは、生物学において難しいが重要な問題である。
我々は、シーケンスのみからPPIをモデル化し、予測するための新しいディープフレームワークを提案する。
本モデルでは,シーケンスからコンテキスト化およびシーケンシャル情報を活用することによってシーケンス表現を学習するための双方向ゲート再帰ユニットを組み込んだ。
論文 参考訳(メタデータ) (2020-10-16T17:13:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。