論文の概要: Protein 3D structure-based neural networks highly improve the accuracy
in compound-protein binding affinity prediction
- arxiv url: http://arxiv.org/abs/2204.12586v1
- Date: Wed, 30 Mar 2022 00:44:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-01 09:24:52.672956
- Title: Protein 3D structure-based neural networks highly improve the accuracy
in compound-protein binding affinity prediction
- Title(参考訳): タンパク質3d構造に基づくニューラルネットワークによる複合タンパク質結合親和性予測の精度向上
- Authors: Binjie Guo, Hanyu Zheng, Huan Huang, Haohan Jiang, Xiaodan Li, Naiyu
Guan, Yanming Zuo, Yicheng Zhang, Hengfu Yang, Xuhua Wang
- Abstract要約: 我々は,タンパク質3D構造情報の複合タンパク質結合親和性(CPAs)予測への応用を容易にするために,高速進化的注意と粗いグラフニューラルネットワーク(FeatNN)を開発した。
FeatNNはCPA予測において様々な最先端のベースラインをかなり上回り、ピアソン値は約35.7%上昇した。
- 参考スコア(独自算出の注目度): 7.059949221160259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Theoretically, the accuracy of computational models in predicting
compound-protein binding affinities (CPAs) could be improved by the
introduction of protein 3D structure information. However, most of these models
still suffer from a low accuracy due to the lack of an efficient approach to
encode informative protein features. The major challenge is how to combine the
multi-modal information such as the residue sequence of the protein, residue
atom coordinates and the torsion angles. To tackle this problem, we develop
Fast Evolutional Attention and Thoroughgoing-graph Neural Networks (FeatNN) to
facilitate the application of protein 3D structure information for predicting
CPAs. Specifically, we established a novel end-to-end architecture to jointly
embed torsion matrix, discrete distance matrix, and sequence information of
protein and extract compound features with deep graph convolution layers. In
addition, a new pairwise mapping attention mechanism is introduced to
comprehensively learn potential interaction information between proteins and
compounds. FeatNN considerably outperforms various state-of-the-art baselines
in CPA prediction with the Pearson value elevated by about 35.7%. Thus, FeatNN
provides an outstanding method for highly accurate CPA prediction and
facilitates high-throughput virtual screening of drug candidates.
- Abstract(参考訳): 理論的には、複合タンパク質結合親和性(CPA)を予測する際の計算モデルの精度は、タンパク質3D構造情報の導入によって改善できる。
しかし、これらのモデルのほとんどは、有益なタンパク質の特徴をエンコードする効率的なアプローチが欠如しているため、それでも低い精度に苦しんでいる。
主な課題は、タンパク質の残基配列、残基原子座標、ねじれ角などの多モード情報をどのように組み合わせるかである。
この問題に対処するため,我々は,タンパク質3D構造情報によるCPAの予測を容易にするために,高速進化的注意と粗いグラフニューラルネットワーク(FeatNN)を開発した。
具体的には, torsion matrix, discrete distance matrix, and sequence information of protein と extract compound features with deep graph convolution layers を共同で組み込む新しいエンドツーエンドアーキテクチャを確立した。
また,タンパク質と化合物間の相互作用情報を包括的に学習するために,新しいペアワイズマッピングアテンション機構が導入された。
FeatNNはCPA予測において様々な最先端のベースラインをかなり上回り、ピアソン値は約35.7%上昇した。
したがって、FeatNNは高精度なCPA予測のための優れた方法を提供し、薬物候補の高スループット仮想スクリーニングを容易にする。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - Protein binding affinity prediction under multiple substitutions applying eGNNs on Residue and Atomic graphs combined with Language model information: eGRAL [1.840390797252648]
ディープラーニングは、シリコン内予測と生体内観測のギャップを埋めることのできる強力なツールとして、ますます認識されている。
タンパク質複合体中のアミノ酸置換物からの結合親和性変化を予測するための新しいグラフニューラルネットワークアーキテクチャであるeGRALを提案する。
eGralは、タンパク質の大規模言語モデルから抽出された特徴のおかげで、残基、原子スケール、進化スケールを利用する。
論文 参考訳(メタデータ) (2024-05-03T10:33:19Z) - DeepGATGO: A Hierarchical Pretraining-Based Graph-Attention Model for
Automatic Protein Function Prediction [4.608328575930055]
自動タンパク質機能予測(AFP)は大規模多ラベル分類問題に分類される。
現在、一般的な手法は主にタンパク質関連情報と遺伝子オントロジー(GO)の用語を組み合わせて、最終的な機能予測を生成する。
本稿では,タンパク質配列とGO項ラベルを階層的に処理するシークエンスベースの階層予測手法であるDeepGATGOを提案する。
論文 参考訳(メタデータ) (2023-07-24T07:01:32Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - DProQ: A Gated-Graph Transformer for Protein Complex Structure
Assessment [7.988932562855392]
DProQは、3Dタンパク質複合体の質を予測するために設計されたゲート近傍変調グラフ変換器(GGT)である。
グラフメッセージパッシング時の情報フローを制御するために,新しいグラフトランスフォーマフレームワークにノードゲートとエッジゲートを組み込んだ。
我々の厳密な実験は、DProQがタンパク質複合体のランク付けにおいて最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2022-05-21T15:41:46Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - PersGNN: Applying Topological Data Analysis and Geometric Deep Learning
to Structure-Based Protein Function Prediction [0.07340017786387766]
本研究では,タンパク質構造を分離し,タンパク質データバンク内のタンパク質の機能的アノテーションを作成する。
本稿では,グラフ表現学習とトポロジカルデータ解析を組み合わせた,エンドツーエンドのトレーニング可能なディープラーニングモデルPersGNNを提案する。
論文 参考訳(メタデータ) (2020-10-30T02:24:35Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。