論文の概要: PANDA: Predicting the change in proteins binding affinity upon mutations
using sequence information
- arxiv url: http://arxiv.org/abs/2009.08869v1
- Date: Wed, 16 Sep 2020 17:12:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 22:52:14.322424
- Title: PANDA: Predicting the change in proteins binding affinity upon mutations
using sequence information
- Title(参考訳): PANDA:配列情報を用いた変異によるタンパク質結合親和性の変化予測
- Authors: Wajid Arshad Abbasi, Syed Ali Abbas, Saiqa Andleeb
- Abstract要約: 突然変異に対する結合親和性の変化を決定するには、高度で高価で時間を要するウェットラブ実験が必要である。
計算予測技術の多くは、既知の構造を持つタンパク質複合体に適用性を制限するタンパク質構造を必要とする。
我々は、タンパク質構造ではなくタンパク質配列情報と機械学習技術を用いて、突然変異によるタンパク質結合親和性の変化を正確に予測した。
- 参考スコア(独自算出の注目度): 0.3867363075280544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurately determining a change in protein binding affinity upon mutations is
important for the discovery and design of novel therapeutics and to assist
mutagenesis studies. Determination of change in binding affinity upon mutations
requires sophisticated, expensive, and time-consuming wet-lab experiments that
can be aided with computational methods. Most of the computational prediction
techniques require protein structures that limit their applicability to protein
complexes with known structures. In this work, we explore the sequence-based
prediction of change in protein binding affinity upon mutation. We have used
protein sequence information instead of protein structures along with machine
learning techniques to accurately predict the change in protein binding
affinity upon mutation. Our proposed sequence-based novel change in protein
binding affinity predictor called PANDA gives better accuracy than existing
methods over the same validation set as well as on an external independent test
dataset. On an external test dataset, our proposed method gives a maximum
Pearson correlation coefficient of 0.52 in comparison to the state-of-the-art
existing protein structure-based method called MutaBind which gives a maximum
Pearson correlation coefficient of 0.59. Our proposed protein sequence-based
method, to predict a change in binding affinity upon mutations, has wide
applicability and comparable performance in comparison to existing protein
structure-based methods. A cloud-based webserver implementation of PANDA and
its python code is available at
https://sites.google.com/view/wajidarshad/software and
https://github.com/wajidarshad/panda.
- Abstract(参考訳): 変異によるタンパク質結合親和性の変化を正確に決定することは、新しい治療法の発見と設計、および変異形成研究を支援するために重要である。
突然変異に対する結合親和性の変化を決定するには、複雑で高価で時間を要するウェットラブ実験が必要である。
計算予測技術の多くは、既知の構造を持つタンパク質複合体に適用性を制限するタンパク質構造を必要とする。
本研究では,変異によるタンパク質結合親和性の変化の配列に基づく予測について検討する。
我々は、タンパク質構造の代わりにタンパク質配列情報と機械学習技術を用いて、突然変異によるタンパク質結合親和性の変化を正確に予測した。
提案するパンダと呼ばれるタンパク質結合親和性予測装置の新規な配列変化は,外部の独立テストデータセットと同様に,既存の手法よりも精度が向上する。
提案手法は,Pearson の最大相関係数を 0.52 とし,その最大相関係数を 0.59 とする MutaBind という,最先端のタンパク質構造に基づく手法と比較した。
変異に対する結合親和性の変化を予測するために提案したタンパク質配列に基づく手法は,既存のタンパク質構造に基づく手法と比較して広い適用性と同等の性能を有する。
PANDAのクラウドベースのWebサーバ実装とそのpythonコードはhttps://sites.google.com/view/wajidarshad/softwareとhttps://github.com/wajidarshad/pandaで入手できる。
関連論文リスト
- CoPRA: Bridging Cross-domain Pretrained Sequence Models with Complex Structures for Protein-RNA Binding Affinity Prediction [23.1499716310298]
我々は,タンパク質-RNA結合親和性データセットPRA310を構築し,性能評価を行った。
我々は,(1)タンパク質-RNA結合親和性,(2)変異による結合親和性の変化を正確に予測できること,(3)データのスケーリングとモデルサイズによるメリットを広く分析し,検証する。
論文 参考訳(メタデータ) (2024-08-21T09:48:22Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - Protein binding affinity prediction under multiple substitutions applying eGNNs on Residue and Atomic graphs combined with Language model information: eGRAL [1.840390797252648]
ディープラーニングは、シリコン内予測と生体内観測のギャップを埋めることのできる強力なツールとして、ますます認識されている。
タンパク質複合体中のアミノ酸置換物からの結合親和性変化を予測するための新しいグラフニューラルネットワークアーキテクチャであるeGRALを提案する。
eGralは、タンパク質の大規模言語モデルから抽出された特徴のおかげで、残基、原子スケール、進化スケールを利用する。
論文 参考訳(メタデータ) (2024-05-03T10:33:19Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - Efficiently Predicting Mutational Effect on Homologous Proteins by Evolution Encoding [7.067145619709089]
EvolMPNNは進化を意識したタンパク質の埋め込みを学習するための効率的なモデルである。
我々のモデルは最先端の手法よりも最大6.4%向上し,36倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-02-20T23:06:21Z) - PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for
Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。
既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。
CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-13T03:51:10Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Pairing interacting protein sequences using masked language modeling [0.3222802562733787]
配列アライメントに基づいて訓練されたタンパク質言語モデルを用いて相互作用するタンパク質配列をペア化する手法を開発した。
我々は、MSAトランスフォーマーが、周囲のコンテキストを用いて複数の配列アライメントでマスクされたアミノ酸を埋める能力を利用する。
単一チェーンデータでトレーニングされている間に、チェーン間の共進化をキャプチャできることが示されています。
論文 参考訳(メタデータ) (2023-08-14T13:42:09Z) - Multi-level Protein Representation Learning for Blind Mutational Effect
Prediction [5.207307163958806]
本稿では,タンパク質構造解析のためのシーケンシャルおよび幾何学的アナライザをカスケードする,新しい事前学習フレームワークを提案する。
野生型タンパク質の自然選択をシミュレートすることにより、所望の形質に対する突然変異方向を誘導する。
提案手法は,多種多様な効果予測タスクに対して,パブリックデータベースと2つの新しいデータベースを用いて評価する。
論文 参考訳(メタデータ) (2023-06-08T03:00:50Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。