論文の概要: PANDA: Predicting the change in proteins binding affinity upon mutations
using sequence information
- arxiv url: http://arxiv.org/abs/2009.08869v1
- Date: Wed, 16 Sep 2020 17:12:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 22:52:14.322424
- Title: PANDA: Predicting the change in proteins binding affinity upon mutations
using sequence information
- Title(参考訳): PANDA:配列情報を用いた変異によるタンパク質結合親和性の変化予測
- Authors: Wajid Arshad Abbasi, Syed Ali Abbas, Saiqa Andleeb
- Abstract要約: 突然変異に対する結合親和性の変化を決定するには、高度で高価で時間を要するウェットラブ実験が必要である。
計算予測技術の多くは、既知の構造を持つタンパク質複合体に適用性を制限するタンパク質構造を必要とする。
我々は、タンパク質構造ではなくタンパク質配列情報と機械学習技術を用いて、突然変異によるタンパク質結合親和性の変化を正確に予測した。
- 参考スコア(独自算出の注目度): 0.3867363075280544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurately determining a change in protein binding affinity upon mutations is
important for the discovery and design of novel therapeutics and to assist
mutagenesis studies. Determination of change in binding affinity upon mutations
requires sophisticated, expensive, and time-consuming wet-lab experiments that
can be aided with computational methods. Most of the computational prediction
techniques require protein structures that limit their applicability to protein
complexes with known structures. In this work, we explore the sequence-based
prediction of change in protein binding affinity upon mutation. We have used
protein sequence information instead of protein structures along with machine
learning techniques to accurately predict the change in protein binding
affinity upon mutation. Our proposed sequence-based novel change in protein
binding affinity predictor called PANDA gives better accuracy than existing
methods over the same validation set as well as on an external independent test
dataset. On an external test dataset, our proposed method gives a maximum
Pearson correlation coefficient of 0.52 in comparison to the state-of-the-art
existing protein structure-based method called MutaBind which gives a maximum
Pearson correlation coefficient of 0.59. Our proposed protein sequence-based
method, to predict a change in binding affinity upon mutations, has wide
applicability and comparable performance in comparison to existing protein
structure-based methods. A cloud-based webserver implementation of PANDA and
its python code is available at
https://sites.google.com/view/wajidarshad/software and
https://github.com/wajidarshad/panda.
- Abstract(参考訳): 変異によるタンパク質結合親和性の変化を正確に決定することは、新しい治療法の発見と設計、および変異形成研究を支援するために重要である。
突然変異に対する結合親和性の変化を決定するには、複雑で高価で時間を要するウェットラブ実験が必要である。
計算予測技術の多くは、既知の構造を持つタンパク質複合体に適用性を制限するタンパク質構造を必要とする。
本研究では,変異によるタンパク質結合親和性の変化の配列に基づく予測について検討する。
我々は、タンパク質構造の代わりにタンパク質配列情報と機械学習技術を用いて、突然変異によるタンパク質結合親和性の変化を正確に予測した。
提案するパンダと呼ばれるタンパク質結合親和性予測装置の新規な配列変化は,外部の独立テストデータセットと同様に,既存の手法よりも精度が向上する。
提案手法は,Pearson の最大相関係数を 0.52 とし,その最大相関係数を 0.59 とする MutaBind という,最先端のタンパク質構造に基づく手法と比較した。
変異に対する結合親和性の変化を予測するために提案したタンパク質配列に基づく手法は,既存のタンパク質構造に基づく手法と比較して広い適用性と同等の性能を有する。
PANDAのクラウドベースのWebサーバ実装とそのpythonコードはhttps://sites.google.com/view/wajidarshad/softwareとhttps://github.com/wajidarshad/pandaで入手できる。
関連論文リスト
- EvolMPNN: Predicting Mutational Effect on Homologous Proteins by
Evolution Encoding [8.348896353632165]
本稿では進化を意識したメッセージパッシングニューラルネットワークであるEvolMPNNを提案し,進化を意識したタンパク質の埋め込みを学習する。
我々のモデルは最先端の手法よりも最大6.4%良い結果を示し、大きな事前学習モデルと比較して36倍の高速化が得られる。
論文 参考訳(メタデータ) (2024-02-20T23:06:21Z) - PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for
Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。
既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。
CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-13T03:51:10Z) - Structure-Informed Protein Language Model [38.019425619750265]
本稿では、構造情報をタンパク質言語モデルに抽出するためのリモートホモロジー検出の統合について紹介する。
この構造インフォームドトレーニングが下流タンパク質機能予測タスクに与える影響を評価する。
論文 参考訳(メタデータ) (2024-02-07T09:32:35Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Pairing interacting protein sequences using masked language modeling [0.3222802562733787]
配列アライメントに基づいて訓練されたタンパク質言語モデルを用いて相互作用するタンパク質配列をペア化する手法を開発した。
我々は、MSAトランスフォーマーが、周囲のコンテキストを用いて複数の配列アライメントでマスクされたアミノ酸を埋める能力を利用する。
単一チェーンデータでトレーニングされている間に、チェーン間の共進化をキャプチャできることが示されています。
論文 参考訳(メタデータ) (2023-08-14T13:42:09Z) - Multi-level Protein Representation Learning for Blind Mutational Effect
Prediction [5.207307163958806]
本稿では,タンパク質構造解析のためのシーケンシャルおよび幾何学的アナライザをカスケードする,新しい事前学習フレームワークを提案する。
野生型タンパク質の自然選択をシミュレートすることにより、所望の形質に対する突然変異方向を誘導する。
提案手法は,多種多様な効果予測タスクに対して,パブリックデータベースと2つの新しいデータベースを用いて評価する。
論文 参考訳(メタデータ) (2023-06-08T03:00:50Z) - Retrieved Sequence Augmentation for Protein Representation Learning [40.13920287967866]
本稿では,タンパク質表現学習のための検索シーケンス拡張について,アライメントや前処理を伴わずに導入する。
本モデルでは,新しいタンパク質ドメインに移行し,デノボタンパク質の予測においてMSAトランスフォーマーより優れていることを示す。
我々の研究はタンパク質の予測における大きなギャップを埋め、タンパク質配列を理解するのに必要なドメイン知識の解読に一歩近づいた。
論文 参考訳(メタデータ) (2023-02-24T10:31:45Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - HelixFold-Single: MSA-free Protein Structure Prediction by Using Protein
Language Model as an Alternative [61.984700682903096]
HelixFold-Singleは、大規模なタンパク質言語モデルとAlphaFold2の優れた幾何学的学習能力を組み合わせるために提案されている。
提案手法は,数千万の一次配列を持つ大規模タンパク質言語モデルを事前学習する。
我々は、一次系列のみから原子の3次元座標を予測するために、エンドツーエンドの微分可能なモデルを得る。
論文 参考訳(メタデータ) (2022-07-28T07:30:33Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。