論文の概要: On the Robustness of AlphaFold: A COVID-19 Case Study
- arxiv url: http://arxiv.org/abs/2301.04093v2
- Date: Thu, 12 Jan 2023 17:34:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 15:22:33.607415
- Title: On the Robustness of AlphaFold: A COVID-19 Case Study
- Title(参考訳): alphafoldのロバスト性について:新型コロナのケーススタディ
- Authors: Ismail Alkhouri, Sumit Jha, Andre Beckus, George Atia, Alvaro
Velasquez, Rickard Ewetz, Arvind Ramanathan, Susmit Jha
- Abstract要約: 高い精度にもかかわらず、AlphaFoldはそのような堅牢性を示していないことを実証する。
これにより、予測されたタンパク質構造が信頼される範囲を検知し定量化することが困難になる。
- 参考スコア(独自算出の注目度): 16.564151738086434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Protein folding neural networks (PFNNs) such as AlphaFold predict remarkably
accurate structures of proteins compared to other approaches. However, the
robustness of such networks has heretofore not been explored. This is
particularly relevant given the broad social implications of such technologies
and the fact that biologically small perturbations in the protein sequence do
not generally lead to drastic changes in the protein structure. In this paper,
we demonstrate that AlphaFold does not exhibit such robustness despite its high
accuracy. This raises the challenge of detecting and quantifying the extent to
which these predicted protein structures can be trusted. To measure the
robustness of the predicted structures, we utilize (i) the root-mean-square
deviation (RMSD) and (ii) the Global Distance Test (GDT) similarity measure
between the predicted structure of the original sequence and the structure of
its adversarially perturbed version. We prove that the problem of minimally
perturbing protein sequences to fool protein folding neural networks is
NP-complete. Based on the well-established BLOSUM62 sequence alignment scoring
matrix, we generate adversarial protein sequences and show that the RMSD
between the predicted protein structure and the structure of the original
sequence are very large when the adversarial changes are bounded by (i) 20
units in the BLOSUM62 distance, and (ii) five residues (out of hundreds or
thousands of residues) in the given protein sequence. In our experimental
evaluation, we consider 111 COVID-19 proteins in the Universal Protein resource
(UniProt), a central resource for protein data managed by the European
Bioinformatics Institute, Swiss Institute of Bioinformatics, and the US Protein
Information Resource. These result in an overall GDT similarity test score
average of around 34%, demonstrating a substantial drop in the performance of
AlphaFold.
- Abstract(参考訳): alphafoldのようなタンパク質折り畳みニューラルネットワーク(pfnn)は、他のアプローチと比較して驚くほど正確なタンパク質の構造を予測する。
しかし,このようなネットワークの頑健性は検討されていない。
これは、このような技術の幅広い社会的意味と、生物学的にタンパク質配列の摂動が一般的にタンパク質構造に劇的な変化をもたらすわけではないという事実を考えると、特に関係がある。
本稿では,アルファフォールドの精度は高いが,そのような頑健性は示さないことを示す。
これにより、予測されたタンパク質構造が信頼される範囲を検知し定量化することが困難になる。
予測した構造物のロバスト性を測定するために
(i)根平均二乗偏差(RMSD)と
(II)GDT(Global Distance Test)類似度尺度は、元のシーケンスの予測構造と、その逆摂動バージョンの構造との間のものである。
タンパク質配列を最小に摂動することで、タンパク質折り畳みニューラルネットワークがNP完全であることを証明した。
確立されたblosum62配列配列アライメントスコアリングマトリクスに基づいて、逆タンパク質配列を生成し、予測されたタンパク質構造と元の配列の構造との間のrmsdが非常に大きいことを示す。
(i)BLOSUM62距離の20ユニット、及び
(ii)与えられたタンパク質配列中の5つの残基(数百から数千の残基のうち)
本実験では,欧州バイオインフォマティクス研究所,スイスバイオインフォマティクス研究所,米国タンパク質情報資源が管理するタンパク質データの中心的資源であるUniProt(UniProt)の111個のCOVID-19タンパク質について検討した。
これらの結果、gdtの類似度テストスコアは平均で約34%となり、アルファフォールドの性能が大幅に低下した。
関連論文リスト
- DisorderUnetLM: Validating ProteinUnet for efficient protein intrinsic disorder prediction [0.0]
内因性障害領域の予測は、タンパク質の機能やダイナミクスを理解する上で重要な意味を持つ。
近年,タンパク質言語モデル(pLM)に基づく新しい世代の予測器が出現している。
本稿では、タンパク質Unetの考え方に基づく新しい障害UnetLM障害予測器について紹介する。
論文 参考訳(メタデータ) (2024-04-11T20:14:14Z) - PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for
Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。
既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。
CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-13T03:51:10Z) - Protein 3D Graph Structure Learning for Robust Structure-based Protein
Property Prediction [43.46012602267272]
タンパク質の構造に基づく特性予測は、様々な生物学的タスクにおいて有望なアプローチとして現れてきた。
現在のプラクティスは、推論中に正確に予測された構造を用いるだけで、予測精度の顕著な低下に悩まされている。
本フレームワークはモデルに依存しず,予測構造と実験構造の両方の特性予測の改善に有効である。
論文 参考訳(メタデータ) (2023-10-14T08:43:42Z) - Enhancing the Protein Tertiary Structure Prediction by Multiple Sequence
Alignment Generation [30.2874172276931]
我々はMSA-Augmenterを導入し、データベースに存在しない新規なタンパク質配列を生成する。
CASP14で行った実験では、MSA-Augmenterは、下層のMSAから共進化情報を保持できるde novo配列を生成できることが示されている。
論文 参考訳(メタデータ) (2023-06-02T14:13:50Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Protein Folding Neural Networks Are Not Robust [15.621671501134028]
AlphaFoldやRosTTAFoldのようなディープニューラルネットワークは、タンパク質の極めて正確な構造を予測する。
本稿では,RoseTTAFoldの精度が高いにもかかわらず,そのような堅牢性は示さないことを示す。
敵性攻撃法を用いて、敵性タンパク質配列を生成するとともに、予測されたタンパク質構造におけるRMSDは、敵性摂動がBLOSUM62距離で20単位に制限されている場合、0.119rAから34.162rAの範囲であることを示す。
論文 参考訳(メタデータ) (2021-09-09T17:57:19Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。