論文の概要: Protein Folding Neural Networks Are Not Robust
- arxiv url: http://arxiv.org/abs/2109.04460v1
- Date: Thu, 9 Sep 2021 17:57:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-10 13:59:12.724758
- Title: Protein Folding Neural Networks Are Not Robust
- Title(参考訳): タンパク質折り畳みニューラルネットワークはロバストではない
- Authors: Sumit Kumar Jha, Arvind Ramanathan, Rickard Ewetz, Alvaro Velasquez,
Susmit Jha
- Abstract要約: AlphaFoldやRosTTAFoldのようなディープニューラルネットワークは、タンパク質の極めて正確な構造を予測する。
本稿では,RoseTTAFoldの精度が高いにもかかわらず,そのような堅牢性は示さないことを示す。
敵性攻撃法を用いて、敵性タンパク質配列を生成するとともに、予測されたタンパク質構造におけるRMSDは、敵性摂動がBLOSUM62距離で20単位に制限されている場合、0.119rAから34.162rAの範囲であることを示す。
- 参考スコア(独自算出の注目度): 15.621671501134028
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural networks such as AlphaFold and RoseTTAFold predict remarkably
accurate structures of proteins compared to other algorithmic approaches. It is
known that biologically small perturbations in the protein sequence do not lead
to drastic changes in the protein structure. In this paper, we demonstrate that
RoseTTAFold does not exhibit such a robustness despite its high accuracy, and
biologically small perturbations for some input sequences result in radically
different predicted protein structures. This raises the challenge of detecting
when these predicted protein structures cannot be trusted. We define the
robustness measure for the predicted structure of a protein sequence to be the
inverse of the root-mean-square distance (RMSD) in the predicted structure and
the structure of its adversarially perturbed sequence. We use adversarial
attack methods to create adversarial protein sequences, and show that the RMSD
in the predicted protein structure ranges from 0.119\r{A} to 34.162\r{A} when
the adversarial perturbations are bounded by 20 units in the BLOSUM62 distance.
This demonstrates very high variance in the robustness measure of the predicted
structures. We show that the magnitude of the correlation (0.917) between our
robustness measure and the RMSD between the predicted structure and the ground
truth is high, that is, the predictions with low robustness measure cannot be
trusted. This is the first paper demonstrating the susceptibility of
RoseTTAFold to adversarial attacks.
- Abstract(参考訳): AlphaFoldやRosTTAFoldのようなディープニューラルネットワークは、他のアルゴリズムのアプローチと比較して、タンパク質の極めて正確な構造を予測する。
生物学的に小さなタンパク質配列の摂動は、タンパク質構造に劇的な変化をもたらすことが知られている。
本稿では,RoseTTAFoldの精度は高く,いくつかの入力配列に対する生物学的に小さな摂動は,大きく異なるタンパク質構造をもたらすことを示した。
これにより、予測されたタンパク質構造が信頼できないときの検出が困難になる。
本研究では,タンパク質配列の予測構造を,予測構造における根平均2乗距離(RMSD)の逆数であり,その逆摂動配列の構造であることを示す。
逆攻撃法を用いて逆タンパク質配列を作成し, 予測されたタンパク質構造のrmsdがブロム62距離で20単位に制限された場合, 0.119\r{a} から34.162\r{a} まで変化することを示した。
これは予測された構造のロバスト性測度の非常に高い分散を示す。
その結果,我々のロバスト性尺度と予測構造と基底真理とのrmsdとの相関の大きさ(0.917)は高いこと,すなわち,ロバスト性尺度の低い予測は信頼できないことがわかった。
これはRoseTTAFoldの敵攻撃に対する感受性を示す最初の論文である。
関連論文リスト
- CPE-Pro: A Structure-Sensitive Deep Learning Method for Protein Representation and Origin Evaluation [7.161099050722313]
タンパク質構造評価用結晶対予測学習モデル(CPE-Pro)を開発した。
CPE-Proはタンパク質の構造情報を学習し、構造間の差異を捉え、4つのデータクラスの正確なトレーサビリティを実現する。
我々は Foldseek を用いてタンパク質構造を「構造配列」にエンコードし、タンパク質構造配列言語モデル SSLM を訓練した。
論文 参考訳(メタデータ) (2024-10-21T02:21:56Z) - A Protein Structure Prediction Approach Leveraging Transformer and CNN
Integration [4.909112037834705]
本稿では、畳み込みニューラルネットワーク(CCN)を用いた2次元融合深層ニューラルネットワークモデルDstruCCNと、単一配列タンパク質構造予測のための教師付きトランスフォーマー言語モデルを採用する。
両者のトレーニング特徴を組み合わせ、タンパク質トランスフォーマー結合部位マトリックスを予測し、エネルギー最小化を用いて三次元構造を再構築する。
論文 参考訳(メタデータ) (2024-02-29T12:24:20Z) - Structure-Informed Protein Language Model [38.019425619750265]
本稿では、構造情報をタンパク質言語モデルに抽出するためのリモートホモロジー検出の統合について紹介する。
この構造インフォームドトレーニングが下流タンパク質機能予測タスクに与える影響を評価する。
論文 参考訳(メタデータ) (2024-02-07T09:32:35Z) - Protein 3D Graph Structure Learning for Robust Structure-based Protein
Property Prediction [43.46012602267272]
タンパク質の構造に基づく特性予測は、様々な生物学的タスクにおいて有望なアプローチとして現れてきた。
現在のプラクティスは、推論中に正確に予測された構造を用いるだけで、予測精度の顕著な低下に悩まされている。
本フレームワークはモデルに依存しず,予測構造と実験構造の両方の特性予測の改善に有効である。
論文 参考訳(メタデータ) (2023-10-14T08:43:42Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - On the Robustness of AlphaFold: A COVID-19 Case Study [16.564151738086434]
高い精度にもかかわらず、AlphaFoldはそのような堅牢性を示していないことを実証する。
これにより、予測されたタンパク質構造が信頼される範囲を検知し定量化することが困難になる。
論文 参考訳(メタデータ) (2023-01-10T17:31:39Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。