論文の概要: AlphaDesign: A graph protein design method and benchmark on AlphaFoldDB
- arxiv url: http://arxiv.org/abs/2202.01079v1
- Date: Tue, 1 Feb 2022 08:28:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-03 14:24:19.793622
- Title: AlphaDesign: A graph protein design method and benchmark on AlphaFoldDB
- Title(参考訳): AlphaDesign: AlphaFoldDBのグラフタンパク質設計方法とベンチマーク
- Authors: Zhangyang Gao, Cheng Tan, Stan. Z Li
- Abstract要約: DeepMindは、タンパク質の折り畳みを一時的に解決しているが、その逆問題であるタンパク質設計は依然として重大な課題に直面している。
我々は、世界最大のタンパク質構造データベースであるAlphaFold DBを使用して、新しいグラフベースのベンチマークであるAlphaDesignを構築しています。
グラフトランスフォーマーエンコーダ(SGT)を簡略化し,信頼性に配慮したタンパク質デコーダ(CPD)を提案することにより,タンパク質アングルを新たな特徴として導入することにより,ADesignと呼ばれる新しい手法を提案する。
- 参考スコア(独自算出の注目度): 37.937378787812264
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While DeepMind has tentatively solved protein folding, its inverse problem --
protein design which predicts protein sequences from their 3D structures --
still faces significant challenges. Particularly, the lack of large-scale
standardized benchmark and poor accuray hinder the research progress. In order
to standardize comparisons and draw more research interest, we use AlphaFold
DB, one of the world's largest protein structure databases, to establish a new
graph-based benchmark -- AlphaDesign. Based on AlphaDesign, we propose a new
method called ADesign to improve accuracy by introducing protein angles as new
features, using a simplified graph transformer encoder (SGT), and proposing a
confidence-aware protein decoder (CPD). Meanwhile, SGT and CPD also improve
model efficiency by simplifying the training and testing procedures.
Experiments show that ADesign significantly outperforms previous graph models,
e.g., the average accuracy is improved by 8\%, and the inference speed is 40+
times faster than before.
- Abstract(参考訳): DeepMindは、タンパク質の折り畳みを一時的に解決しているが、その逆問題である3D構造からタンパク質配列を予測するタンパク質設計は、依然として重大な課題に直面している。
特に、大規模標準ベンチマークの欠如と不十分なaccurayが研究の進展を妨げている。
比較を標準化し、さらなる研究の関心を引くために、我々は、世界最大のタンパク質構造データベースであるAlphaFold DBを使用して、新しいグラフベースのベンチマークであるAlphaDesignを確立する。
AlphaDesignに基づいて,タンパク質角を新しい特徴として導入し,グラフトランスフォーマーエンコーダ(SGT)を簡略化し,信頼性に配慮したタンパク質デコーダ(CPD)を提案することにより,ADesignと呼ばれる新しい手法を提案する。
一方、SGTとCDDは、トレーニングやテスト手順を簡素化することで、モデルの効率も向上する。
実験の結果、ADesignは従来のグラフモデルよりも大幅に優れており、例えば平均精度は8\%向上し、推論速度は以前より40倍速くなっている。
関連論文リスト
- Model-based reinforcement learning for protein backbone design [1.7383284836821535]
我々はAlphaZeroを用いてタンパク質のバックボーンを生成することを提案する。
既存のモンテカルロ木探索(MCTS)フレームワークを,新しいしきい値に基づく報酬と二次目的を取り入れて拡張する。
AlphaZeroは、トップダウンのタンパク質設計タスクにおいて、ベースラインMCTSを100%以上上回っている。
論文 参考訳(メタデータ) (2024-05-03T10:24:33Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering
the Language of Protein [76.18058946124111]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Progressive Multi-Modality Learning for Inverse Protein Folding [47.095862120116976]
マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。
MMDesignは、事前訓練された構造モジュールと事前訓練されたコンテキストモジュールを組み合わせる最初のフレームワークである。
実験結果は、小さなデータセットでのみトレーニングした結果、MMDesignが様々な公開ベンチマークのベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2023-12-11T10:59:23Z) - PDB-Struct: A Comprehensive Benchmark for Structure-based Protein Design [19.324059406159325]
我々は、リフォールダビリティベースのメトリクスと安定性ベースのメトリクスの2つの新しい指標を紹介した。
ByProt、ProteinMPNN、ESM-IFはベンチマークで非常によく機能しますが、ESM-DesignとAF-Designは不足しています。
提案するベンチマークは,タンパク質設計手法の公平かつ包括的な評価方法である。
論文 参考訳(メタデータ) (2023-11-30T02:37:55Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - AlphaFold Distillation for Protein Design [25.190210443632825]
逆タンパク質の折りたたみはバイオエンジニアリングと薬物発見に不可欠である。
AlphaFoldのような前方の折りたたみモデルは、シーケンスから構造を正確に予測することで潜在的な解決策を提供する。
本稿では, 折り畳みモデルの信頼性測定値に対する知識蒸留を用いて, より高速かつエンドツーエンドの識別可能な蒸留モデルを作成することを提案する。
論文 参考訳(メタデータ) (2022-10-05T19:43:06Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - PDBench: Evaluating Computational Methods for Protein Sequence Design [2.0187324832551385]
本稿では, タンパク質のベンチマークを行い, 深層学習法の性能評価試験を提案する。
我々の堅牢なベンチマークは、その性能と実用性を評価するのに欠かせない設計手法の振る舞いに関する生物学的知見を提供する。
論文 参考訳(メタデータ) (2021-09-16T12:20:03Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。