論文の概要: Beating the Best: Improving on AlphaFold2 at Protein Structure
Prediction
- arxiv url: http://arxiv.org/abs/2301.07568v1
- Date: Wed, 18 Jan 2023 14:39:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-19 15:31:37.652575
- Title: Beating the Best: Improving on AlphaFold2 at Protein Structure
Prediction
- Title(参考訳): alphafold2のタンパク質構造予測における改善点
- Authors: Abbi Abdel-Rehim, Oghenejokpeme Orhobor, Hang Lou, Hao Ni and Ross D.
King
- Abstract要約: ARStackはAlphaFold2とRosTTAFoldを大きく上回っている。
αFold2とRosTTAFoldの2種類の非ホモログタンパク質と、αFold2とRoseTTAFoldの2種類のタンパク質構造を用いて、これを厳密に実証した。
- 参考スコア(独自算出の注目度): 1.3124513975412255
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The goal of Protein Structure Prediction (PSP) problem is to predict a
protein's 3D structure (confirmation) from its amino acid sequence. The problem
has been a 'holy grail' of science since the Noble prize-winning work of
Anfinsen demonstrated that protein conformation was determined by sequence. A
recent and important step towards this goal was the development of AlphaFold2,
currently the best PSP method. AlphaFold2 is probably the highest profile
application of AI to science. Both AlphaFold2 and RoseTTAFold (another
impressive PSP method) have been published and placed in the public domain
(code & models). Stacking is a form of ensemble machine learning ML in which
multiple baseline models are first learnt, then a meta-model is learnt using
the outputs of the baseline level model to form a model that outperforms the
base models. Stacking has been successful in many applications. We developed
the ARStack PSP method by stacking AlphaFold2 and RoseTTAFold. ARStack
significantly outperforms AlphaFold2. We rigorously demonstrate this using two
sets of non-homologous proteins, and a test set of protein structures published
after that of AlphaFold2 and RoseTTAFold. As more high quality prediction
methods are published it is likely that ensemble methods will increasingly
outperform any single method.
- Abstract(参考訳): タンパク質構造予測(PSP)問題の目的は、アミノ酸配列からタンパク質の3D構造(確認)を予測することである。
この問題は、ノーブル賞受賞作品『アンフィンセン』がタンパク質のコンフォメーションが配列によって決定されたことを証明して以来、科学の「ホット・ゲイル」であった。
最近の重要なステップは、現在最高のPSP法であるAlphaFold2の開発であった。
AlphaFold2はおそらく、AIの科学への最も高度な応用だ。
AlphaFold2とRosTTAFold(もう一つの印象的なPSPメソッド)はどちらもパブリックドメイン(コードとモデル)で公開されている。
スタック化は、まず複数のベースラインモデルを学習し、次にベースラインレベルモデルの出力を使用してメタモデルを学習し、ベースラインモデルを上回るモデルを形成する、アンサンブル機械学習MLの形式である。
スタックは多くのアプリケーションで成功した。
我々はAlphaFold2とRosTTAFoldを積み重ねてARStack PSP法を開発した。
ARStackはAlphaFold2を大きく上回っている。
二種類の非ホモログタンパク質と、αfold2とrosettafoldのそれに続くタンパク質構造のテストセットを用いて、厳密に実証した。
より高品質な予測手法が公表されるにつれて、アンサンブルメソッドは1つのメソッドよりもますます優れていくだろう。
関連論文リスト
- Improving AlphaFlow for Efficient Protein Ensembles Generation [64.10918970280603]
効率的なタンパク質アンサンブル生成を実現するために,AlphaFlow-Litと呼ばれる特徴条件付き生成モデルを提案する。
AlphaFlow-LitはAlphaFlowとオンパーで動作し、予行訓練なしで蒸留されたバージョンを上回り、47倍のサンプリング加速を達成している。
論文 参考訳(メタデータ) (2024-07-08T13:36:43Z) - Diffusion Language Models Are Versatile Protein Learners [75.98083311705182]
本稿では,タンパク質配列の強い生成および予測能力を示す多目的なタンパク質言語モデルである拡散タンパク質言語モデル(DPLM)を紹介する。
まず, 自己制御型離散拡散確率フレームワークを用いて, 進化的タンパク質配列からのスケーラブルDPLMの事前学習を行った。
プレトレーニング後、DPLMは非条件生成のための構造的に可塑性で新規で多様なタンパク質配列を生成する能力を示す。
論文 参考訳(メタデータ) (2024-02-28T18:57:56Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering
the Language of Protein [76.18058946124111]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - DiffDock-PP: Rigid Protein-Protein Docking with Diffusion Models [47.73386438748902]
DiffDock-PPは拡散生成モデルであり、非有界タンパク質構造をそれらの有界配座に翻訳し回転させる。
中央値C-RMSDが4.85でDIPSの最先端性能を達成し,すべてのベースラインを上回りました。
論文 参考訳(メタデータ) (2023-04-08T02:10:44Z) - Retrieved Sequence Augmentation for Protein Representation Learning [40.13920287967866]
本稿では,タンパク質表現学習のための検索シーケンス拡張について,アライメントや前処理を伴わずに導入する。
本モデルでは,新しいタンパク質ドメインに移行し,デノボタンパク質の予測においてMSAトランスフォーマーより優れていることを示す。
我々の研究はタンパク質の予測における大きなギャップを埋め、タンパク質配列を理解するのに必要なドメイン知識の解読に一歩近づいた。
論文 参考訳(メタデータ) (2023-02-24T10:31:45Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - AlphaFold Distillation for Protein Design [25.190210443632825]
逆タンパク質の折りたたみはバイオエンジニアリングと薬物発見に不可欠である。
AlphaFoldのような前方の折りたたみモデルは、シーケンスから構造を正確に予測することで潜在的な解決策を提供する。
本稿では, 折り畳みモデルの信頼性測定値に対する知識蒸留を用いて, より高速かつエンドツーエンドの識別可能な蒸留モデルを作成することを提案する。
論文 参考訳(メタデータ) (2022-10-05T19:43:06Z) - Unsupervisedly Prompting AlphaFold2 for Few-Shot Learning of Accurate
Folding Landscape and Protein Structure Prediction [28.630603355510324]
そこで我々は,メタ生成モデルであるEvoGenを提案し,貧弱なMSAターゲットに対するAlphaFold2のアンダーパフォーマンスを改善する。
EvoGenは、キャリブレーションまたは実質的に生成されたホモログシーケンスでモデルにプロンプトすることで、AlphaFold2を低データで正確に折り畳むのに役立つ。
論文 参考訳(メタデータ) (2022-08-20T10:23:17Z) - HelixFold-Single: MSA-free Protein Structure Prediction by Using Protein
Language Model as an Alternative [61.984700682903096]
HelixFold-Singleは、大規模なタンパク質言語モデルとAlphaFold2の優れた幾何学的学習能力を組み合わせるために提案されている。
提案手法は,数千万の一次配列を持つ大規模タンパク質言語モデルを事前学習する。
我々は、一次系列のみから原子の3次元座標を予測するために、エンドツーエンドの微分可能なモデルを得る。
論文 参考訳(メタデータ) (2022-07-28T07:30:33Z) - Exploring evolution-based & -free protein language models as protein
function predictors [12.381080613343306]
大規模タンパク質言語モデル(PLM)はタンパク質予測タスクの性能を改善した。
ESM-1b(単一配列)、MSA-Transformer(複数配列アライメント)、Evoformer(構造)の3つのPLMの表現能力について検討する。
i) αFoldの一部として訓練されたEvoformerは、タンパク質の機能を予測できる表現を生成するか?
我々はこれらのモデルを、新しい洞察と結論と共に実証的研究によって比較する。
論文 参考訳(メタデータ) (2022-06-14T03:56:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。