論文の概要: APACE: AlphaFold2 and advanced computing as a service for accelerated
discovery in biophysics
- arxiv url: http://arxiv.org/abs/2308.07954v1
- Date: Tue, 15 Aug 2023 18:00:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-17 16:05:20.307772
- Title: APACE: AlphaFold2 and advanced computing as a service for accelerated
discovery in biophysics
- Title(参考訳): APACE:AlphaFold2と生物物理学の発見を加速するサービスとしての高度なコンピューティング
- Authors: Hyun Park, Parth Patel, Roland Haas, E. A. Huerta
- Abstract要約: 我々は、APACE、AlphaFold2および高度なコンピューティング・アズ・ア・サービスを紹介します。
APACEは市販のAlphaFold2実装よりも最大2桁高速である。
この計算手法は、科学的な発見を自動化し、加速するために、ロボット研究所と容易に関連付けられる。
- 参考スコア(独自算出の注目度): 0.2999888908665658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The prediction of protein 3D structure from amino acid sequence is a
computational grand challenge in biophysics, and plays a key role in robust
protein structure prediction algorithms, from drug discovery to genome
interpretation. The advent of AI models, such as AlphaFold, is revolutionizing
applications that depend on robust protein structure prediction algorithms. To
maximize the impact, and ease the usability, of these novel AI tools we
introduce APACE, AlphaFold2 and advanced computing as a service, a novel
computational framework that effectively handles this AI model and its TB-size
database to conduct accelerated protein structure prediction analyses in modern
supercomputing environments. We deployed APACE in the Delta supercomputer, and
quantified its performance for accurate protein structure predictions using
four exemplar proteins: 6AWO, 6OAN, 7MEZ, and 6D6U. Using up to 200 ensembles,
distributed across 50 nodes in Delta, equivalent to 200 A100 NVIDIA GPUs, we
found that APACE is up to two orders of magnitude faster than off-the-shelf
AlphaFold2 implementations, reducing time-to-solution from weeks to minutes.
This computational approach may be readily linked with robotics laboratories to
automate and accelerate scientific discovery.
- Abstract(参考訳): アミノ酸配列からタンパク質3d構造の予測は生物物理学において大きな課題であり、薬物の発見からゲノム解析まで、ロバストなタンパク質構造予測アルゴリズムにおいて重要な役割を果たしている。
AlphaFoldのようなAIモデルの出現は、堅牢なタンパク質構造予測アルゴリズムに依存するアプリケーションに革命をもたらしている。
このAIモデルとTBサイズのデータベースを効果的に処理し、現代のスーパーコンピュータ環境で加速されたタンパク質構造予測分析を行う、新しい計算フレームワークであるAPACE、AlphaFold2、および高度なコンピューティング・アズ・ア・サービスを導入する。
デルタスーパーコンピュータにAPACEを配置し, 6AWO, 6OAN, 7MEZ, 6D6Uの4つの類似タンパク質を用いて, 正確なタンパク質構造予測の性能を定量化した。
最大200アンサンブルを使用して、Deltaの50ノードに分散し、200 A100 NVIDIA GPUに相当する結果、APACEは市販のAlphaFold2実装よりも最大2桁高速で、数週間から数分に短縮できることがわかった。
この計算手法は、科学的な発見を自動化し、加速するために、ロボット研究所と容易に関連付けられる。
関連論文リスト
- xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering
the Language of Protein [76.18058946124111]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - OpenProteinSet: Training data for structural biology at scale [0.0]
タンパク質の多重配列アライメント(MSA)は、豊富な生物学的情報をコードする。
AlphaFold2のような、トランスフォーマーを使って大量の生のMSAに直接参加する最近のブレークスルーは、その重要性を再確認している。
OpenProteinSetは1600万以上のMSA、関連するタンパク質データバンクの構造ホモログ、AlphaFold2タンパク質構造予測のオープンソースコーパスである。
論文 参考訳(メタデータ) (2023-08-10T04:01:04Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Retrieved Sequence Augmentation for Protein Representation Learning [40.13920287967866]
本稿では,タンパク質表現学習のための検索シーケンス拡張について,アライメントや前処理を伴わずに導入する。
本モデルでは,新しいタンパク質ドメインに移行し,デノボタンパク質の予測においてMSAトランスフォーマーより優れていることを示す。
我々の研究はタンパク質の予測における大きなギャップを埋め、タンパク質配列を理解するのに必要なドメイン知識の解読に一歩近づいた。
論文 参考訳(メタデータ) (2023-02-24T10:31:45Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Unsupervisedly Prompting AlphaFold2 for Few-Shot Learning of Accurate
Folding Landscape and Protein Structure Prediction [28.630603355510324]
そこで我々は,メタ生成モデルであるEvoGenを提案し,貧弱なMSAターゲットに対するAlphaFold2のアンダーパフォーマンスを改善する。
EvoGenは、キャリブレーションまたは実質的に生成されたホモログシーケンスでモデルにプロンプトすることで、AlphaFold2を低データで正確に折り畳むのに役立つ。
論文 参考訳(メタデータ) (2022-08-20T10:23:17Z) - PSP: Million-level Protein Sequence Dataset for Protein Structure
Prediction [34.11168458572554]
PSPと命名された,高いカバレッジと多様性を持つ最初の100万レベルのタンパク質構造予測データセットを提示する。
このデータセットは570k真構造配列(10TB)と745k相補的蒸留配列(15TB)からなる。
また、このデータセット上でのSOTAタンパク質構造予測モデルのベンチマークトレーニング手順も提供する。
論文 参考訳(メタデータ) (2022-06-24T14:08:44Z) - DProQ: A Gated-Graph Transformer for Protein Complex Structure
Assessment [7.988932562855392]
DProQは、3Dタンパク質複合体の質を予測するために設計されたゲート近傍変調グラフ変換器(GGT)である。
グラフメッセージパッシング時の情報フローを制御するために,新しいグラフトランスフォーマフレームワークにノードゲートとエッジゲートを組み込んだ。
我々の厳密な実験は、DProQがタンパク質複合体のランク付けにおいて最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2022-05-21T15:41:46Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。