論文の概要: State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model
- arxiv url: http://arxiv.org/abs/2209.15171v2
- Date: Wed, 19 Apr 2023 19:40:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-21 17:19:35.514916
- Title: State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model
- Title(参考訳): マルチスケール深部生成モデルによる状態特異的タンパク質-リガンド複合体構造予測
- Authors: Zhuoran Qiao, Weili Nie, Arash Vahdat, Thomas F. Miller III, Anima
Anandkumar
- Abstract要約: タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
- 参考スコア(独自算出の注目度): 68.28309982199902
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The binding complexes formed by proteins and small molecule ligands are
ubiquitous and critical to life. Despite recent advancements in protein
structure prediction, existing algorithms are so far unable to systematically
predict the binding ligand structures along with their regulatory effects on
protein folding. To address this discrepancy, we present NeuralPLexer, a
computational approach that can directly predict protein-ligand complex
structures solely using protein sequence and ligand molecular graph inputs.
NeuralPLexer adopts a deep generative model to sample the 3D structures of the
binding complex and their conformational changes at an atomistic resolution.
The model is based on a diffusion process that incorporates essential
biophysical constraints and a multi-scale geometric deep learning system to
iteratively sample residue-level contact maps and all heavy-atom coordinates in
a hierarchical manner. NeuralPLexer achieves state-of-the-art performance
compared to all existing methods on benchmarks for both protein-ligand blind
docking and flexible binding site structure recovery. Moreover, owing to its
specificity in sampling both ligand-free-state and ligand-bound-state
ensembles, NeuralPLexer consistently outperforms AlphaFold2 in terms of global
protein structure accuracy on both representative structure pairs with large
conformational changes (average TM-score=0.93) and recently determined
ligand-binding proteins (average TM-score=0.89). Case studies reveal that the
predicted conformational variations are consistent with structure determination
experiments for important targets, including human KRAS$^\textrm{G12C}$,
ketol-acid reductoisomerase, and purine GPCRs. Our study suggests that a
data-driven approach can capture the structural cooperativity between proteins
and small molecules, showing promise in accelerating the design of enzymes,
drug molecules, and beyond.
- Abstract(参考訳): タンパク質と小さな分子配位子によって形成される結合複合体はユビキタスであり、生命に必須である。
近年のタンパク質構造予測の進歩にもかかわらず、既存のアルゴリズムではタンパク質の折りたたみに対する制御効果とともに結合配位子構造を系統的に予測することはできない。
タンパク質配列とリガンド分子グラフ入力のみを使用して、タンパク質-リガンド複合体構造を直接予測する計算手法であるneuroplexerを提案する。
NeuralPLexerは、結合複合体の3次元構造とその構造変化を原子分解能でサンプリングするために、深い生成モデルを採用している。
本モデルは,生体物理学的な制約と多スケールの幾何学的深層学習システムを組み合わせた拡散過程に基づき,残差レベル接触マップと重原子座標を階層的にサンプリングする。
NeuralPLexerは、タンパク質リガンドドッキングとフレキシブルな結合サイト構造回復のベンチマークにおける既存のすべての方法と比較して、最先端のパフォーマンスを実現している。
さらに、リガンドフリー状態とリガンドバウンド状態の両方のアンサンブルをサンプリングする特異性のため、NeuralPLexerは、大きなコンフォメーション変化を持つ2つの代表構造対(平均TM-score=0.93)と最近決定されたリガンド結合タンパク質(平均TM-score=0.89)のグローバルなタンパク質構造精度において、一貫してAlphaFold2を上回っている。
ケーススタディでは、予測されたコンフォメーション変異は、ヒトKRAS$^\textrm{G12C}$、ケトール酸還元酵素、精製GPCRなどの重要な標的の構造決定実験と一致していることが明らかとなった。
我々の研究は、データ駆動アプローチがタンパク質と小さな分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - 4D Diffusion for Dynamic Protein Structure Prediction with Reference Guided Motion Alignment [18.90451943620277]
本研究では分子動力学(MD)シミュレーションデータを用いた動的タンパク質構造学習のための革新的4次元拡散モデルを提案する。
我々の知る限り、これはタンパク質の軌道を複数の時間ステップで同時に予測することを目的とした初めての拡散モデルである。
論文 参考訳(メタデータ) (2024-08-22T14:12:50Z) - PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for
Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。
既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。
CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-13T03:51:10Z) - FFF: Fragments-Guided Flexible Fitting for Building Complete Protein
Structures [10.682516227941592]
タンパク質構造予測とタンパク質構造認識を柔軟に組み合わせた新しいFFF法を提案する。
まず、入力された3次元Cryo-EMマップから様々な構造的特徴を捉えるために、マルチレベル認識ネットワークを使用する。
次に、これらの特徴に基づいて擬似ペプチドベクターとタンパク質配列アライメント法を用いてタンパク質構造断片を生成する。
論文 参考訳(メタデータ) (2023-08-07T15:10:21Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Protein Sequence and Structure Co-Design with Equivariant Translation [19.816174223173494]
既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
論文 参考訳(メタデータ) (2022-10-17T06:00:12Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。