論文の概要: Generating Novel, Designable, and Diverse Protein Structures by
Equivariantly Diffusing Oriented Residue Clouds
- arxiv url: http://arxiv.org/abs/2301.12485v3
- Date: Tue, 6 Jun 2023 21:54:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-08 19:34:59.419345
- Title: Generating Novel, Designable, and Diverse Protein Structures by
Equivariantly Diffusing Oriented Residue Clouds
- Title(参考訳): 均一に拡散する配向雲による新規, 設計可能, 多様なタンパク質構造の生成
- Authors: Yeqing Lin, Mohammed AlQuraishi
- Abstract要約: 構造に基づくタンパク質設計は、設計可能で、新規で多様な構造を見つけることを目的としている。
生成モデルは、複雑なデータの低次元構造を暗黙的に学習することで、魅力的な代替手段を提供する。
我々は,3次元空間における配向参照フレームの雲を用いて離散時間拡散を行うタンパク質構造の生成モデルであるGenieを開発する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Proteins power a vast array of functional processes in living cells. The
capability to create new proteins with designed structures and functions would
thus enable the engineering of cellular behavior and development of
protein-based therapeutics and materials. Structure-based protein design aims
to find structures that are designable (can be realized by a protein sequence),
novel (have dissimilar geometry from natural proteins), and diverse (span a
wide range of geometries). While advances in protein structure prediction have
made it possible to predict structures of novel protein sequences, the
combinatorially large space of sequences and structures limits the practicality
of search-based methods. Generative models provide a compelling alternative, by
implicitly learning the low-dimensional structure of complex data
distributions. Here, we leverage recent advances in denoising diffusion
probabilistic models and equivariant neural networks to develop Genie, a
generative model of protein structures that performs discrete-time diffusion
using a cloud of oriented reference frames in 3D space. Through in silico
evaluations, we demonstrate that Genie generates protein backbones that are
more designable, novel, and diverse than existing models. This indicates that
Genie is capturing key aspects of the distribution of protein structure space
and facilitates protein design with high success rates. Code for generating new
proteins and training new versions of Genie is available at
https://github.com/aqlaboratory/genie.
- Abstract(参考訳): タンパク質は生きた細胞の幅広い機能的プロセスを動かします。
設計された構造と機能を持つ新しいタンパク質を作る能力は、細胞行動のエンジニアリングとタンパク質ベースの治療および材料の開発を可能にする。
構造に基づくタンパク質の設計は、設計可能な構造(タンパク質配列によって実現できる)、新しい構造(天然タンパク質と異なる幾何学を持つ)、多様な構造(幅広い幾何学)を見つけることを目的としている。
タンパク質構造予測の進歩により、新規なタンパク質配列の構造を予測できるようになったが、配列と構造の組み合わせ的な大きな空間は探索に基づく方法の実用性を制限している。
生成モデルは、複雑なデータ分布の低次元構造を暗黙的に学習することで、魅力的な代替手段を提供する。
本稿では、拡散確率モデルと同変ニューラルネットワークの分極化の最近の進歩を活用し、3次元空間における配向参照フレームの雲を用いて離散時間拡散を行うタンパク質構造の生成モデルであるGenieを開発する。
サイリコの評価を通じて、ジェニーが既存のモデルよりも設計可能で、新規で多様なタンパク質のバックボーンを生成することを示した。
これは、genieがタンパク質構造空間の分布の重要な側面を捉えており、高い成功率でタンパク質の設計を促進することを示している。
新しいタンパク質を生成し、新しいバージョンのgenieをトレーニングするためのコードは、https://github.com/aqlaboratory/genie.comで入手できる。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Protein Sequence and Structure Co-Design with Equivariant Translation [19.816174223173494]
既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
論文 参考訳(メタデータ) (2022-10-17T06:00:12Z) - Protein structure generation via folding diffusion [16.12124223972183]
本稿では,タンパク質のバックボーン構造を設計する拡散モデルを提案する。
ランダムな展開状態から安定な折り畳み構造へデノイングすることで、新しい構造を生成する。
有用な資源として、タンパク質構造拡散のための最初のオープンソースおよび訓練されたモデルをリリースする。
論文 参考訳(メタデータ) (2022-09-30T17:35:53Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - G-VAE, a Geometric Convolutional VAE for ProteinStructure Generation [41.66010308405784]
本稿では,3次元タンパク質構造の比較,変形,生成のための統合幾何学的ニューラルネットワーク手法を提案する。
本手法は, トレーニングデータの構造と異なり, 可塑性構造を生成することができる。
論文 参考訳(メタデータ) (2021-06-22T16:52:48Z) - Functional Protein Structure Annotation Using a Deep Convolutional
Generative Adversarial Network [4.3871352596331255]
機能性に基づいてタンパク質構造を分類するDeep Convolutional Generative Adversarial Network (DCGAN)の利用について紹介する。
我々は,DCGANを3次元デコイおよびネイティブタンパク構造で訓練し,3次元タンパク構造の生成と識別を行う。
論文 参考訳(メタデータ) (2021-04-18T22:18:52Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。