論文の概要: Functional Geometry Guided Protein Sequence and Backbone Structure
Co-Design
- arxiv url: http://arxiv.org/abs/2310.04343v3
- Date: Mon, 8 Jan 2024 19:40:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-10 19:58:47.521621
- Title: Functional Geometry Guided Protein Sequence and Backbone Structure
Co-Design
- Title(参考訳): 機能幾何誘導タンパク質配列と骨格構造共設計
- Authors: Zhenqiao Song, Yunlong Zhao, Wenxian Shi, Yang Yang, Lei Li
- Abstract要約: 本稿では,自動検出機能部位に基づくタンパク質配列と構造を共同設計するモデルを提案する。
NAEProは、全シーケンスでグローバルな相関を捉えることができる、注目層と同変層のインターリービングネットワークによって駆動される。
実験結果から,本モデルは全競技種の中で,最高アミノ酸回収率,TMスコア,最低RMSDを実現していることがわかった。
- 参考スコア(独自算出の注目度): 12.585697288315846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Proteins are macromolecules responsible for essential functions in almost all
living organisms. Designing reasonable proteins with desired functions is
crucial. A protein's sequence and structure are strongly correlated and they
together determine its function. In this paper, we propose NAEPro, a model to
jointly design Protein sequence and structure based on automatically detected
functional sites. NAEPro is powered by an interleaving network of attention and
equivariant layers, which can capture global correlation in a whole sequence
and local influence from nearest amino acids in three dimensional (3D) space.
Such an architecture facilitates effective yet economic message passing at two
levels. We evaluate our model and several strong baselines on two protein
datasets, $\beta$-lactamase and myoglobin. Experimental results show that our
model consistently achieves the highest amino acid recovery rate, TM-score, and
the lowest RMSD among all competitors. These findings prove the capability of
our model to design protein sequences and structures that closely resemble
their natural counterparts. Furthermore, in-depth analysis further confirms our
model's ability to generate highly effective proteins capable of binding to
their target metallocofactors. We provide code, data and models in Github.
- Abstract(参考訳): タンパク質は、ほとんどすべての生物に必須の機能を持つ高分子である。
望ましい機能を持つ合理的なタンパク質を設計することは重要である。
タンパク質の配列と構造は強く相関し、その機能を共に決定する。
本稿では,自動検出機能部位に基づくタンパク質配列と構造を共同設計するモデルであるNAEProを提案する。
NAEProは、注目層と同変層の相互結合ネットワークによって、全配列のグローバルな相関と、3次元の3D空間における最も近いアミノ酸からの局所的な影響を捉えることができる。
このようなアーキテクチャは2つのレベルで効果的だが経済的なメッセージ転送を促進する。
2つのタンパク質データセットである$\beta$-lactamase と myoglobin のモデルといくつかの強力なベースラインを評価した。
実験の結果, 本モデルでは, 高いアミノ酸回収率, tm-score, および最も低いrmsdが得られることがわかった。
これらの知見は、タンパク質の配列や構造が自然に類似していることを示すものである。
さらに, 詳細な分析により, 対象のメタロコファクターに結合可能な高効率なタンパク質を生成できることが確認された。
Githubではコード、データ、モデルを提供しています。
関連論文リスト
- xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering
the Language of Protein [76.18058946124111]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Joint Design of Protein Sequence and Structure based on Motifs [11.731131799546489]
タンパク質のバックボーン構造と配列を共同で設計するGeoProを提案する。
GeoProは3次元(3D)バックボーン構造のための同変エンコーダと3次元幾何学でガイドされるタンパク質配列デコーダによって駆動される。
本手法はタンパク質データバンク(PDB)やUniProtに存在しない新規な$beta$-lactamasesおよびミオグロビンを発見する。
論文 参考訳(メタデータ) (2023-10-04T03:07:03Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Protein Structure and Sequence Generation with Equivariant Denoising
Diffusion Probabilistic Models [3.5450828190071646]
バイオエンジニアリングにおける重要な課題は、特定の3D構造と標的機能を可能にする化学的性質を持つタンパク質を設計することである。
タンパク質の構造と配列の両方の生成モデルを導入し、従来の分子生成モデルよりもはるかに大きなスケールで操作できる。
論文 参考訳(メタデータ) (2022-05-26T16:10:09Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - PersGNN: Applying Topological Data Analysis and Geometric Deep Learning
to Structure-Based Protein Function Prediction [0.07340017786387766]
本研究では,タンパク質構造を分離し,タンパク質データバンク内のタンパク質の機能的アノテーションを作成する。
本稿では,グラフ表現学習とトポロジカルデータ解析を組み合わせた,エンドツーエンドのトレーニング可能なディープラーニングモデルPersGNNを提案する。
論文 参考訳(メタデータ) (2020-10-30T02:24:35Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。