論文の概要: Joint Design of Protein Sequence and Structure based on Motifs
- arxiv url: http://arxiv.org/abs/2310.02546v1
- Date: Wed, 4 Oct 2023 03:07:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 16:41:58.178400
- Title: Joint Design of Protein Sequence and Structure based on Motifs
- Title(参考訳): モチーフに基づくタンパク質配列と構造の共同設計
- Authors: Zhenqiao Song, Yunlong Zhao, Yufei Song, Wenxian Shi, Yang Yang, Lei
Li
- Abstract要約: タンパク質のバックボーン構造と配列を共同で設計するGeoProを提案する。
GeoProは3次元(3D)バックボーン構造のための同変エンコーダと3次元幾何学でガイドされるタンパク質配列デコーダによって駆動される。
本手法はタンパク質データバンク(PDB)やUniProtに存在しない新規な$beta$-lactamasesおよびミオグロビンを発見する。
- 参考スコア(独自算出の注目度): 11.731131799546489
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Designing novel proteins with desired functions is crucial in biology and
chemistry. However, most existing work focus on protein sequence design,
leaving protein sequence and structure co-design underexplored. In this paper,
we propose GeoPro, a method to design protein backbone structure and sequence
jointly. Our motivation is that protein sequence and its backbone structure
constrain each other, and thus joint design of both can not only avoid
nonfolding and misfolding but also produce more diverse candidates with desired
functions. To this end, GeoPro is powered by an equivariant encoder for
three-dimensional (3D) backbone structure and a protein sequence decoder guided
by 3D geometry. Experimental results on two biologically significant
metalloprotein datasets, including $\beta$-lactamases and myoglobins, show that
our proposed GeoPro outperforms several strong baselines on most metrics.
Remarkably, our method discovers novel $\beta$-lactamases and myoglobins which
are not present in protein data bank (PDB) and UniProt. These proteins exhibit
stable folding and active site environments reminiscent of those of natural
proteins, demonstrating their excellent potential to be biologically
functional.
- Abstract(参考訳): 望ましい機能を持つ新規タンパク質の設計は、生物学と化学において不可欠である。
しかし、既存の研究はタンパク質配列の設計に重点を置いており、タンパク質配列と構造は未解明のままである。
本稿では,タンパク質骨格構造と配列を協調的に設計する手法であるgeoproを提案する。
我々のモチベーションは、タンパク質配列とその骨格構造が互いに制約しあうことであり、両者の共同設計は、非折り畳みやミスフォールディングを避けるだけでなく、望ましい機能を持つより多様な候補を生み出すことができる。
この目的のために、GeoProは3次元(3D)バックボーン構造のための同変エンコーダと3次元幾何学でガイドされるタンパク質配列デコーダによって駆動される。
生物学的に重要な2つのメタロプロテアーゼデータセット($\beta$-lactamasesやmyoglobins)の実験結果から、提案したGeoProは、ほとんどの指標においていくつかの強力なベースラインを上回ります。
注目すべきは、タンパク質データバンク(PDB)やUniProtに存在しない新規な$\beta$-lactamasesおよびmyoglobinsを発見することである。
これらのタンパク質は安定な折りたたみと活性部位環境を示し、生物学的に機能する優れた可能性を示している。
関連論文リスト
- Geometric Self-Supervised Pretraining on 3D Protein Structures using Subgraphs [25.93347924265175]
本稿では,3次元タンパク質構造上の3次元グラフニューラルネットワークを事前学習するための自己教師型手法を提案する。
サブグラフとグローバルなタンパク質構造との関係を考慮することで、このモデルはこれらの階層的な組織レベルについて推論することを学ぶことができる。
論文 参考訳(メタデータ) (2024-06-20T09:34:31Z) - A Hierarchical Training Paradigm for Antibody Structure-sequence
Co-design [54.30457372514873]
抗体配列構造共設計のための階層的訓練パラダイム(HTP)を提案する。
HTPは4段階の訓練段階から構成され、それぞれが特定のタンパク質のモダリティに対応する。
実証実験により、HTPは共同設計問題において新しい最先端性能を設定できることが示されている。
論文 参考訳(メタデータ) (2023-10-30T02:39:15Z) - Functional Geometry Guided Protein Sequence and Backbone Structure
Co-Design [12.585697288315846]
本稿では,自動検出機能部位に基づくタンパク質配列と構造を共同設計するモデルを提案する。
NAEProは、全シーケンスでグローバルな相関を捉えることができる、注目層と同変層のインターリービングネットワークによって駆動される。
実験結果から,本モデルは全競技種の中で,最高アミノ酸回収率,TMスコア,最低RMSDを実現していることがわかった。
論文 参考訳(メタデータ) (2023-10-06T16:08:41Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Generating Novel, Designable, and Diverse Protein Structures by
Equivariantly Diffusing Oriented Residue Clouds [0.0]
構造に基づくタンパク質設計は、設計可能で、新規で多様な構造を見つけることを目的としている。
生成モデルは、複雑なデータの低次元構造を暗黙的に学習することで、魅力的な代替手段を提供する。
我々は,3次元空間における配向参照フレームの雲を用いて離散時間拡散を行うタンパク質構造の生成モデルであるGenieを開発する。
論文 参考訳(メタデータ) (2023-01-29T16:44:19Z) - Protein Sequence and Structure Co-Design with Equivariant Translation [19.816174223173494]
既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
論文 参考訳(メタデータ) (2022-10-17T06:00:12Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Independent SE(3)-Equivariant Models for End-to-End Rigid Protein
Docking [57.2037357017652]
我々は、剛体タンパク質ドッキング、すなわち、個々の非結合構造からタンパク質-タンパク質複合体の3次元構造を計算的に予測する。
本研究では, タンパク質の回転と翻訳を予測し, 1つのタンパク質をドッキング位置に置くために, ペアワイズ非独立なSE(3)-等変グラフマッチングネットワークを設計する。
我々のモデルはEquiDockと呼ばれ、結合ポケットを近似し、キーポイントマッチングとアライメントを用いてドッキングポーズを予測する。
論文 参考訳(メタデータ) (2021-11-15T18:46:37Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。