論文の概要: Generative De Novo Protein Design with Global Context
- arxiv url: http://arxiv.org/abs/2204.10673v1
- Date: Thu, 21 Apr 2022 02:55:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-25 13:24:50.295177
- Title: Generative De Novo Protein Design with Global Context
- Title(参考訳): グローバルコンテキストを用いたデノボタンパク質の創製
- Authors: Cheng Tan, Zhangyang Gao, Jun Xia, Stan Z. Li
- Abstract要約: タンパク質構造予測の逆は、定義された構造に折り畳まれる新しいタンパク質配列を得ることを目的としている。
計算タンパク質の設計に関する最近の研究は、局所的な位置情報を持つ所望のバックボーン構造の設計シーケンスについて研究している。
局所モジュールとグローバルモジュールからなるGCA(Global-Context Aware Generative de novo protein design method)を提案する。
- 参考スコア(独自算出の注目度): 36.21545615114117
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The linear sequence of amino acids determines protein structure and function.
Protein design, known as the inverse of protein structure prediction, aims to
obtain a novel protein sequence that will fold into the defined structure.
Recent works on computational protein design have studied designing sequences
for the desired backbone structure with local positional information and
achieved competitive performance. However, similar local environments in
different backbone structures may result in different amino acids, indicating
that protein structure's global context matters. Thus, we propose the
Global-Context Aware generative de novo protein design method (GCA), consisting
of local and global modules. While local modules focus on relationships between
neighbor amino acids, global modules explicitly capture non-local contexts.
Experimental results demonstrate that the proposed GCA method outperforms
state-of-the-arts on de novo protein design. Our code and pretrained model will
be released.
- Abstract(参考訳): アミノ酸の線形配列はタンパク質の構造と機能を決定する。
タンパク質構造予測の逆法として知られるタンパク質設計は、定義された構造に折り畳む新しいタンパク質配列を得ることを目指している。
計算タンパク質の設計に関する最近の研究は、所望のバックボーン構造を局所的な位置情報で設計し、競争性能を達成した。
しかし、異なるバックボーン構造の類似した局所環境は異なるアミノ酸をもたらす可能性があり、タンパク質構造のグローバルな文脈が重要であることを示している。
そこで本研究では,局所モジュールとグローバルモジュールからなるGCA(Global-Context Aware Generative de novo protein design method)を提案する。
ローカルモジュールは隣接するアミノ酸間の関係に焦点を当てているが、グローバルモジュールは明示的に非ローカルなコンテキストをキャプチャする。
実験の結果,gca法がde novoタンパク質設計の最先端技術を上回ることがわかった。
私たちのコードとトレーニング済みのモデルがリリースされます。
関連論文リスト
- Protein Representation Learning with Sequence Information Embedding: Does it Always Lead to a Better Performance? [4.7077642423577775]
本稿では,アミノ酸構造表現のみに基づく局所幾何アライメント手法ProtLOCAを提案する。
本手法は,構造的に整合性のあるタンパク質ドメインとより迅速かつ正確にマッチングすることで,既存の配列および構造に基づく表現学習法より優れる。
論文 参考訳(メタデータ) (2024-06-28T08:54:37Z) - Functional Protein Design with Local Domain Alignment [39.79713846491306]
本稿では,タンパク質データベースから抽出したテキストアノテーションを組み込んだマルチモーダルなタンパク質設計フレームワークであるProtein-Alignment Generation (PAAG)を提案する。
具体的には、マルチレベルアライメントモジュール内でPAAGは、対応するドメインアノテーションに条件付けられた特定のドメインを含むタンパク質を明示的に生成することができる。
実験の結果,PAAGのタンパク質表現が7つの予測タスクよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-04-18T09:37:54Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - Functional Geometry Guided Protein Sequence and Backbone Structure
Co-Design [12.585697288315846]
本稿では,自動検出機能部位に基づくタンパク質配列と構造を共同設計するモデルを提案する。
NAEProは、全シーケンスでグローバルな相関を捉えることができる、注目層と同変層のインターリービングネットワークによって駆動される。
実験結果から,本モデルは全競技種の中で,最高アミノ酸回収率,TMスコア,最低RMSDを実現していることがわかった。
論文 参考訳(メタデータ) (2023-10-06T16:08:41Z) - Joint Design of Protein Sequence and Structure based on Motifs [11.731131799546489]
タンパク質のバックボーン構造と配列を共同で設計するGeoProを提案する。
GeoProは3次元(3D)バックボーン構造のための同変エンコーダと3次元幾何学でガイドされるタンパク質配列デコーダによって駆動される。
本手法はタンパク質データバンク(PDB)やUniProtに存在しない新規な$beta$-lactamasesおよびミオグロビンを発見する。
論文 参考訳(メタデータ) (2023-10-04T03:07:03Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Protein Sequence and Structure Co-Design with Equivariant Translation [19.816174223173494]
既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
論文 参考訳(メタデータ) (2022-10-17T06:00:12Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。