論文の概要: Protein Sequence and Structure Co-Design with Equivariant Translation
- arxiv url: http://arxiv.org/abs/2210.08761v1
- Date: Mon, 17 Oct 2022 06:00:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 21:51:58.803241
- Title: Protein Sequence and Structure Co-Design with Equivariant Translation
- Title(参考訳): 等価翻訳を伴うタンパク質の配列と構造共設計
- Authors: Chence Shi, Chuanrui Wang, Jiarui Lu, Bozitao Zhong, Jian Tang
- Abstract要約: 既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
- 参考スコア(独自算出の注目度): 19.816174223173494
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Proteins are macromolecules that perform essential functions in all living
organisms. Designing novel proteins with specific structures and desired
functions has been a long-standing challenge in the field of bioengineering.
Existing approaches generate both protein sequence and structure using either
autoregressive models or diffusion models, both of which suffer from high
inference costs. In this paper, we propose a new approach capable of protein
sequence and structure co-design, which iteratively translates both protein
sequence and structure into the desired state from random initialization, based
on context features given a priori. Our model consists of a trigonometry-aware
encoder that reasons geometrical constraints and interactions from context
features, and a roto-translation equivariant decoder that translates protein
sequence and structure interdependently. Notably, all protein amino acids are
updated in one shot in each translation step, which significantly accelerates
the inference process. Experimental results across multiple tasks show that our
model outperforms previous state-of-the-art baselines by a large margin, and is
able to design proteins of high fidelity as regards both sequence and
structure, with running time orders of magnitude less than sampling-based
methods.
- Abstract(参考訳): タンパク質はすべての生物に必須の機能を持つ高分子である。
特定の構造と所望の機能を持つ新規タンパク質の設計は、バイオエンジニアリングの分野で長年の課題であった。
既存のアプローチは、自己回帰モデルまたは拡散モデルを用いて、タンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造をランダム初期化から所望の状態へと反復的に翻訳する,タンパク質配列と構造共設計が可能な新しい手法を提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法対応エンコーダと、タンパク質配列と構造を相互に翻訳するロト翻訳同変デコーダからなる。
特に、すべてのタンパク質アミノ酸は翻訳ステップごとに1ショットで更新され、推論プロセスが大幅に加速される。
複数のタスクにまたがる実験結果から,我々のモデルは従来の最先端のベースラインを大きなマージンで上回り,配列と構造の両方について高い忠実度を持つタンパク質を設計できることがわかった。
関連論文リスト
- Multi-Scale Representation Learning for Protein Fitness Prediction [31.735234482320283]
これまでの手法は主に、巨大でラベルなしのタンパク質配列や構造データセットに基づいて訓練された自己教師型モデルに依存してきた。
本稿では,タンパク質の機能を統合する新しいマルチモーダル表現学習フレームワークであるSequence-Structure-Surface Fitness (S3F)モデルを紹介する。
提案手法は,タンパク質言語モデルからの配列表現と,タンパク質のバックボーンと詳細な表面トポロジーをコードするGeometric Vector Perceptronネットワークを組み合わせる。
論文 参考訳(メタデータ) (2024-12-02T04:28:10Z) - ProteinWeaver: A Divide-and-Assembly Approach for Protein Backbone Design [61.19456204667385]
本稿では,タンパク質のバックボーン設計のための2段階フレームワークであるProteinWeaverを紹介する。
プロテインウィーバーは、多用途ドメインアセンブリを通じて高品質で新規なタンパク質のバックボーンを生成する。
分割組立パラダイムを導入することにより、タンパク質工学を進歩させ、機能的タンパク質設計のための新たな道を開く。
論文 参考訳(メタデータ) (2024-11-08T08:10:49Z) - Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文 参考訳(メタデータ) (2024-05-30T17:53:50Z) - FoldToken: Learning Protein Language via Vector Quantization and Beyond [56.19308144551836]
タンパク質配列構造を離散シンボルとして表現するために textbfFoldTokenizer を導入する。
学習したシンボルを textbfFoldToken と呼び、FoldToken の配列が新しいタンパク質言語として機能する。
論文 参考訳(メタデータ) (2024-02-04T12:18:51Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Generating Novel, Designable, and Diverse Protein Structures by
Equivariantly Diffusing Oriented Residue Clouds [0.0]
構造に基づくタンパク質設計は、設計可能で、新規で多様な構造を見つけることを目的としている。
生成モデルは、複雑なデータの低次元構造を暗黙的に学習することで、魅力的な代替手段を提供する。
我々は,3次元空間における配向参照フレームの雲を用いて離散時間拡散を行うタンパク質構造の生成モデルであるGenieを開発する。
論文 参考訳(メタデータ) (2023-01-29T16:44:19Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Protein Structure and Sequence Generation with Equivariant Denoising
Diffusion Probabilistic Models [3.5450828190071646]
バイオエンジニアリングにおける重要な課題は、特定の3D構造と標的機能を可能にする化学的性質を持つタンパク質を設計することである。
タンパク質の構造と配列の両方の生成モデルを導入し、従来の分子生成モデルよりもはるかに大きなスケールで操作できる。
論文 参考訳(メタデータ) (2022-05-26T16:10:09Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。