論文の概要: Protein Sequence and Structure Co-Design with Equivariant Translation
- arxiv url: http://arxiv.org/abs/2210.08761v1
- Date: Mon, 17 Oct 2022 06:00:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 21:51:58.803241
- Title: Protein Sequence and Structure Co-Design with Equivariant Translation
- Title(参考訳): 等価翻訳を伴うタンパク質の配列と構造共設計
- Authors: Chence Shi, Chuanrui Wang, Jiarui Lu, Bozitao Zhong, Jian Tang
- Abstract要約: 既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
- 参考スコア(独自算出の注目度): 19.816174223173494
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Proteins are macromolecules that perform essential functions in all living
organisms. Designing novel proteins with specific structures and desired
functions has been a long-standing challenge in the field of bioengineering.
Existing approaches generate both protein sequence and structure using either
autoregressive models or diffusion models, both of which suffer from high
inference costs. In this paper, we propose a new approach capable of protein
sequence and structure co-design, which iteratively translates both protein
sequence and structure into the desired state from random initialization, based
on context features given a priori. Our model consists of a trigonometry-aware
encoder that reasons geometrical constraints and interactions from context
features, and a roto-translation equivariant decoder that translates protein
sequence and structure interdependently. Notably, all protein amino acids are
updated in one shot in each translation step, which significantly accelerates
the inference process. Experimental results across multiple tasks show that our
model outperforms previous state-of-the-art baselines by a large margin, and is
able to design proteins of high fidelity as regards both sequence and
structure, with running time orders of magnitude less than sampling-based
methods.
- Abstract(参考訳): タンパク質はすべての生物に必須の機能を持つ高分子である。
特定の構造と所望の機能を持つ新規タンパク質の設計は、バイオエンジニアリングの分野で長年の課題であった。
既存のアプローチは、自己回帰モデルまたは拡散モデルを用いて、タンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造をランダム初期化から所望の状態へと反復的に翻訳する,タンパク質配列と構造共設計が可能な新しい手法を提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法対応エンコーダと、タンパク質配列と構造を相互に翻訳するロト翻訳同変デコーダからなる。
特に、すべてのタンパク質アミノ酸は翻訳ステップごとに1ショットで更新され、推論プロセスが大幅に加速される。
複数のタスクにまたがる実験結果から,我々のモデルは従来の最先端のベースラインを大きなマージンで上回り,配列と構造の両方について高い忠実度を持つタンパク質を設計できることがわかった。
関連論文リスト
- Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文 参考訳(メタデータ) (2024-05-30T17:53:50Z) - Diffusion on language model embeddings for protein sequence generation [0.5442686600296733]
連続拡散を利用したアミノ酸配列生成モデルであるDiMAを導入する。
優れたパフォーマンスをもたらす設計選択の影響を定量的に説明します。
我々のアプローチは、タンパク質空間の構造的および機能的多様性を正確に反映する、新規で多様なタンパク質配列を一貫して生成する。
論文 参考訳(メタデータ) (2024-03-06T14:15:20Z) - FoldToken: Learning Protein Language via Vector Quantization and Beyond [56.19308144551836]
タンパク質配列構造を離散シンボルとして表現するために textbfFoldTokenizer を導入する。
学習したシンボルを textbfFoldToken と呼び、FoldToken の配列が新しいタンパク質言語として機能する。
論文 参考訳(メタデータ) (2024-02-04T12:18:51Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Generating Novel, Designable, and Diverse Protein Structures by
Equivariantly Diffusing Oriented Residue Clouds [0.0]
構造に基づくタンパク質設計は、設計可能で、新規で多様な構造を見つけることを目的としている。
生成モデルは、複雑なデータの低次元構造を暗黙的に学習することで、魅力的な代替手段を提供する。
我々は,3次元空間における配向参照フレームの雲を用いて離散時間拡散を行うタンパク質構造の生成モデルであるGenieを開発する。
論文 参考訳(メタデータ) (2023-01-29T16:44:19Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Protein Structure and Sequence Generation with Equivariant Denoising
Diffusion Probabilistic Models [3.5450828190071646]
バイオエンジニアリングにおける重要な課題は、特定の3D構造と標的機能を可能にする化学的性質を持つタンパク質を設計することである。
タンパク質の構造と配列の両方の生成モデルを導入し、従来の分子生成モデルよりもはるかに大きなスケールで操作できる。
論文 参考訳(メタデータ) (2022-05-26T16:10:09Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。