論文の概要: Benchmarking deep generative models for diverse antibody sequence design
- arxiv url: http://arxiv.org/abs/2111.06801v1
- Date: Fri, 12 Nov 2021 16:23:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-15 15:40:17.535454
- Title: Benchmarking deep generative models for diverse antibody sequence design
- Title(参考訳): 多様な抗体配列設計のためのディープジェネレーティブモデルのベンチマーク
- Authors: Igor Melnyk, Payel Das, Vijil Chenthamarakshan, Aurelie Lozano
- Abstract要約: シーケンスのみから、あるいはシーケンスと構造を共同で学習する深層生成モデルは、このタスクにおいて印象的なパフォーマンスを示している。
最近提案されたタンパク質設計のための3つの深い生成フレームワークについて考察する: (AR) 配列ベースの自己回帰生成モデル、(GVP) 正確な構造ベースのグラフニューラルネットワーク、そして3次元折り畳みのファジィでスケールフリーな表現を利用するFold2Seq。
我々は,これらのモデルを,機能的含意に高い多様性を持つ設計配列を必要とする抗体配列の計算設計のタスクに基づいてベンチマークする。
- 参考スコア(独自算出の注目度): 18.515971640245997
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational protein design, i.e. inferring novel and diverse protein
sequences consistent with a given structure, remains a major unsolved
challenge. Recently, deep generative models that learn from sequences alone or
from sequences and structures jointly have shown impressive performance on this
task. However, those models appear limited in terms of modeling structural
constraints, capturing enough sequence diversity, or both. Here we consider
three recently proposed deep generative frameworks for protein design: (AR) the
sequence-based autoregressive generative model, (GVP) the precise
structure-based graph neural network, and Fold2Seq that leverages a fuzzy and
scale-free representation of a three-dimensional fold, while enforcing
structure-to-sequence (and vice versa) consistency. We benchmark these models
on the task of computational design of antibody sequences, which demand
designing sequences with high diversity for functional implication. The
Fold2Seq framework outperforms the two other baselines in terms of diversity of
the designed sequences, while maintaining the typical fold.
- Abstract(参考訳): 計算タンパク質の設計、すなわち、与えられた構造と一致する新規で多様なタンパク質配列を推論することは、未解決の大きな課題である。
近年,シーケンスのみから,あるいはシーケンスと構造を共同で学習する深層生成モデルは,この課題に対して印象的な性能を示した。
しかし、これらのモデルは、構造的制約をモデル化したり、十分なシーケンスの多様性をキャプチャしたり、あるいは両方で制限されるように見える。
本稿では,最近提案されている3つのタンパク質設計のための深層生成フレームワークについて考察する。 (ar) シーケンスベース自己回帰生成モデル, (gvp) 精密構造ベースのグラフニューラルネットワーク, fold2seq は3次元フォールドのファジィでスケールフリーな表現を活用し, 構造からシーケンスへの一貫性(およびその逆)を強制する。
我々は, 抗体配列の計算設計のタスクにおいて, 機能的含意の多様性が高い配列の設計を要求される。
fold2seqフレームワークは、典型的な折りたたみを維持しつつ、設計されたシーケンスの多様性の観点から他の2つのベースラインを上回る。
関連論文リスト
- DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - Approximate learning of parsimonious Bayesian context trees [0.0]
提案するフレームワークは、合成および実世界のデータ例に基づいてテストされる。
これは、実際のタンパク質配列やハニーポットコンピュータターミナルセッションに適合すると、既存のシーケンスモデルより優れている。
論文 参考訳(メタデータ) (2024-07-27T11:50:40Z) - Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文 参考訳(メタデータ) (2024-05-30T17:53:50Z) - FoldToken: Learning Protein Language via Vector Quantization and Beyond [56.19308144551836]
タンパク質配列構造を離散シンボルとして表現するために textbfFoldTokenizer を導入する。
学習したシンボルを textbfFoldToken と呼び、FoldToken の配列が新しいタンパク質言語として機能する。
論文 参考訳(メタデータ) (2024-02-04T12:18:51Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - Fold2Seq: A Joint Sequence(1D)-Fold(3D) Embedding-based Generative Model
for Protein Design [70.27706384570723]
Fold2Seqは特定の標的に条件付きタンパク質配列を設計するための新しいフレームワークである。
Fold2Seqの性能は, シーケンス設計の速度, カバレッジ, 信頼性において向上したか, 同等であったかを示す。
フォールドベースのFold2Seqの独特な利点は、構造ベースのディープモデルやRosettaDesignと比較して、3つの現実世界の課題においてより明確になる。
論文 参考訳(メタデータ) (2021-06-24T14:34:24Z) - Structured Reordering for Modeling Latent Alignments in Sequence
Transduction [86.94309120789396]
本稿では,分離可能な置換の辺りを正確に推定する効率的な動的プログラミングアルゴリズムを提案する。
結果のSeq2seqモデルは、合成問題やNLPタスクの標準モデルよりも体系的な一般化が優れている。
論文 参考訳(メタデータ) (2021-06-06T21:53:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。