論文の概要: Benchmarking deep generative models for diverse antibody sequence design
- arxiv url: http://arxiv.org/abs/2111.06801v1
- Date: Fri, 12 Nov 2021 16:23:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-15 15:40:17.535454
- Title: Benchmarking deep generative models for diverse antibody sequence design
- Title(参考訳): 多様な抗体配列設計のためのディープジェネレーティブモデルのベンチマーク
- Authors: Igor Melnyk, Payel Das, Vijil Chenthamarakshan, Aurelie Lozano
- Abstract要約: シーケンスのみから、あるいはシーケンスと構造を共同で学習する深層生成モデルは、このタスクにおいて印象的なパフォーマンスを示している。
最近提案されたタンパク質設計のための3つの深い生成フレームワークについて考察する: (AR) 配列ベースの自己回帰生成モデル、(GVP) 正確な構造ベースのグラフニューラルネットワーク、そして3次元折り畳みのファジィでスケールフリーな表現を利用するFold2Seq。
我々は,これらのモデルを,機能的含意に高い多様性を持つ設計配列を必要とする抗体配列の計算設計のタスクに基づいてベンチマークする。
- 参考スコア(独自算出の注目度): 18.515971640245997
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational protein design, i.e. inferring novel and diverse protein
sequences consistent with a given structure, remains a major unsolved
challenge. Recently, deep generative models that learn from sequences alone or
from sequences and structures jointly have shown impressive performance on this
task. However, those models appear limited in terms of modeling structural
constraints, capturing enough sequence diversity, or both. Here we consider
three recently proposed deep generative frameworks for protein design: (AR) the
sequence-based autoregressive generative model, (GVP) the precise
structure-based graph neural network, and Fold2Seq that leverages a fuzzy and
scale-free representation of a three-dimensional fold, while enforcing
structure-to-sequence (and vice versa) consistency. We benchmark these models
on the task of computational design of antibody sequences, which demand
designing sequences with high diversity for functional implication. The
Fold2Seq framework outperforms the two other baselines in terms of diversity of
the designed sequences, while maintaining the typical fold.
- Abstract(参考訳): 計算タンパク質の設計、すなわち、与えられた構造と一致する新規で多様なタンパク質配列を推論することは、未解決の大きな課題である。
近年,シーケンスのみから,あるいはシーケンスと構造を共同で学習する深層生成モデルは,この課題に対して印象的な性能を示した。
しかし、これらのモデルは、構造的制約をモデル化したり、十分なシーケンスの多様性をキャプチャしたり、あるいは両方で制限されるように見える。
本稿では,最近提案されている3つのタンパク質設計のための深層生成フレームワークについて考察する。 (ar) シーケンスベース自己回帰生成モデル, (gvp) 精密構造ベースのグラフニューラルネットワーク, fold2seq は3次元フォールドのファジィでスケールフリーな表現を活用し, 構造からシーケンスへの一貫性(およびその逆)を強制する。
我々は, 抗体配列の計算設計のタスクにおいて, 機能的含意の多様性が高い配列の設計を要求される。
fold2seqフレームワークは、典型的な折りたたみを維持しつつ、設計されたシーケンスの多様性の観点から他の2つのベースラインを上回る。
関連論文リスト
- Inverse folding for antibody sequence design using deep learning [2.8998926117101367]
本稿では, 抗体構造に特異的に最適化した, 精密な折り畳み逆モデルを提案する。
本研究では、相補性決定領域の標準的コンフォーメーションについて検討し、これらのループの既知のクラスタへの符号化を改善した。
論文 参考訳(メタデータ) (2023-10-30T13:12:41Z) - Cross-Gate MLP with Protein Complex Invariant Embedding is A One-Shot
Antibody Designer [58.97153056120193]
抗体の特異性は、その相補性決定領域(CDR)によって決定される
従来の研究では、複雑な技術を使ってCDRを生成するが、不適切な幾何学的モデリングに悩まされている。
本稿では,CDRの1次元配列と3次元構造を1ショットで共設計できるテクスタイスシンプルで効果的なモデルを提案する。
論文 参考訳(メタデータ) (2023-04-21T13:24:26Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - A Pareto-optimal compositional energy-based model for sampling and
optimization of protein sequences [55.25331349436895]
深層生成モデルは、生命科学における逆問題に対する一般的な機械学習ベースのアプローチとして登場した。
これらの問題は、データ分布の学習に加えて、興味のある複数の特性を満たす新しい設計をサンプリングする必要があることが多い。
論文 参考訳(メタデータ) (2022-10-19T19:04:45Z) - Protein Sequence and Structure Co-Design with Equivariant Translation [19.816174223173494]
既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
論文 参考訳(メタデータ) (2022-10-17T06:00:12Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - Fold2Seq: A Joint Sequence(1D)-Fold(3D) Embedding-based Generative Model
for Protein Design [70.27706384570723]
Fold2Seqは特定の標的に条件付きタンパク質配列を設計するための新しいフレームワークである。
Fold2Seqの性能は, シーケンス設計の速度, カバレッジ, 信頼性において向上したか, 同等であったかを示す。
フォールドベースのFold2Seqの独特な利点は、構造ベースのディープモデルやRosettaDesignと比較して、3つの現実世界の課題においてより明確になる。
論文 参考訳(メタデータ) (2021-06-24T14:34:24Z) - Structured Reordering for Modeling Latent Alignments in Sequence
Transduction [86.94309120789396]
本稿では,分離可能な置換の辺りを正確に推定する効率的な動的プログラミングアルゴリズムを提案する。
結果のSeq2seqモデルは、合成問題やNLPタスクの標準モデルよりも体系的な一般化が優れている。
論文 参考訳(メタデータ) (2021-06-06T21:53:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。