論文の概要: Incorporating Pre-training Paradigm for Antibody Sequence-Structure
Co-design
- arxiv url: http://arxiv.org/abs/2211.08406v2
- Date: Thu, 17 Nov 2022 13:51:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 14:16:18.075805
- Title: Incorporating Pre-training Paradigm for Antibody Sequence-Structure
Co-design
- Title(参考訳): 抗体配列構造共設計のための事前学習パラダイムの導入
- Authors: Kaiyuan Gao, Lijun Wu, Jinhua Zhu, Tianbo Peng, Yingce Xia, Liang He,
Shufang Xie, Tao Qin, Haiguang Liu, Kun He, Tie-Yan Liu
- Abstract要約: 深層学習に基づく計算抗体の設計は、人間の経験を補完する可能性のあるデータから自動的に抗体パターンをマイニングするので、注目を集めている。
計算手法は高品質な抗体構造データに大きく依存しており、非常に限定的である。
幸いなことに、CDRをモデル化し、構造データへの依存を軽減するために有効な抗体の配列データが多数存在する。
- 参考スコア(独自算出の注目度): 134.65287929316673
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Antibodies are versatile proteins that can bind to pathogens and provide
effective protection for human body. Recently, deep learning-based
computational antibody design has attracted popular attention since it
automatically mines the antibody patterns from data that could be complementary
to human experiences. However, the computational methods heavily rely on
high-quality antibody structure data, which is quite limited. Besides, the
complementarity-determining region (CDR), which is the key component of an
antibody that determines the specificity and binding affinity, is highly
variable and hard to predict. Therefore, the data limitation issue further
raises the difficulty of CDR generation for antibodies. Fortunately, there
exists a large amount of sequence data of antibodies that can help model the
CDR and alleviate the reliance on structure data. By witnessing the success of
pre-training models for protein modeling, in this paper, we develop the
antibody pre-training language model and incorporate it into the
(antigen-specific) antibody design model in a systemic way. Specifically, we
first pre-train an antibody language model based on the sequence data, then
propose a one-shot way for sequence and structure generation of CDR to avoid
the heavy cost and error propagation from an autoregressive manner, and finally
leverage the pre-trained antibody model for the antigen-specific antibody
generation model with some carefully designed modules. Through various
experiments, we show that our method achieves superior performances over
previous baselines on different tasks, such as sequence and structure
generation and antigen-binding CDR-H3 design.
- Abstract(参考訳): 抗体は病原体に結合し、人体に効果的な保護を与える万能なタンパク質である。
近年,人間の経験に相補する可能性のあるデータから,自動的に抗体パターンをマイニングするディープラーニングベースの計算抗体設計が注目されている。
しかし、計算手法は高品質な抗体構造データに大きく依存しており、非常に限られている。
さらに、特異性と結合親和性を決定する抗体の主要成分である相補性決定領域(CDR)は高度に変動し、予測が困難である。
したがって、データ制限問題により、抗体のCDR生成がさらに困難になる。
幸いなことに、CDRをモデル化し、構造データへの依存を軽減するために有効な抗体の配列データが多数存在する。
本稿では,タンパク質モデリングのための事前学習モデルの成功を目撃し,抗体事前学習言語モデルを開発し,(抗原特異的)抗体設計モデルに体系的に組み込む。
具体的には、まず、配列データに基づいて抗体言語モデルを事前訓練し、次にCDRの配列と構造を1ショットで生成し、自己回帰的手法による重コストとエラーの伝播を回避し、最後に、慎重に設計されたモジュールを用いた抗原特異的抗体生成モデルのための事前訓練された抗体モデルを活用する。
種々の実験により,本手法は,配列や構造の生成,抗原結合型CDR-H3設計など,過去のベースラインよりも優れた性能が得られることを示す。
関連論文リスト
- Large scale paired antibody language models [40.401345152825314]
IgBert と IgT5 は,これまでに開発された抗体特異的言語モデルの中で最も優れた性能を示した。
これらのモデルは、20億以上のObserved Spaceデータセットを使用して、包括的にトレーニングされている。
この進歩は、治療開発のための抗体設計を強化するために、機械学習、大規模データセット、高性能コンピューティングを活用する上で大きな前進となる。
論文 参考訳(メタデータ) (2024-03-26T17:21:54Z) - Antigen-Specific Antibody Design via Direct Energy-based Preference Optimization [51.28231365213679]
我々は,抗原特異的抗体配列構造共設計を,特定の嗜好に対する最適化問題として取り組んだ。
そこで本研究では,有理構造と抗原への結合親和性の両方を有する抗体の生成を誘導する,直接エネルギーに基づく選好最適化を提案する。
論文 参考訳(メタデータ) (2024-03-25T09:41:49Z) - A Hierarchical Training Paradigm for Antibody Structure-sequence
Co-design [54.30457372514873]
抗体配列構造共設計のための階層的訓練パラダイム(HTP)を提案する。
HTPは4段階の訓練段階から構成され、それぞれが特定のタンパク質のモダリティに対応する。
実証実験により、HTPは共同設計問題において新しい最先端性能を設定できることが示されている。
論文 参考訳(メタデータ) (2023-10-30T02:39:15Z) - Cross-Gate MLP with Protein Complex Invariant Embedding is A One-Shot
Antibody Designer [58.97153056120193]
抗体の特異性は、その相補性決定領域(CDR)によって決定される
従来の研究では、複雑な技術を使ってCDRを生成するが、不適切な幾何学的モデリングに悩まされている。
本稿では,CDRの1次元配列と3次元構造を1ショットで共設計できるテクスタイスシンプルで効果的なモデルを提案する。
論文 参考訳(メタデータ) (2023-04-21T13:24:26Z) - xTrimoABFold: De novo Antibody Structure Prediction without MSA [77.47606749555686]
我々は、抗体配列から抗体構造を予測するために、xTrimoABFoldという新しいモデルを開発した。
CDRにおけるドメイン特異的焦点損失のアンサンブル損失とフレーム整合点損失を最小化することにより,PDBの抗体構造をエンドツーエンドにトレーニングした。
論文 参考訳(メタデータ) (2022-11-30T09:26:08Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - Antibody Representation Learning for Drug Discovery [7.291511531280898]
新規なSARS-CoV-2抗体結合データセットと追加ベンチマークデータセットについて報告する。
従来の統計的シーケンスモデル,各データセットの教師付き学習,および抗体特異的事前訓練言語モデルの微調整の3つのクラスを比較した。
実験結果から,特徴表現の自己教師付き事前学習は,従来の手法よりも大幅に改善されていることが示唆された。
論文 参考訳(メタデータ) (2022-10-05T13:48:41Z) - Iterative Refinement Graph Neural Network for Antibody
Sequence-Structure Co-design [35.215029426177004]
そこで本研究では,結合特異性や中和機能を増強した抗体を自動設計する生成モデルを提案する。
本手法は,SARS-CoV-2ウイルスを中和可能な抗体の設計において,テストセット上で優れたログライクレーションを実現し,過去のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2021-10-09T18:23:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。