論文の概要: xTrimoABFold: De novo Antibody Structure Prediction without MSA
- arxiv url: http://arxiv.org/abs/2212.00735v3
- Date: Fri, 5 May 2023 03:52:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 17:22:32.407463
- Title: xTrimoABFold: De novo Antibody Structure Prediction without MSA
- Title(参考訳): xTrimoABFold:MSAのないDe novo抗体構造予測
- Authors: Yining Wang, Xumeng Gong, Shaochuan Li, Bing Yang, YiWu Sun, Chuan
Shi, Yangang Wang, Cheng Yang, Hui Li, Le Song
- Abstract要約: 我々は、抗体配列から抗体構造を予測するために、xTrimoABFoldという新しいモデルを開発した。
CDRにおけるドメイン特異的焦点損失のアンサンブル損失とフレーム整合点損失を最小化することにより,PDBの抗体構造をエンドツーエンドにトレーニングした。
- 参考スコア(独自算出の注目度): 77.47606749555686
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the field of antibody engineering, an essential task is to design a novel
antibody whose paratopes bind to a specific antigen with correct epitopes.
Understanding antibody structure and its paratope can facilitate a mechanistic
understanding of its function. Therefore, antibody structure prediction from
its sequence alone has always been a highly valuable problem for de novo
antibody design. AlphaFold2, a breakthrough in the field of structural biology,
provides a solution to predict protein structure based on protein sequences and
computationally expensive coevolutionary multiple sequence alignments (MSAs).
However, the computational efficiency and undesirable prediction accuracy of
antibodies, especially on the complementarity-determining regions (CDRs) of
antibodies limit their applications in the industrially high-throughput drug
design. To learn an informative representation of antibodies, we employed a
deep antibody language model (ALM) on curated sequences from the observed
antibody space database via a transformer model. We also developed a novel
model named xTrimoABFold to predict antibody structure from antibody sequence
based on the pretrained ALM as well as efficient evoformers and structural
modules. The model was trained end-to-end on the antibody structures in PDB by
minimizing the ensemble loss of domain-specific focal loss on CDR and the
frame-aligned point loss. xTrimoABFold outperforms AlphaFold2 and other protein
language model based SOTAs, e.g., OmegaFold, HelixFold-Single, and IgFold with
a large significant margin (30+\% improvement on RMSD) while performing 151
times faster than AlphaFold2. To the best of our knowledge, xTrimoABFold
achieved state-of-the-art antibody structure prediction. Its improvement in
both accuracy and efficiency makes it a valuable tool for de novo antibody
design and could make further improvements in immuno-theory.
- Abstract(参考訳): 抗体工学の分野では、パラトープが正しいエピトープを持つ特定の抗原に結合する新しい抗体を設計することが重要な課題である。
抗体構造とそのパラトープを理解することは、その機能の機械的理解を促進する。
したがって、その配列だけでの抗体構造予測は、デノボ抗体の設計において非常に重要な問題である。
AlphaFold2は構造生物学の分野におけるブレークスルーであり、タンパク質配列と計算に高価な共進化的多重配列アライメント(MSA)に基づいてタンパク質構造を予測するソリューションを提供する。
しかしながら、特に抗体の相補性決定領域(cdrs)における抗体の計算効率と望ましくない予測精度は、工業的に高スループットな薬物設計におけるそれらの応用を制限する。
抗体のインフォメーション表現を学ぶために,我々は,観察された抗体空間データベースからトランスフォーマモデルを介してキュレートされた配列に対して,ディープ抗体言語モデル(alm)を用いた。
我々はまた,事前訓練されたALMと効率的なエボフォーマおよび構造モジュールに基づいて,抗体配列から抗体構造を予測する新しいモデルxTrimoABFoldを開発した。
CDRにおけるドメイン特異的焦点損失のアンサンブル損失とフレーム整合点損失を最小化し,PDBの抗体構造をエンドツーエンドに学習した。
xtrimoabfold は alphafold2 や他のタンパク質言語モデルベースの sota、例えば omegafold, helixfold-single, igfold よりも大きなマージン(rmsd では 30+\% 改善)を持ち、alphafold2 よりも 151 倍高速である。
我々の知る限りでは、xTrimoABFoldは最先端の抗体構造予測を達成した。
精度と効率の両面での改善により、デノボ抗体の設計に有用なツールとなり、免疫理論のさらなる改善が期待できる。
関連論文リスト
- S$^2$ALM: Sequence-Structure Pre-trained Large Language Model for Comprehensive Antibody Representation Learning [8.059724314850799]
抗体は、特定の抗原に正確かつ強力な結合を通じて健康を守り、新型コロナウイルスを含む多くの疾患の治療に有望な治療効果を示す。
バイオメディカル言語モデルの最近の進歩は、複雑な生物学的構造や機能を理解する大きな可能性を示している。
本稿では,1つの総合的抗体基盤モデルにおいて,包括的および構造的情報を組み合わせたシーケンス構造型多段階事前訓練抗体言語モデル(S$2$ALM)を提案する。
論文 参考訳(メタデータ) (2024-11-20T14:24:26Z) - Efficient Antibody Structure Refinement Using Energy-Guided SE(3) Flow Matching [16.192361788505558]
FlowABはエネルギー誘導型フローマッチングに基づく新規な抗体構造精製法である。
適切な先行モデルと組み合わせて使用する場合、抗体構造予測タスクにおいて、新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2024-10-22T04:13:55Z) - Retrieval Augmented Diffusion Model for Structure-informed Antibody Design and Optimization [8.546688995090491]
抗体は生物の免疫応答に必須のタンパク質である。
生成モデルにおける最近の進歩は、合理的抗体設計を著しく強化した。
本稿では,効率的な抗体設計のための検索拡張拡散フレームワーク RADAb を提案する。
論文 参考訳(メタデータ) (2024-10-19T08:53:01Z) - Antigen-Specific Antibody Design via Direct Energy-based Preference Optimization [51.28231365213679]
我々は,抗原特異的抗体配列構造共設計を,特定の嗜好に対する最適化問題として取り組んだ。
そこで本研究では,有理構造と抗原への結合親和性の両方を有する抗体の生成を誘導する,直接エネルギーに基づく選好最適化を提案する。
論文 参考訳(メタデータ) (2024-03-25T09:41:49Z) - A Hierarchical Training Paradigm for Antibody Structure-sequence
Co-design [54.30457372514873]
抗体配列構造共設計のための階層的訓練パラダイム(HTP)を提案する。
HTPは4段階の訓練段階から構成され、それぞれが特定のタンパク質のモダリティに対応する。
実証実験により、HTPは共同設計問題において新しい最先端性能を設定できることが示されている。
論文 参考訳(メタデータ) (2023-10-30T02:39:15Z) - Incorporating Pre-training Paradigm for Antibody Sequence-Structure
Co-design [134.65287929316673]
深層学習に基づく計算抗体の設計は、人間の経験を補完する可能性のあるデータから自動的に抗体パターンをマイニングするので、注目を集めている。
計算手法は高品質な抗体構造データに大きく依存しており、非常に限定的である。
幸いなことに、CDRをモデル化し、構造データへの依存を軽減するために有効な抗体の配列データが多数存在する。
論文 参考訳(メタデータ) (2022-10-26T15:31:36Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - AntBO: Towards Real-World Automated Antibody Design with Combinatorial
Bayesian Optimisation [53.43922443725598]
本稿では,CDRH3領域のシリコ設計を効率的に行うための組合せ最適化アルゴリズムAntBOを提案する。
AntBOをベンチマークするために、私たちはAbsolut!ソフトウェアスイートをブラックボックスのオラクルとして使用しています。
200以上のタンパク質の設計において、AntBOは690万の実験的に得られたCDRH3から引き出された最も優れた結合配列より優れた抗体配列を提案することができる。
論文 参考訳(メタデータ) (2022-01-29T12:03:04Z) - Iterative Refinement Graph Neural Network for Antibody
Sequence-Structure Co-design [35.215029426177004]
そこで本研究では,結合特異性や中和機能を増強した抗体を自動設計する生成モデルを提案する。
本手法は,SARS-CoV-2ウイルスを中和可能な抗体の設計において,テストセット上で優れたログライクレーションを実現し,過去のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2021-10-09T18:23:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。