論文の概要: EvoStruct: Bridging Evolutionary and Structural Priors for Antibody CDR Design via Protein Language Model Adaptation
- arxiv url: http://arxiv.org/abs/2605.21485v1
- Date: Wed, 20 May 2026 17:59:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.836884
- Title: EvoStruct: Bridging Evolutionary and Structural Priors for Antibody CDR Design via Protein Language Model Adaptation
- Title(参考訳): EvoStruct:タンパク質言語モデル適応による抗体CDR設計の進化的・構造的優先事項
- Authors: Mansoor Ahmed, Sujin Lee, Umar Khayaz, Murray Patterson,
- Abstract要約: EvoStructは、凍結したタンパク質言語モデルと、E(3)-同変GNNからの3次元構造コンテキストを、クロスアテンションアダプタを介して橋渡しする。
CHIMERA-Benchデータセット上では、EvoStructは、いくつかの抗体設計法の中で、最も高いアミノ酸の回収と最も低いパープレキシティを達成する。
- 参考スコア(独自算出の注目度): 3.8079978718120473
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Equivariant graph neural network (GNN) methods for antibody complementarity-determining region (CDR) design achieve the highest sequence recovery but suffer from severe vocabulary collapse. The current best GNN methods over-predict very few amino acids, such as tyrosine and glycine, while ignoring functionally important residues. We trace this failure to GNN encoders learning amino acid distributions de novo from limited structural data, discarding substitution patterns encoded in evolutionary databases. To resolve this, we propose EvoStruct, which bridges a frozen protein language model (PLM) with 3D structural context from an E(3)-equivariant GNN via a cross-attention adapter. Unlike prior PLM-structure adapters for general protein design, EvoStruct targets the vocabulary collapse problem specific to CDR design through progressive PLM unfreezing and R-Drop consistency regularization. On the CHIMERA-Bench dataset, EvoStruct achieves the highest amino acid recovery and lowest perplexity among several antibody design methods, improving sequence recovery by 16% and reducing perplexity by 43% relative to the best GNN baselines, while recovering 2.3x greater amino acid diversity and the highest binding-pair correlation with ground truth.
- Abstract(参考訳): 抗体相補性決定領域(CDR)設計のための同変グラフニューラルネットワーク(GNN)法は,最も高いシーケンス回復を実現するが,激しい語彙崩壊に悩まされる。
現在の最高のGNN法は、機能的に重要な残基を無視しながら、チロシンやグリシンのような非常に少数のアミノ酸を過剰に予測する。
この失敗は、GNNエンコーダが、限られた構造データからnovoのアミノ酸分布を学習し、進化データベースにエンコードされた置換パターンを捨てることに遡る。
そこで本研究では, 凍結タンパク質言語モデル (PLM) を3次元構造コンテキストにブリッジするEvoStructを提案する。
一般的なタンパク質設計のための従来のPLM構造アダプタとは異なり、EvoStructはプログレッシブPLM凍結とR-Drop整合正則化を通じてCDR設計に特有の語彙崩壊問題をターゲットにしている。
CHIMERA-Benchデータセットにおいて、EvoStructは、いくつかの抗体設計法の中で最も高いアミノ酸の回収と最も低いパープレキシティを達成し、配列の回収を16%改善し、最高のGNNベースラインに対して43%のパープレキシティを減少させ、さらに2.3倍のアミノ酸の多様性と地上の真実との結合対相関を回復する。
関連論文リスト
- Protein Inverse Folding From Structure Feedback [78.27854221882572]
本稿では,タンパク質の折りたたみモデルからのフィードバックを用いて,逆折りたたみモデルを微調整する手法を提案する。
CATH 4.2 テストセットの結果,DPO の微調整により平均 TM-Score が大幅に向上することが示された。
論文 参考訳(メタデータ) (2025-06-03T16:02:12Z) - Non-Canonical Crosslinks Confound Evolutionary Protein Structure Models [0.0]
稀なリボソーム合成ペプチドと翻訳後修飾ペプチドのクラスである sacRitipeptides をベースとしたドメイン外ベンチマークを行った。
翻訳後修飾を行った10種のサチペプチドの架橋ブリッジに適合するコンフォメーション予測モデルについて検討した。
本研究は, 生体分子構造予測の進歩を持続する物理インフォームドモデルの必要性を示唆するものである。
論文 参考訳(メタデータ) (2025-03-09T08:18:11Z) - GPCR-BERT: Interpreting Sequential Design of G Protein Coupled Receptors
Using Protein Language Models [5.812284760539713]
我々はGPCR結合受容体(GPCR)のシーケンシャル設計を理解するためのGPCR-BERTモデルを開発した。
GPCRはFDAが承認した医薬品の3分の1以上を標的としている。
我々は、結合ポケットの残基と保存モチーフのいくつかの関係について光を当てることができた。
論文 参考訳(メタデータ) (2023-10-30T18:28:50Z) - A Hierarchical Training Paradigm for Antibody Structure-sequence
Co-design [54.30457372514873]
抗体配列構造共設計のための階層的訓練パラダイム(HTP)を提案する。
HTPは4段階の訓練段階から構成され、それぞれが特定のタンパク質のモダリティに対応する。
実証実験により、HTPは共同設計問題において新しい最先端性能を設定できることが示されている。
論文 参考訳(メタデータ) (2023-10-30T02:39:15Z) - AbDiffuser: Full-Atom Generation of in vitro Functioning Antibodies [44.149969082612486]
AbDiffuserは、抗体3D構造と配列の同変および物理インフォームド拡散モデルである。
我々のアプローチは、ドメイン知識と物理に基づく制約を生かして、タンパク質の拡散を改善する。
数値実験では、AbDiffuserが参照集合の配列と構造を綿密に追跡する抗体を生成する能力を示している。
論文 参考訳(メタデータ) (2023-07-28T11:57:44Z) - xTrimoABFold: De novo Antibody Structure Prediction without MSA [77.47606749555686]
我々は、抗体配列から抗体構造を予測するために、xTrimoABFoldという新しいモデルを開発した。
CDRにおけるドメイン特異的焦点損失のアンサンブル損失とフレーム整合点損失を最小化することにより,PDBの抗体構造をエンドツーエンドにトレーニングした。
論文 参考訳(メタデータ) (2022-11-30T09:26:08Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。