論文の概要: Tokenizing Loops of Antibodies
- arxiv url: http://arxiv.org/abs/2509.08707v1
- Date: Wed, 10 Sep 2025 15:56:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 15:16:52.482908
- Title: Tokenizing Loops of Antibodies
- Title(参考訳): 抗体のTokenizing Loops
- Authors: Ada Fang, Robert G. Alberstein, Simon Kelow, Frédéric A. Dreyer,
- Abstract要約: 免疫グロブリンLOOp Tokenizer, Igloo, マルチモーダル抗体ループトークン化剤について紹介する。
イグルー写像は、類似のバックボーン二面角を持つループを、潜在空間において互いに近接する。
イグルーは、構造抗体データベースから最も近いマッチングループ構造を効率的に取り出すことができる。
- 参考スコア(独自算出の注目度): 0.384859485328058
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The complementarity-determining regions of antibodies are loop structures that are key to their interactions with antigens, and of high importance to the design of novel biologics. Since the 1980s, categorizing the diversity of CDR structures into canonical clusters has enabled the identification of key structural motifs of antibodies. However, existing approaches have limited coverage and cannot be readily incorporated into protein foundation models. Here we introduce ImmunoGlobulin LOOp Tokenizer, Igloo, a multimodal antibody loop tokenizer that encodes backbone dihedral angles and sequence. Igloo is trained using a contrastive learning objective to map loops with similar backbone dihedral angles closer together in latent space. Igloo can efficiently retrieve the closest matching loop structures from a structural antibody database, outperforming existing methods on identifying similar H3 loops by 5.9\%. Igloo assigns tokens to all loops, addressing the limited coverage issue of canonical clusters, while retaining the ability to recover canonical loop conformations. To demonstrate the versatility of Igloo tokens, we show that they can be incorporated into protein language models with IglooLM and IglooALM. On predicting binding affinity of heavy chain variants, IglooLM outperforms the base protein language model on 8 out of 10 antibody-antigen targets. Additionally, it is on par with existing state-of-the-art sequence-based and multimodal protein language models, performing comparably to models with $7\times$ more parameters. IglooALM samples antibody loops which are diverse in sequence and more consistent in structure than state-of-the-art antibody inverse folding models. Igloo demonstrates the benefit of introducing multimodal tokens for antibody loops for encoding the diverse landscape of antibody loops, improving protein foundation models, and for antibody CDR design.
- Abstract(参考訳): 抗体の相補性決定領域は、抗原との相互作用の鍵となるループ構造であり、新しい生物学の設計において非常に重要である。
1980年代以降、CDR構造の多様性を標準クラスターに分類することで、抗体の重要な構造モチーフの同定が可能となった。
しかし、既存のアプローチはカバー範囲が限られており、タンパク質基盤モデルに容易に組み込むことはできない。
本稿では,背骨二面体角度と配列をコードする多モード抗体ループトークンであるIglooのImmuGlobulin LOOp Tokenizerを紹介する。
イグルーは、相対的な学習目標を用いて、類似の背骨二面体角度を潜在空間に近づけたループをマッピングする訓練を行っている。
イグルーは、構造的抗体データベースから最も近いマッチングループ構造を効率よく回収することができ、類似したH3ループを5.9倍に同定する既存の方法よりも優れている。
Iglooはすべてのループにトークンを割り当て、標準ループのコンフォーメーションを回復する能力を維持しながら、標準クラスタの限られたカバレッジ問題に対処する。
Iglooトークンの汎用性を示すために,IglooLMおよびIglooALMを用いてタンパク質言語モデルに組み込むことができることを示す。
重鎖変異体の結合親和性を予測する上で、IglooLMは10の抗体抗原標的のうち8つの塩基性タンパク質言語モデルより優れている。
さらに、既存の最先端のシーケンスベースおよびマルチモーダルなタンパク質言語モデルと同等であり、より多くのパラメータを持つモデルと互換性がある。
IglooALMサンプルは、最先端の抗体逆フォールディングモデルよりも、配列が多様で構造に一貫性がある抗体ループである。
イグルーは、抗体ループの多様な景観をコードし、タンパク質基盤モデルを改善し、抗体CDR設計のための多モードトークンを導入する利点を実証している。
関連論文リスト
- AbODE: Ab Initio Antibody Design using Conjoined ODEs [8.523238510909955]
我々は、文脈情報と外部インタラクションの両方に対応するためにグラフPDEを拡張した新しい生成モデルAbODEを開発した。
我々は,AbODEと時間ネットワーク,およびグラフマッチングネットワークの基本的な関係を明らかにする。
論文 参考訳(メタデータ) (2023-05-31T14:40:47Z) - Generative Antibody Design for Complementary Chain Pairing Sequences
through Encoder-Decoder Language Model [0.0]
ペア化パートナーから補体重鎖や軽鎖を生成するエンコーダデコーダモデルであるペア化T5(pAbT5)を提案する。
本研究は,pAbT5の誘導抗体設計における可能性を示し,鎖の組合わせによる生物学的制約を取り入れた。
論文 参考訳(メタデータ) (2023-01-06T23:34:52Z) - xTrimoABFold: De novo Antibody Structure Prediction without MSA [77.47606749555686]
我々は、抗体配列から抗体構造を予測するために、xTrimoABFoldという新しいモデルを開発した。
CDRにおけるドメイン特異的焦点損失のアンサンブル損失とフレーム整合点損失を最小化することにより,PDBの抗体構造をエンドツーエンドにトレーニングした。
論文 参考訳(メタデータ) (2022-11-30T09:26:08Z) - Incorporating Pre-training Paradigm for Antibody Sequence-Structure
Co-design [134.65287929316673]
深層学習に基づく計算抗体の設計は、人間の経験を補完する可能性のあるデータから自動的に抗体パターンをマイニングするので、注目を集めている。
計算手法は高品質な抗体構造データに大きく依存しており、非常に限定的である。
幸いなことに、CDRをモデル化し、構造データへの依存を軽減するために有効な抗体の配列データが多数存在する。
論文 参考訳(メタデータ) (2022-10-26T15:31:36Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - AntBO: Towards Real-World Automated Antibody Design with Combinatorial
Bayesian Optimisation [53.43922443725598]
本稿では,CDRH3領域のシリコ設計を効率的に行うための組合せ最適化アルゴリズムAntBOを提案する。
AntBOをベンチマークするために、私たちはAbsolut!ソフトウェアスイートをブラックボックスのオラクルとして使用しています。
200以上のタンパク質の設計において、AntBOは690万の実験的に得られたCDRH3から引き出された最も優れた結合配列より優れた抗体配列を提案することができる。
論文 参考訳(メタデータ) (2022-01-29T12:03:04Z) - Iterative Refinement Graph Neural Network for Antibody
Sequence-Structure Co-design [35.215029426177004]
そこで本研究では,結合特異性や中和機能を増強した抗体を自動設計する生成モデルを提案する。
本手法は,SARS-CoV-2ウイルスを中和可能な抗体の設計において,テストセット上で優れたログライクレーションを実現し,過去のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2021-10-09T18:23:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。