論文の概要: AVIDa-hIL6: A Large-Scale VHH Dataset Produced from an Immunized Alpaca
for Predicting Antigen-Antibody Interactions
- arxiv url: http://arxiv.org/abs/2306.03329v2
- Date: Wed, 11 Oct 2023 00:42:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-16 03:43:42.206142
- Title: AVIDa-hIL6: A Large-Scale VHH Dataset Produced from an Immunized Alpaca
for Predicting Antigen-Antibody Interactions
- Title(参考訳): AVIDa-hIL6:抗原と抗体の相互作用を予測する免疫性アルパカ由来の大規模VHHデータセット
- Authors: Hirofumi Tsuruta, Hiroyuki Yamazaki, Ryota Maeda, Ryotaro Tamura,
Jennifer N. Wei, Zelda Mariet, Poomarin Phloyphisut, Hidetoshi Shimokawa,
Joseph R. Ledsam, Lucy Colwell, Akihiro Imura
- Abstract要約: 重鎖抗体(VHHs)の変異領域における抗原と抗体の相互作用を予測するための大規模データセットを開発した。
AVIDa-hIL6は、アミノ酸配列と573,891の抗原-VHHペアを含む。
機械学習モデルを用いたAVIDa-hIL6のベンチマーク結果について報告する。
- 参考スコア(独自算出の注目度): 1.1381826108737396
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Antibodies have become an important class of therapeutic agents to treat
human diseases. To accelerate therapeutic antibody discovery, computational
methods, especially machine learning, have attracted considerable interest for
predicting specific interactions between antibody candidates and target
antigens such as viruses and bacteria. However, the publicly available datasets
in existing works have notable limitations, such as small sizes and the lack of
non-binding samples and exact amino acid sequences. To overcome these
limitations, we have developed AVIDa-hIL6, a large-scale dataset for predicting
antigen-antibody interactions in the variable domain of heavy chain of heavy
chain antibodies (VHHs), produced from an alpaca immunized with the human
interleukin-6 (IL-6) protein, as antigens. By leveraging the simple structure
of VHHs, which facilitates identification of full-length amino acid sequences
by DNA sequencing technology, AVIDa-hIL6 contains 573,891 antigen-VHH pairs
with amino acid sequences. All the antigen-VHH pairs have reliable labels for
binding or non-binding, as generated by a novel labeling method. Furthermore,
via introduction of artificial mutations, AVIDa-hIL6 contains 30 different
mutants in addition to wild-type IL-6 protein. This characteristic provides
opportunities to develop machine learning models for predicting changes in
antibody binding by antigen mutations. We report experimental benchmark results
on AVIDa-hIL6 by using machine learning models. The results indicate that the
existing models have potential, but further research is needed to generalize
them to predict effective antibodies against unknown mutants. The dataset is
available at https://avida-hil6.cognanous.com.
- Abstract(参考訳): 抗体はヒト疾患の治療薬として重要な分類となっている。
治療的抗体発見を促進するために、特に機械学習の計算手法は、抗体候補とウイルスやバクテリアなどの標的抗原との特定の相互作用を予測することにかなりの関心を集めている。
しかし、既存の研究で公開されているデータセットには、小さなサイズや非結合性サンプルの欠如、正確なアミノ酸配列など、顕著な制限がある。
これらの制限を克服するため,ヒトインターロイキン6 (IL-6) タンパク質を免疫したアルパカ由来の重鎖型重鎖抗体 (VHHs) の変異ドメインにおける抗原と抗体の相互作用を予測する大規模なデータセットであるAVIDa-hIL6を開発した。
DNAシークエンシング技術による全長アミノ酸配列の同定を容易にするVHHsの単純な構造を活用することにより、AVIDa-hIL6はアミノ酸配列と573,891の抗原-VHHペアを含む。
すべての抗原-vhh対は、新規な標識法によって生成されるように、結合または非結合の信頼できるラベルを有する。
さらに、人工突然変異の導入により、AVIDa-hIL6は野生型IL-6タンパク質に加えて30の異なる変異体を含む。
この特徴は、抗原変異による抗体結合の変化を予測する機械学習モデルを開発する機会を提供する。
機械学習モデルを用いたAVIDa-hIL6のベンチマーク結果について報告する。
その結果、既存のモデルには潜在性があることが示唆されるが、未知の変異体に対する効果的な抗体を予測するためには、さらなる研究が必要である。
データセットはhttps://avida-hil6.cognanous.comで入手できる。
関連論文リスト
- A SARS-CoV-2 Interaction Dataset and VHH Sequence Corpus for Antibody Language Models [0.0]
AVIDa-SARS-CoV-2は重鎖抗体(VHH)相互作用の抗原可変ドメインを特徴とするデータセットである。
抗体言語モデルの事前学習データセットであるVHHCorpus-2Mには200万以上のVHH配列が含まれている。
VHHCorpus-2Mおよび既存の一般タンパク質および抗体特異的言語モデルを用いたVHHBERTを用いたSARS-CoV-2-VHH結合予測のためのベンチマーク結果を報告する。
論文 参考訳(メタデータ) (2024-05-29T04:22:18Z) - Large scale paired antibody language models [40.401345152825314]
IgBert と IgT5 は,これまでに開発された抗体特異的言語モデルの中で最も優れた性能を示した。
これらのモデルは、20億以上のObserved Spaceデータセットを使用して、包括的にトレーニングされている。
この進歩は、治療開発のための抗体設計を強化するために、機械学習、大規模データセット、高性能コンピューティングを活用する上で大きな前進となる。
論文 参考訳(メタデータ) (2024-03-26T17:21:54Z) - Sequence-Based Nanobody-Antigen Binding Prediction [1.7284653203366596]
ナノボディーの生産における重要な課題は、ほとんどの抗原に対してナノボディーが利用できないことである。
本研究は,シーケンスデータのみに基づいて,ナノボディ・アンティジェン結合を予測する機械学習手法を開発することを目的とする。
論文 参考訳(メタデータ) (2023-07-15T02:00:19Z) - xTrimoABFold: De novo Antibody Structure Prediction without MSA [77.47606749555686]
我々は、抗体配列から抗体構造を予測するために、xTrimoABFoldという新しいモデルを開発した。
CDRにおけるドメイン特異的焦点損失のアンサンブル損失とフレーム整合点損失を最小化することにより,PDBの抗体構造をエンドツーエンドにトレーニングした。
論文 参考訳(メタデータ) (2022-11-30T09:26:08Z) - Incorporating Pre-training Paradigm for Antibody Sequence-Structure
Co-design [134.65287929316673]
深層学習に基づく計算抗体の設計は、人間の経験を補完する可能性のあるデータから自動的に抗体パターンをマイニングするので、注目を集めている。
計算手法は高品質な抗体構造データに大きく依存しており、非常に限定的である。
幸いなことに、CDRをモデル化し、構造データへの依存を軽減するために有効な抗体の配列データが多数存在する。
論文 参考訳(メタデータ) (2022-10-26T15:31:36Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - AntBO: Towards Real-World Automated Antibody Design with Combinatorial
Bayesian Optimisation [53.43922443725598]
本稿では,CDRH3領域のシリコ設計を効率的に行うための組合せ最適化アルゴリズムAntBOを提案する。
AntBOをベンチマークするために、私たちはAbsolut!ソフトウェアスイートをブラックボックスのオラクルとして使用しています。
200以上のタンパク質の設計において、AntBOは690万の実験的に得られたCDRH3から引き出された最も優れた結合配列より優れた抗体配列を提案することができる。
論文 参考訳(メタデータ) (2022-01-29T12:03:04Z) - Accelerating Antimicrobial Discovery with Controllable Deep Generative
Models and Molecular Dynamics [109.70543391923344]
CLaSS(Controlled Latent attribute Space Smpling)は、分子の属性制御のための効率的な計算手法である。
深層学習分類器と原子論シミュレーションから得られた新しい特徴を併用して, 生成分子を付加的なキー属性としてスクリーニングする。
提案手法は, 強い広帯域能を有する非毒性抗菌性ペプチド(AMP)を設計するためのものである。
論文 参考訳(メタデータ) (2020-05-22T15:57:58Z) - CogMol: Target-Specific and Selective Drug Design for COVID-19 Using
Deep Generative Models [74.58583689523999]
新規なウイルスタンパク質を標的とした新規な薬物様小分子を設計するためのエンド・ツー・エンドのフレームワークであるCogMolを提案する。
CogMolは、分子SMILES変分オートエンコーダ(VAE)の適応事前学習と、効率的なマルチ属性制御サンプリングスキームを組み合わせる。
CogMolは、高目標特異性と選択性を有する合成可能で低毒性な薬物様分子の多制約設計を扱う。
論文 参考訳(メタデータ) (2020-04-02T18:17:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。