論文の概要: Sequence-Based Nanobody-Antigen Binding Prediction
- arxiv url: http://arxiv.org/abs/2308.01920v1
- Date: Sat, 15 Jul 2023 02:00:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 02:07:08.226349
- Title: Sequence-Based Nanobody-Antigen Binding Prediction
- Title(参考訳): シーケンスベースナノボディ-抗原結合予測
- Authors: Usama Sardar, Sarwan Ali, Muhammad Sohaib Ayub, Muhammad Shoaib,
Khurram Bashir, Imdad Ullah Khan, Murray Patterson
- Abstract要約: ナノボディーの生産における重要な課題は、ほとんどの抗原に対してナノボディーが利用できないことである。
本研究は,シーケンスデータのみに基づいて,ナノボディ・アンティジェン結合を予測する機械学習手法を開発することを目的とする。
- 参考スコア(独自算出の注目度): 1.7284653203366596
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nanobodies (Nb) are monomeric heavy-chain fragments derived from heavy-chain
only antibodies naturally found in Camelids and Sharks. Their considerably
small size (~3-4 nm; 13 kDa) and favorable biophysical properties make them
attractive targets for recombinant production. Furthermore, their unique
ability to bind selectively to specific antigens, such as toxins, chemicals,
bacteria, and viruses, makes them powerful tools in cell biology, structural
biology, medical diagnostics, and future therapeutic agents in treating cancer
and other serious illnesses. However, a critical challenge in nanobodies
production is the unavailability of nanobodies for a majority of antigens.
Although some computational methods have been proposed to screen potential
nanobodies for given target antigens, their practical application is highly
restricted due to their reliance on 3D structures. Moreover, predicting
nanobodyantigen interactions (binding) is a time-consuming and labor-intensive
task. This study aims to develop a machine-learning method to predict
Nanobody-Antigen binding solely based on the sequence data. We curated a
comprehensive dataset of Nanobody-Antigen binding and nonbinding data and
devised an embedding method based on gapped k-mers to predict binding based
only on sequences of nanobody and antigen. Our approach achieves up to 90%
accuracy in binding prediction and is significantly more efficient compared to
the widely-used computational docking technique.
- Abstract(参考訳): ナノボディ(nb)は、ラクダやサメに自然に存在する重い鎖のみの抗体に由来する単量体重鎖の断片である。
かなり小さいサイズ (~3-4 nm; 13 kda) と良好な生物物理特性により、組み換え生産のための魅力的なターゲットとなっている。
さらに、毒素、化学薬品、バクテリア、ウイルスなどの特定の抗原に選択的に結合する能力は、細胞生物学、構造生物学、医学的診断、がんやその他の重篤な疾患の治療における治療薬の強力なツールとなる。
しかし、ナノボディ生産における重要な課題は、多くの抗原に対してナノボディが利用できないことである。
ターゲット抗原の潜在的なナノボディをスクリーニングするためにいくつかの計算手法が提案されているが、3d構造に依存するため、その実用性は極めて制限されている。
さらに、ナノボディ抗原相互作用(結合)の予測は、時間と労力のかかる作業である。
本研究の目的は、シーケンスデータのみに基づいてナノボディ抗原結合を予測する機械学習手法の開発である。
ナノボディ-抗原結合と非結合データの包括的データセットをキュレートし,gapped k-mersに基づく埋め込み法を考案し,ナノボディと抗原の配列のみに基づいて結合を予測した。
提案手法は結合予測において最大90%の精度を達成し,広く用いられている計算ドッキング手法に比べてはるかに効率的である。
関連論文リスト
- HyenaDNA: Long-Range Genomic Sequence Modeling at Single Nucleotide
Resolution [76.97231739317259]
本稿では,ヒト参照ゲノム上に,最大100万個のトークンを単一ヌクレオチドレベルで有するゲノム基盤モデルであるHyenaDNAについて紹介する。
Nucleotide Transformerの微調整されたベンチマークでは、HyenaDNAが18のデータセットのうち12の最先端(SotA)に到達した。
論文 参考訳(メタデータ) (2023-06-27T20:46:34Z) - AVIDa-hIL6: A Large-Scale VHH Dataset Produced from an Immunized Alpaca
for Predicting Antigen-Antibody Interactions [1.1381826108737396]
重鎖抗体(VHHs)の変異領域における抗原と抗体の相互作用を予測するための大規模データセットを開発した。
AVIDa-hIL6は、アミノ酸配列と573,891の抗原-VHHペアを含む。
機械学習モデルを用いたAVIDa-hIL6のベンチマーク結果について報告する。
論文 参考訳(メタデータ) (2023-06-06T00:42:36Z) - Random Copolymer inverse design system orienting on Accurate discovering
of Antimicrobial peptide-mimetic copolymers [9.416757363901295]
我々は,多モデル共重合表現学習,知識蒸留,強化学習による共通ランダム共重合逆設計システムを開発した。
知識蒸留による足場・デコレータ生成モデルの事前学習により、コポリマー空間は、探索のための既存のデータに近い空間に大きく収縮する。
我々の強化学習アルゴリズムは、特定の足場とプロパティや構造に関する要件に基づいてカスタマイズされた生成に適応することができる。
論文 参考訳(メタデータ) (2022-11-30T14:29:50Z) - xTrimoABFold: De novo Antibody Structure Prediction without MSA [77.47606749555686]
我々は、抗体配列から抗体構造を予測するために、xTrimoABFoldという新しいモデルを開発した。
CDRにおけるドメイン特異的焦点損失のアンサンブル損失とフレーム整合点損失を最小化することにより,PDBの抗体構造をエンドツーエンドにトレーニングした。
論文 参考訳(メタデータ) (2022-11-30T09:26:08Z) - Incorporating Pre-training Paradigm for Antibody Sequence-Structure
Co-design [134.65287929316673]
深層学習に基づく計算抗体の設計は、人間の経験を補完する可能性のあるデータから自動的に抗体パターンをマイニングするので、注目を集めている。
計算手法は高品質な抗体構造データに大きく依存しており、非常に限定的である。
幸いなことに、CDRをモデル化し、構造データへの依存を軽減するために有効な抗体の配列データが多数存在する。
論文 参考訳(メタデータ) (2022-10-26T15:31:36Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - Antibody Representation Learning for Drug Discovery [7.291511531280898]
新規なSARS-CoV-2抗体結合データセットと追加ベンチマークデータセットについて報告する。
従来の統計的シーケンスモデル,各データセットの教師付き学習,および抗体特異的事前訓練言語モデルの微調整の3つのクラスを比較した。
実験結果から,特徴表現の自己教師付き事前学習は,従来の手法よりも大幅に改善されていることが示唆された。
論文 参考訳(メタデータ) (2022-10-05T13:48:41Z) - AntBO: Towards Real-World Automated Antibody Design with Combinatorial
Bayesian Optimisation [53.43922443725598]
本稿では,CDRH3領域のシリコ設計を効率的に行うための組合せ最適化アルゴリズムAntBOを提案する。
AntBOをベンチマークするために、私たちはAbsolut!ソフトウェアスイートをブラックボックスのオラクルとして使用しています。
200以上のタンパク質の設計において、AntBOは690万の実験的に得られたCDRH3から引き出された最も優れた結合配列より優れた抗体配列を提案することができる。
論文 参考訳(メタデータ) (2022-01-29T12:03:04Z) - Accelerating Antimicrobial Discovery with Controllable Deep Generative
Models and Molecular Dynamics [109.70543391923344]
CLaSS(Controlled Latent attribute Space Smpling)は、分子の属性制御のための効率的な計算手法である。
深層学習分類器と原子論シミュレーションから得られた新しい特徴を併用して, 生成分子を付加的なキー属性としてスクリーニングする。
提案手法は, 強い広帯域能を有する非毒性抗菌性ペプチド(AMP)を設計するためのものである。
論文 参考訳(メタデータ) (2020-05-22T15:57:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。