論文の概要: AsEP: Benchmarking Deep Learning Methods for Antibody-specific Epitope Prediction
- arxiv url: http://arxiv.org/abs/2407.18184v2
- Date: Thu, 07 Nov 2024 22:33:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 18:11:01.818812
- Title: AsEP: Benchmarking Deep Learning Methods for Antibody-specific Epitope Prediction
- Title(参考訳): AsEP: 抗体特異的エピトープ予測のためのディープラーニング手法のベンチマーク
- Authors: Chunan Liu, Lilian Denzler, Yihong Chen, Andrew Martin, Brooks Paige,
- Abstract要約: 抗体-抗原複合体構造データセット AsEP を導入する。
AsEPはその種類の中で最大であり、クラスタ化されたグループを提供する。
本稿では,タンパク質言語モデルとグラフニューラルネットワークによる構造モデリングの両方を活用する新しい手法WALLEを提案する。
- 参考スコア(独自算出の注目度): 12.433560411515575
- License:
- Abstract: Epitope identification is vital for antibody design yet challenging due to the inherent variability in antibodies. While many deep learning methods have been developed for general protein binding site prediction tasks, whether they work for epitope prediction remains an understudied research question. The challenge is also heightened by the lack of a consistent evaluation pipeline with sufficient dataset size and epitope diversity. We introduce a filtered antibody-antigen complex structure dataset, AsEP (Antibody-specific Epitope Prediction). AsEP is the largest of its kind and provides clustered epitope groups, allowing the community to develop and test novel epitope prediction methods and evaluate their generalisability. AsEP comes with an easy-to-use interface in Python and pre-built graph representations of each antibody-antigen complex while also supporting customizable embedding methods. Using this new dataset, we benchmark several representative general protein-binding site prediction methods and find that their performances fall short of expectations for epitope prediction. To address this, we propose a novel method, WALLE, which leverages both unstructured modeling from protein language models and structural modeling from graph neural networks. WALLE demonstrate up to 3-10X performance improvement over the baseline methods. Our empirical findings suggest that epitope prediction benefits from combining sequential features provided by language models with geometrical information from graph representations. This provides a guideline for future epitope prediction method design. In addition, we reformulate the task as bipartite link prediction, allowing convenient model performance attribution and interpretability. We open source our data and code at https://github.com/biochunan/AsEP-dataset.
- Abstract(参考訳): エピトープの同定は抗体の設計に不可欠であるが、抗体の固有の多様性のために困難である。
一般的なタンパク質結合部位予測タスクのために多くの深層学習法が開発されているが、エピトープ予測のために働くかどうかはまだ未検討の課題である。
この課題は、十分なデータセットサイズとエピトープの多様性を備えた、一貫した評価パイプラインの欠如によっても高まっている。
抗体-抗原複合体構造データセット AsEP (Antibody-specific Epitope Prediction) を導入する。
AsEPはその種類の中で最大であり、クラスタ化されたエピトープグループを提供し、コミュニティは新しいエピトープ予測手法を開発し、テストし、それらの一般化性を評価することができる。
AsEPはPythonで使いやすく、各抗体抗原複合体のグラフ表現を事前に構築し、カスタマイズ可能な埋め込みメソッドもサポートする。
新たなデータセットを用いて,いくつかの一般的なタンパク質結合部位予測手法をベンチマークし,その性能がエピトープ予測の期待に届かないことを見出した。
そこで本研究では,タンパク質言語モデルからの非構造モデリングとグラフニューラルネットワークからの構造モデリングの両方を活用する新しい手法WALLEを提案する。
WALLEでは,ベースラインメソッドよりも最大3~10倍のパフォーマンス向上を実現している。
実験結果から,エピトープ予測は言語モデルが提供する逐次的特徴とグラフ表現からの幾何的情報を組み合わせることにより得られることが示唆された。
これは将来のエピトープ予測手法設計のガイドラインを提供する。
さらに,タスクをバイパーティイトリンク予測として再構成し,モデル性能の属性と解釈可能性を向上させる。
データとコードはhttps://github.com/biochunan/AsEP-dataset.comで公開しています。
関連論文リスト
- PLA-SGCN: Protein-Ligand Binding Affinity Prediction by Integrating Similar Pairs and Semi-supervised Graph Convolutional Network [6.024776891570197]
半教師付きグラフ畳み込みネットワーク(GCN)を用いたPLA予測(タスク予測ステップ)において検索したハードタンパク質-リガンドペアを統合することを目的とする。
その結果,提案手法は同等の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-05-13T03:27:02Z) - BeeTLe: A Framework for Linear B-Cell Epitope Prediction and
Classification [0.43512163406551996]
本稿では, 線形B細胞予測と抗体型特異的分類のための, 深層学習に基づく新しいフレームワークを提案する。
そこで本研究では, モデルが抗体の表現を学習するのを助けるために, 固有分解に基づくアミノ酸符号化法を提案する。
最大の公開データベースからキュレートしたデータに対する実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-09-05T09:18:29Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - Reprogramming Pretrained Language Models for Protein Sequence
Representation Learning [68.75392232599654]
エンドツーエンドの表現学習フレームワークである辞書学習(R2DL)による表現学習を提案する。
R2DLは、タンパク質配列の埋め込みを学ぶために、事前訓練された英語モデルを再プログラムする。
我々のモデルは,事前訓練および標準教師付き手法によって設定されたベースラインに対して,最大105ドルの精度でデータ効率を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-01-05T15:55:18Z) - Pre-training Co-evolutionary Protein Representation via A Pairwise
Masked Language Model [93.9943278892735]
タンパク質配列表現学習の鍵となる問題は、配列中の残基間の共変量によって反映される共進化情報をキャプチャすることである。
Pairwise Masked Language Model (PMLM) と呼ばれる専用言語モデルによる事前学習により,この情報を直接キャプチャする新しい手法を提案する。
提案手法は, 相互関係を効果的に把握し, ベースラインと比較して, 接触予測性能を最大9%向上できることを示す。
論文 参考訳(メタデータ) (2021-10-29T04:01:32Z) - Predicting the Binding of SARS-CoV-2 Peptides to the Major
Histocompatibility Complex with Recurrent Neural Networks [0.40040974874482094]
我々は、繰り返しニューラルネットワークに基づく概念的にシンプルな予測アルゴリズムであるUSMPepを適応し、拡張する。
最近リリースされたSARS-CoV-2データセットの性能をバインディング安定性測定で評価します。
論文 参考訳(メタデータ) (2021-04-16T17:16:35Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - Bayesian neural network with pretrained protein embedding enhances
prediction accuracy of drug-protein interaction [3.499870393443268]
ディープラーニングのアプローチは、人間による試行錯誤なしに薬物とタンパク質の相互作用を予測できる。
本稿では,小さなラベル付きデータセットで優れた性能を示すディープラーニングフレームワークを構築するための2つの手法を提案する。
論文 参考訳(メタデータ) (2020-12-15T10:24:34Z) - Interpretable Structured Learning with Sparse Gated Sequence Encoder for
Protein-Protein Interaction Prediction [2.9488233765621295]
アミノ酸配列から情報表現を学習することでタンパク質-タンパク質相互作用(PPI)を予測することは、生物学において難しいが重要な問題である。
我々は、シーケンスのみからPPIをモデル化し、予測するための新しいディープフレームワークを提案する。
本モデルでは,シーケンスからコンテキスト化およびシーケンシャル情報を活用することによってシーケンス表現を学習するための双方向ゲート再帰ユニットを組み込んだ。
論文 参考訳(メタデータ) (2020-10-16T17:13:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。