論文の概要: AbRank: A Benchmark Dataset and Metric-Learning Framework for Antibody-Antigen Affinity Ranking
- arxiv url: http://arxiv.org/abs/2506.17857v1
- Date: Sat, 21 Jun 2025 23:34:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.618154
- Title: AbRank: A Benchmark Dataset and Metric-Learning Framework for Antibody-Antigen Affinity Ranking
- Title(参考訳): AbRank: 抗体親和性ランキングのためのベンチマークデータセットとメトリックラーニングフレームワーク
- Authors: Chunan Liu, Aurelien Pelissier, Yanjun Shao, Lilian Denzler, Andrew C. R. Martin, Brooks Paige, Mariia Rodriguez Martinez,
- Abstract要約: AbRankは、アフィニティ予測をペアのランキング問題として再設定する大規模なベンチマークと評価フレームワークである。
グラフベースのアプローチであるWALLE-Affinityを導入し、タンパク質言語モデルの埋め込みを構造情報と統合し、相互結合の嗜好を予測する。
- 参考スコア(独自算出の注目度): 3.6572710422983445
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate prediction of antibody-antigen (Ab-Ag) binding affinity is essential for therapeutic design and vaccine development, yet the performance of current models is limited by noisy experimental labels, heterogeneous assay conditions, and poor generalization across the vast antibody and antigen sequence space. We introduce AbRank, a large-scale benchmark and evaluation framework that reframes affinity prediction as a pairwise ranking problem. AbRank aggregates over 380,000 binding assays from nine heterogeneous sources, spanning diverse antibodies, antigens, and experimental conditions, and introduces standardized data splits that systematically increase distribution shift, from local perturbations such as point mutations to broad generalization across novel antigens and antibodies. To ensure robust supervision, AbRank defines an m-confident ranking framework by filtering out comparisons with marginal affinity differences, focusing training on pairs with at least an m-fold difference in measured binding strength. As a baseline for the benchmark, we introduce WALLE-Affinity, a graph-based approach that integrates protein language model embeddings with structural information to predict pairwise binding preferences. Our benchmarks reveal significant limitations in current methods under realistic generalization settings and demonstrate that ranking-based training improves robustness and transferability. In summary, AbRank offers a robust foundation for machine learning models to generalize across the antibody-antigen space, with direct relevance for scalable, structure-aware antibody therapeutic design.
- Abstract(参考訳): 抗体抗原(Ab-Ag)結合親和性の正確な予測は、治療設計およびワクチン開発に不可欠であるが、現在のモデルの性能は、ノイズのある実験ラベル、異種アッセイ条件、巨大な抗体および抗原配列空間の一般化不良によって制限されている。
本稿では,アフィニティ予測をペアランキング問題として再設定する大規模ベンチマークおよび評価フレームワークであるAbRankを紹介する。
AbRankは、多様な抗体、抗原、実験条件にまたがる9つの異種源からの380,000以上の結合アッセイを集約し、点突然変異のような局所的な摂動から、新しい抗原や抗体の広範な一般化に至るまで、分布シフトを体系的に増加させる標準化されたデータ分割を導入する。
堅牢な監視を確保するため、AbRank氏は、境界親和性差の比較をフィルタリングし、測定された結合強度のm倍の差を持つペアにトレーニングを集中することにより、m信頼ランキングフレームワークを定義した。
このベンチマークのベースラインとしてWALLE-Affinityというグラフベースのアプローチを導入する。
本ベンチマークでは,現実的な一般化設定下での現行手法の大幅な制限を明らかにし,ランキングベーストレーニングが堅牢性と伝達性を向上させることを示す。
要約すると、AbRankは、抗体抗原空間全体にわたって機械学習モデルを一般化するための堅牢な基盤を提供する。
関連論文リスト
- Benchmark for Antibody Binding Affinity Maturation and Design [11.905797701155263]
AbBiBenchは、抗体結合親和性成熟と設計のためのベンチマークフレームワークである。
まず、9つの抗原を含む9つのデータセットをキュレートし、標準化し、共有する。
マスク付き言語モデル、自己回帰言語モデル、逆折り畳みモデル、拡散ベース生成モデル、幾何学グラフモデルを含む14のタンパク質モデルを比較した。
論文 参考訳(メタデータ) (2025-05-23T21:09:04Z) - Sequence-Only Prediction of Binding Affinity Changes: A Robust and Interpretable Model for Antibody Engineering [9.789817970737666]
抗体工学における研究の重要な領域は、抗体-抗原結合親和性を高める効果的な修飾を見つけることである。
ディープラーニングソリューションは、結合親和性の変化を予測するために抗体構造をモデル化する代替手段を提供する。
本稿では,抗体-抗原複合体の配列情報のみに基づいて結合親和性変化を予測する深層学習モデルProtAttBAを提案する。
論文 参考訳(メタデータ) (2025-05-14T15:00:46Z) - Relation-Aware Equivariant Graph Networks for Epitope-Unknown Antibody Design and Specificity Optimization [61.06622479173572]
本稿では,抗原特異的CDRの構造と共同設計配列に対する抗原抗体相互作用をモデル化するRAADフレームワークを提案する。
さらに, 抗体特異度をよりよく測定し, 抗体特異度を最適化するコントラスト特異的エンハンス制約を開発するための新しい評価指標を提案する。
論文 参考訳(メタデータ) (2024-12-14T03:00:44Z) - Evaluating Zero-Shot Scoring for In Vitro Antibody Binding Prediction
with Experimental Validation [0.08968838300743379]
オープンソースモデルに基づく8つの共通スコアリングパラダイムを比較して,抗体設計をバインダーやノンバインダーとして分類する。
その結果,既存手法はバインダーの検出に苦慮しており,抗原間では高い変動が認められた。
論文 参考訳(メタデータ) (2023-12-07T23:34:03Z) - Forecast reconciliation for vaccine supply chain optimization [61.13962963550403]
ワクチンサプライチェーン最適化は階層的な時系列予測の恩恵を受けることができる。
異なる階層レベルの予測は、上位レベルの予測が下位レベルの予測の総和と一致しないときに不整合となる。
我々は2010年から2021年にかけてのGSKの販売データを階層的時系列としてモデル化し,ワクチン販売予測問題に取り組む。
論文 参考訳(メタデータ) (2023-05-02T14:34:34Z) - xTrimoABFold: De novo Antibody Structure Prediction without MSA [77.47606749555686]
我々は、抗体配列から抗体構造を予測するために、xTrimoABFoldという新しいモデルを開発した。
CDRにおけるドメイン特異的焦点損失のアンサンブル損失とフレーム整合点損失を最小化することにより,PDBの抗体構造をエンドツーエンドにトレーニングした。
論文 参考訳(メタデータ) (2022-11-30T09:26:08Z) - Incorporating Pre-training Paradigm for Antibody Sequence-Structure
Co-design [134.65287929316673]
深層学習に基づく計算抗体の設計は、人間の経験を補完する可能性のあるデータから自動的に抗体パターンをマイニングするので、注目を集めている。
計算手法は高品質な抗体構造データに大きく依存しており、非常に限定的である。
幸いなことに、CDRをモデル化し、構造データへの依存を軽減するために有効な抗体の配列データが多数存在する。
論文 参考訳(メタデータ) (2022-10-26T15:31:36Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。