論文の概要: ImmSET: Sequence-Based Predictor of TCR-pMHC Specificity at Scale
- arxiv url: http://arxiv.org/abs/2603.26994v1
- Date: Fri, 27 Mar 2026 21:08:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.724491
- Title: ImmSET: Sequence-Based Predictor of TCR-pMHC Specificity at Scale
- Title(参考訳): ImmSET:TCR-pMHCの大規模特異性のシーケンスに基づく予測
- Authors: Marco Garcia Noceda, Matthew T Noakes, Andrew FigPope, Daniel E Mattox, Bryan Howie, Harlan Robins,
- Abstract要約: 可変長生物配列の集合間の相互作用をモデル化するための新しいシーケンスベースアーキテクチャImmSETを提案する。
ImmSETは厳格な評価の下で頑健であることを示す。
この研究は、マルチシーケンス相互作用問題のためのスケーラブルなモデリングパラダイムとしてImmSETを確立する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: T cells are a critical component of the adaptive immune system, playing a role in infectious disease, autoimmunity, and cancer. T cell function is mediated by the T cell receptor (TCR) protein, a highly diverse receptor targeting specific peptides presented by the major histocompatibility complex (pMHCs). Predicting the specificity of TCRs for their cognate pMHCs is central to understanding adaptive immunity and enabling personalized therapies. However, accurate prediction of this protein-protein interaction remains challenging due to the extreme diversity of both TCRs and pMHCs. Here, we present ImmSET (Immune Synapse Encoding Transformer), a novel sequence-based architecture designed to model interactions among sets of variable-length biological sequences. We train this model across a range of dataset sizes and compositions and study the resulting models' generalization to pMHC targets. We describe a failure mode in prior sequence-based approaches that inflates previously reported performance on this task and show that ImmSET remains robust under stricter evaluation. In systematically testing the scaling behavior of ImmSET with training data, we show that performance scales consistently with data volume across multiple data types and compares favorably with the pre-trained protein language model ESM2 fine-tuned on the same datasets. Finally, we demonstrate that ImmSET can outperform AlphaFold2 and AlphaFold3-based pipelines on TCR-pMHC specificity prediction when provided sufficient training data. This work establishes ImmSET as a scalable modeling paradigm for multi-sequence interaction problems, demonstrated in the TCR-pMHC setting but generalizable to other biological domains where high-throughput sequence-driven reasoning complements structure prediction and experimental mapping.
- Abstract(参考訳): T細胞は適応免疫系において重要な要素であり、感染症、自己免疫、がんにおいて重要な役割を果たしている。
T細胞機能は、主要な組織適合性複合体(pMHCs)によって提示される特定のペプチドを標的とする非常に多様な受容体であるT細胞受容体(TCR)タンパク質によって媒介される。
共生pMHCに対するTCRの特異性を予測することは、適応免疫を理解し、パーソナライズされた治療を可能にすることの中心である。
しかし、このタンパク質-タンパク質相互作用の正確な予測は、TCRとpMHCの双方の極端な多様性のため、依然として困難である。
本稿では,ImmSET(Immune Synapse Encoding Transformer)について述べる。
我々は、このモデルをデータセットのサイズと構成の範囲で訓練し、結果のモデルをpMHCターゲットに一般化することを研究する。
ImmSETは従来より厳密な評価の下で頑健であることを示す。
トレーニングデータを用いてImmSETのスケーリング動作を体系的にテストすると、複数のデータタイプにわたるデータボリュームと連続的にスケールし、同じデータセット上で微調整された事前学習されたタンパク質言語モデルESM2と好適に比較できることを示す。
最後に、ImmSETは、十分なトレーニングデータを提供すると、TCR-pMHC特異性予測においてAlphaFold2およびAlphaFold3ベースのパイプラインより優れていることを示す。
この研究は、TCR-pMHC設定で実証されたマルチシーケンス相互作用問題のスケーラブルなモデリングパラダイムとしてImmSETを確立するが、高スループットシーケンス駆動推論が構造予測と実験マッピングを補完する他の生物学的領域に一般化可能である。
関連論文リスト
- InstructPLM-mu: 1-Hour Fine-Tuning of ESM2 Beats ESM3 in Protein Mutation Predictions [54.19843038028329]
InstructPLM-muと呼ばれる微調整フレームワークを提案する。
構造入力を持つ細調整ESM2はESM3に匹敵する性能が得られることを示す。
論文 参考訳(メタデータ) (2025-10-03T07:42:22Z) - impuTMAE: Multi-modal Transformer with Masked Pre-training for Missing Modalities Imputation in Cancer Survival Prediction [75.43342771863837]
我々は,効率的なマルチモーダル事前学習戦略を備えた新しいトランスフォーマーに基づくエンドツーエンドアプローチである impuTMAE を紹介する。
マスクされたパッチを再構築することで、モダリティの欠如を同時に示唆しながら、モダリティ間の相互作用とモダリティ内相互作用を学習する。
本モデルは,TGA-GBM/LGGとBraTSデータセットを用いたグリオーマ生存予測のために,異種不完全データに基づいて事前訓練を行った。
論文 参考訳(メタデータ) (2025-08-08T10:01:16Z) - PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [88.98041407783502]
PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。
PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文 参考訳(メタデータ) (2025-07-07T15:21:05Z) - Enhancing TCR-Peptide Interaction Prediction with Pretrained Language Models and Molecular Representations [0.39945675027960637]
本稿では,大規模タンパク質言語モデルとペプチドの化学表現を組み合わせたディープラーニングフレームワークLANTERNを提案する。
我々のモデルは、特にゼロショットと少数ショットの学習シナリオにおいて、優れたパフォーマンスを示す。
これらの結果は, LANTERNがTCR-pMHC結合予測を前進させ, パーソナライズされた免疫療法の開発を支援する可能性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-04-22T20:22:34Z) - SCMPPI: Supervised Contrastive Multimodal Framework for Predicting Protein-Protein Interactions [0.0]
本稿では,タンパク質-タンパク質相互作用予測のための新しい教師付きコントラスト型マルチモーダルフレームワークSCMPPIを提案する。
8つのベンチマークデータセットの実験では、最先端の精度(98.13%)とAUC(99.69%)と優れたクロス種一般化が示されている。
CD9ネットワーク、Wnt経路解析、がん特異的ネットワークで成功した応用は、さらに疾患標的発見の可能性を強調している。
論文 参考訳(メタデータ) (2025-04-03T15:34:02Z) - SeqProFT: Applying LoRA Finetuning for Sequence-only Protein Property Predictions [8.112057136324431]
本研究では,ESM-2モデルのエンド・ツー・エンドの微調整を行うためにLoRA法を用いる。
下流ネットワークにマルチヘッドアテンション機構を統合して、シーケンス特徴とコンタクトマップ情報を組み合わせる。
論文 参考訳(メタデータ) (2024-11-18T12:40:39Z) - MeToken: Uniform Micro-environment Token Boosts Post-Translational Modification Prediction [65.33218256339151]
翻訳後修飾(PTM)はプロテオームの複雑さと機能を大幅に拡張する。
既存の計算手法は主に、配列依存的なモチーフの認識によって引き起こされる、PTM部位を予測するタンパク質配列に焦点を当てている。
本稿では,各酸のマイクロ環境をトークン化し,シーケンス情報と構造情報を統一された離散トークンに統合するMeTokenモデルを提案する。
論文 参考訳(メタデータ) (2024-11-04T07:14:28Z) - MATE-Pred: Multimodal Attention-based TCR-Epitope interaction Predictor [1.933856957193398]
T細胞受容体と細胞間の正確な結合予測は、免疫療法の成功戦略に決定的に寄与する。
本稿では,T細胞受容体と親和性結合機構の注意に基づく予測を行う,信頼性の高い新しい手法であるMATE-Predを提案する。
MATE-Predのパフォーマンスは、薬物発見における潜在的な応用を予想している。
論文 参考訳(メタデータ) (2023-12-05T11:30:00Z) - Attention-aware contrastive learning for predicting T cell
receptor-antigen binding specificity [7.365824008999903]
細胞表面のMHCクラスI分子によって提示される新規抗原のごく一部のみがT細胞を誘導できることが確認されている。
そこで本研究では,TCR-抗原結合特異性を推定するためのattentive-mask contrastive learning model,ATMTCRを提案する。
論文 参考訳(メタデータ) (2022-05-17T10:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。