論文の概要: tcrLM: a lightweight protein language model for predicting T cell receptor and epitope binding specificity
- arxiv url: http://arxiv.org/abs/2406.16995v2
- Date: Wed, 04 Dec 2024 14:33:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-05 15:04:36.074625
- Title: tcrLM: a lightweight protein language model for predicting T cell receptor and epitope binding specificity
- Title(参考訳): tcrLM : T細胞受容体とエピトープ結合特異性を予測する軽量タンパク質言語モデル
- Authors: Xing Fang, Chenpeng Yu, Shiye Tian, Hui Liu,
- Abstract要約: 抗がん免疫反応はT細胞受容体(TCR)と抗原の結合に依存しており、腫瘍細胞を除去するために適応免疫を誘導する。
本研究では,この課題に対処するために,tcrLMと呼ばれる軽量なマスキング言語モデルを提案する。
我々は,1億以上の異なる配列を持つ最大のTCR CDR3 配列を構築し,これらの配列上で tcrLM を事前訓練する。
その結果、tcrLMは既存のTCR-抗原結合予測法を上回るだけでなく、他の主要なタンパク質言語モデルよりも優れていることが示された。
- 参考スコア(独自算出の注目度): 4.120928123714289
- License:
- Abstract: The anti-cancer immune response relies on the bindings between T-cell receptors (TCRs) and antigens, which elicits adaptive immunity to eliminate tumor cells. This ability of the immune system to respond to novel various neoantigens arises from the immense diversity of TCR repository. However, TCR diversity poses a significant challenge on accurately predicting antigen-TCR bindings. In this study, we introduce a lightweight masked language model, termed tcrLM, to address this challenge. Our approach involves randomly masking segments of TCR sequences and training tcrLM to infer the masked segments, thereby enabling the extraction of expressive features from TCR sequences. To further enhance robustness, we incorporate virtual adversarial training into tcrLM. We construct the largest TCR CDR3 sequence set with more than 100 million distinct sequences, and pretrain tcrLM on these sequences. The pre-trained encoder is subsequently applied to predict TCR-antigen binding specificity. We evaluate model performance on three test datasets: independent, external, and COVID-19 test set. The results demonstrate that tcrLM not only surpasses existing TCR-antigen binding prediction methods, but also outperforms other mainstream protein language models. More interestingly, tcrLM effectively captures the biochemical properties and positional preference of amino acids within TCR sequences. Additionally, the predicted TCR-neoantigen binding scores indicates the immunotherapy responses and clinical outcomes in a melanoma cohort. These findings demonstrate the potential of tcrLM in predicting TCR-antigen binding specificity, with significant implications for advancing immunotherapy and personalized medicine.
- Abstract(参考訳): 抗がん免疫反応はT細胞受容体(TCR)と抗原の結合に依存しており、腫瘍細胞を除去するために適応免疫を誘導する。
免疫系が様々な新抗原に反応する能力は、TCRリポジトリの膨大な多様性から生じる。
しかし、TCRの多様性は抗原-TCR結合を正確に予測する上で大きな課題となる。
本研究では,この課題に対処するために,tcrLMと呼ばれる軽量なマスキング言語モデルを提案する。
提案手法では,TCRシーケンスのセグメントをランダムにマスキングし,tcrLMをトレーニングすることにより,TCRシーケンスから表現的特徴を抽出する。
さらに強靭性を高めるため,仮想対人訓練をtcrLMに組み込んだ。
我々は,1億以上の異なる配列を持つ最大のTCR CDR3 配列を構築し,これらの配列上で tcrLM を事前訓練する。
その後、事前訓練されたエンコーダを用いてTCR-抗原結合特異性を予測する。
独立性、外部性、およびCOVID-19テストセットの3つのテストデータセット上でのモデルパフォーマンスを評価した。
その結果、tcrLMは既存のTCR-抗原結合予測法を上回るだけでなく、他の主要なタンパク質言語モデルよりも優れていることが示された。
さらに興味深いことに、tcrLMはTCR配列内のアミノ酸の生化学的性質と位置選好を効果的に捉えている。
さらに、予測されたTCR-ネオ抗原結合スコアはメラノーマコホートにおける免疫療法反応と臨床効果を示す。
以上の結果から,TCR-抗原結合特異性予測におけるtcrLMの有用性が示唆され,免疫療法やパーソナライズドメディカルの進歩に重要な意味を持つと考えられた。
関連論文リスト
- TopoTxR: A topology-guided deep convolutional network for breast parenchyma learning on DCE-MRIs [49.69047720285225]
そこで本研究では,乳房側葉構造をよりよく近似するために,マルチスケールのトポロジ構造を明示的に抽出する新しいトポロジカルアプローチを提案する。
VICTREファントム乳房データセットを用いてemphTopoTxRを実験的に検証した。
本研究の質的および定量的分析は,乳房組織における画像診断におけるトポロジカルな挙動を示唆するものである。
論文 参考訳(メタデータ) (2024-11-05T19:35:10Z) - Estimating the Causal Effects of T Cell Receptors [20.01390828400336]
患者に対するT細胞受容体配列の因果的影響を推測する手法を提案する。
我々のアプローチは、患者の環境や生活史など、保存されていない共同設立者に対して正当である。
デモでは、TCRが新型コロナウイルスの重症度に与える影響を分析するために使用します。
論文 参考訳(メタデータ) (2024-10-18T02:45:14Z) - TCR-GPT: Integrating Autoregressive Model and Reinforcement Learning for T-Cell Receptor Repertoires Generation [6.920411338236452]
T細胞受容体(TCR)は、感染またはがん細胞によって提示される特定の抗原を認識し、結合することによって免疫系において重要な役割を担っている。
自動回帰変換器のような言語モデルは、TCRレパートリーの確率分布を学習することで強力な解を提供する。
本稿では,デコーダのみのトランスアーキテクチャ上に構築された確率モデルTCR-GPTを紹介する。
論文 参考訳(メタデータ) (2024-08-02T10:16:28Z) - AIRIVA: A Deep Generative Model of Adaptive Immune Repertoires [6.918664738267051]
本稿では,TCRレパートリーの低次元,解釈可能,構成的表現を学習し,レパートリーの系統的効果を阻害する適応型免疫レパートリー不変変分オートエンコーダ(AIRIVA)を提案する。
論文 参考訳(メタデータ) (2023-04-26T14:40:35Z) - T Cell Receptor Protein Sequences and Sparse Coding: A Novel Approach to
Cancer Classification [4.824821328103934]
T細胞受容体(TCR)は、適応免疫系に必須のタンパク質である。
近年のシークエンシング技術の進歩により、TCRレパートリーの包括的なプロファイリングが可能になった。
これにより、強力な抗がん活性を持つTCRの発見とTCRベースの免疫療法の開発につながった。
論文 参考訳(メタデータ) (2023-04-25T20:43:41Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - Attention-aware contrastive learning for predicting T cell
receptor-antigen binding specificity [7.365824008999903]
細胞表面のMHCクラスI分子によって提示される新規抗原のごく一部のみがT細胞を誘導できることが確認されている。
そこで本研究では,TCR-抗原結合特異性を推定するためのattentive-mask contrastive learning model,ATMTCRを提案する。
論文 参考訳(メタデータ) (2022-05-17T10:53:32Z) - SurvLatent ODE : A Neural ODE based time-to-event model with competing
risks for longitudinal data improves cancer-associated Deep Vein Thrombosis
(DVT) prediction [68.8204255655161]
本稿では,不規則なサンプルデータの下で潜在表現をパラメータ化する生成時間対イベントモデルSurvLatent ODEを提案する。
そこで,本モデルでは,事象特異的ハザード関数の形状を指定せずに,複数の競合イベントの生存時間を柔軟に推定する。
SurvLatent ODEは、DVTリスクグループを成層化するために、現在の臨床標準であるKhorana Riskスコアより優れている。
論文 参考訳(メタデータ) (2022-04-20T17:28:08Z) - MIA-Prognosis: A Deep Learning Framework to Predict Therapy Response [58.0291320452122]
本稿では,患者の予後と治療反応を予測するための統合型深層学習手法を提案する。
我々は,マルチモーダル非同期時系列分類タスクとして,確率モデリングを定式化する。
我々の予測モデルは、長期生存の観点から、低リスク、高リスクの患者をさらに階層化する可能性がある。
論文 参考訳(メタデータ) (2020-10-08T15:30:17Z) - Confidence-guided Lesion Mask-based Simultaneous Synthesis of Anatomic
and Molecular MR Images in Patients with Post-treatment Malignant Gliomas [65.64363834322333]
信頼性ガイドSAMR(CG-SAMR)は、病変情報からマルチモーダル解剖学的配列にデータを合成する。
モジュールは中間結果に対する信頼度測定に基づいて合成をガイドする。
実際の臨床データを用いた実験により,提案モデルが最先端の合成法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-08-06T20:20:22Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。