論文の概要: Active Learning Framework for Cost-Effective TCR-Epitope Binding
Affinity Prediction
- arxiv url: http://arxiv.org/abs/2310.10893v2
- Date: Mon, 30 Oct 2023 17:06:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 01:39:01.115343
- Title: Active Learning Framework for Cost-Effective TCR-Epitope Binding
Affinity Prediction
- Title(参考訳): コスト効果のあるTCR-Epitope結合親和性予測のためのアクティブラーニングフレームワーク
- Authors: Pengfei Zhang, Seojin Bang and Heewook Lee
- Abstract要約: ActiveTCRは、アクティブラーニングとTCR-epitopeバインディング親和性予測モデルを組み込んだフレームワークである。
アノテーションのコストを最小化しながら、パフォーマンスの向上を最大化することを目的としている。
本研究は,TCR-epitope結合親和性予測のためのデータ最適化に関する最初の体系的な研究である。
- 参考スコア(独自算出の注目度): 6.3044887592852845
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: T cell receptors (TCRs) are critical components of adaptive immune systems,
responsible for responding to threats by recognizing epitope sequences
presented on host cell surface. Computational prediction of binding affinity
between TCRs and epitope sequences using machine/deep learning has attracted
intense attention recently. However, its success is hindered by the lack of
large collections of annotated TCR-epitope pairs. Annotating their binding
affinity requires expensive and time-consuming wet-lab evaluation. To reduce
annotation cost, we present ActiveTCR, a framework that incorporates active
learning and TCR-epitope binding affinity prediction models. Starting with a
small set of labeled training pairs, ActiveTCR iteratively searches for
unlabeled TCR-epitope pairs that are ''worth'' for annotation. It aims to
maximize performance gains while minimizing the cost of annotation. We compared
four query strategies with a random sampling baseline and demonstrated that
ActiveTCR reduces annotation costs by approximately 40%. Furthermore, we showed
that providing ground truth labels of TCR-epitope pairs to query strategies can
help identify and reduce more than 40% redundancy among already annotated pairs
without compromising model performance, enabling users to train equally
powerful prediction models with less training data. Our work is the first
systematic investigation of data optimization for TCR-epitope binding affinity
prediction.
- Abstract(参考訳): T細胞受容体(TCR)は、宿主細胞表面に提示されるエピトープ配列を認識して脅威に応答する免疫系の重要な構成要素である。
近年,機械/深層学習によるTCRとエピトープの結合親和性の計算的予測が注目されている。
しかし、その成功は注釈付きtcr-epitopeペアの大規模なコレクションの欠如によって妨げられている。
結合親和性を示すには、高価で時間を要するウェットラブの評価が必要である。
アノテーションコストを削減するため,アクティブラーニングとTCR-epitopeバインディング親和性予測モデルを組み込んだActiveTCRを提案する。
ラベル付きトレーニングペアの小さなセットから始めると、ActiveTCRはアノテーションの'worth'であるラベル付きTCR-epitopeペアを反復検索する。
アノテーションのコストを最小化しながら、パフォーマンスの向上を最大化する。
4つのクエリ戦略をランダムサンプリングベースラインと比較し,activetcrがアノテーションコストを約40%削減できることを実証した。
さらに,tcr-epitopeペアの基底的真理ラベルをクエリ戦略に提供することで,モデル性能を損なうことなく,すでに注釈付きペアの40%以上の冗長性を識別し,低減できることを示した。
本研究はtcr-epitope結合親和性予測のためのデータ最適化に関する最初の体系的調査である。
関連論文リスト
- TAPT: Test-Time Adversarial Prompt Tuning for Robust Inference in Vision-Language Models [53.91006249339802]
視覚的対人攻撃に対するCLIPの推論ロバスト性を高めるため, TAPT(Test-Time Adversarial Prompt Tuning)と呼ばれる新しい防御手法を提案する。
TAPTは、CLIPの推論プロセスを堅牢化するために、防御的バイモーダル(テキストと視覚)のプロンプトを学習するテストタイムディフェンス手法である。
我々は、ImageNetなど10のゼロショットデータセットを含む11のベンチマークデータセットに対するTAPTの有効性を評価する。
論文 参考訳(メタデータ) (2024-11-20T08:58:59Z) - Fast Context-Biasing for CTC and Transducer ASR models with CTC-based Word Spotter [57.64003871384959]
この研究は、CTCベースのWord Spotterでコンテキストバイアスを高速化するための新しいアプローチを示す。
提案手法は,CTCログ確率をコンパクトなコンテキストグラフと比較し,潜在的なコンテキストバイアス候補を検出する。
その結果、FスコアとWERの同時改善により、文脈バイアス認識の大幅な高速化が示された。
論文 参考訳(メタデータ) (2024-06-11T09:37:52Z) - Contrastive learning of T cell receptor representations [11.053778245621544]
データ効率のよい転送学習が可能なTCR言語モデルSCEPTRを導入する。
本稿では,自己コントラスト学習とマスク付き言語モデリングを組み合わせた新しい事前学習戦略を提案する。
コントラスト学習は,TCRの特異性のルールを復号化するための有用なパラダイムとして期待できる。
論文 参考訳(メタデータ) (2024-06-10T15:50:45Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Learning Repeatable Speech Embeddings Using An Intra-class Correlation
Regularizer [16.716653844774374]
クラス内相関係数(ICC)を用いて埋め込みの再現性を評価する。
我々は、より高い繰り返し性を持つ埋め込みを生成するために、ディープニューラルネットワークを誘導する対照的な損失を補うために、新しい正則化器であるICC正則化器を提案する。
我々は、ICC正規化器を実装し、話者検証、音声スタイル変換、およびディフォニック音声検出のための臨床応用の3つの音声タスクに適用する。
論文 参考訳(メタデータ) (2023-10-25T23:21:46Z) - An Experimental Study on Private Aggregation of Teacher Ensemble
Learning for End-to-End Speech Recognition [51.232523987916636]
差分プライバシー(DP)は、プライバシーデータにノイズのある歪みを課すことで、深層モデルのトレーニングに使用されるユーザー情報を保護するための1つのデータ保護手段である。
本研究では、PATE学習を動的パターン、すなわち音声を扱うように拡張し、音響データの漏洩を避けるために、ASRに関する最初の実験を行う。
論文 参考訳(メタデータ) (2022-10-11T16:55:54Z) - Adversarial Attacks and Defense for Non-Parametric Two-Sample Tests [73.32304304788838]
本稿では,非パラメトリックTSTの障害モードを逆攻撃により系統的に明らかにする。
TST非依存的な攻撃を可能にするために,異なる種類のテスト基準を協調的に最小化するアンサンブル攻撃フレームワークを提案する。
そこで本研究では,TSTの強化のために,逆対を反復的に生成し,深層カーネルを訓練する最大最小最適化を提案する。
論文 参考訳(メタデータ) (2022-02-07T11:18:04Z) - TITAN: T Cell Receptor Specificity Prediction with Bimodal Attention
Networks [0.5371337604556311]
TCRシーケンスとepITopeの両方をエンコードするバイモーダルニューラルネットワークを提案し、見えないシーケンスと転送/またはに対する能力の独立した研究を可能にする。
tcr距離ニューラルネットワークは、未認識のtcrにおいて競合性能を示す。
tcr距離ニューラルネットワークは、未認識のtcrでも競合性能を示す。
論文 参考訳(メタデータ) (2021-04-21T09:25:14Z) - SISE-PC: Semi-supervised Image Subsampling for Explainable Pathology [0.7226144684379189]
我々は,最も不確定なoct画像サンプルを含む最小のサブサンプリングデータセットを識別する,新しいアクティブラーニングフレームワークを提案する。
提案手法は予測コストを最小化するために他の医用画像にも拡張できる。
論文 参考訳(メタデータ) (2021-02-23T09:00:15Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。