論文の概要: A Noisy-Label-Learning Formulation for Immune Repertoire Classification
and Disease-Associated Immune Receptor Sequence Identification
- arxiv url: http://arxiv.org/abs/2307.15934v1
- Date: Sat, 29 Jul 2023 09:19:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-01 18:33:47.138096
- Title: A Noisy-Label-Learning Formulation for Immune Repertoire Classification
and Disease-Associated Immune Receptor Sequence Identification
- Title(参考訳): 免疫レパートリー分類と疾患関連免疫受容体配列同定のためのノイズラベル学習式
- Authors: Mingcai Chen, Yu Zhao, Zhonghuang Wang, Bing He and Jianhua Yao
- Abstract要約: 免疫レパートリー分類(Immune repertoire classification)は、計算生物学における最前線の研究課題である。
免疫レパートリー分類の課題を解決するために,雑音に富んだラベル学習の定式化を提案する。
サイトメガロウイルス(CMV)および癌データセットを用いた実験は,本手法の有効性と優れた性能を示す。
- 参考スコア(独自算出の注目度): 7.619591696318021
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Immune repertoire classification, a typical multiple instance learning (MIL)
problem, is a frontier research topic in computational biology that makes
transformative contributions to new vaccines and immune therapies. However, the
traditional instance-space MIL, directly assigning bag-level labels to
instances, suffers from the massive amount of noisy labels and extremely low
witness rate. In this work, we propose a noisy-label-learning formulation to
solve the immune repertoire classification task. To remedy the inaccurate
supervision of repertoire-level labels for a sequence-level classifier, we
design a robust training strategy: The initial labels are smoothed to be
asymmetric and are progressively corrected using the model's predictions
throughout the training process. Furthermore, two models with the same
architecture but different parameter initialization are co-trained
simultaneously to remedy the known "confirmation bias" problem in the
self-training-like schema. As a result, we obtain accurate sequence-level
classification and, subsequently, repertoire-level classification. Experiments
on the Cytomegalovirus (CMV) and Cancer datasets demonstrate our method's
effectiveness and superior performance on sequence-level and repertoire-level
tasks.
- Abstract(参考訳): 免疫レパートリー分類(Immune repertoire classification)は、典型的なマルチインスタンス学習(MIL)問題であり、新しいワクチンや免疫療法に転換的な貢献をする計算生物学におけるフロンティア研究のトピックである。
しかし、バッグレベルのラベルを直接インスタンスに割り当てる従来のインスタンススペースMILは、大量のノイズラベルと極めて低い目撃率に悩まされている。
そこで本研究では,免疫レパートリー分類課題を解決するためのノイズラベル学習定式化を提案する。
シーケンスレベルの分類器に対して,レパートリーレベルのラベルを不正確な監視を行うために,ロバストなトレーニング戦略を設計する: 初期ラベルは非対称に滑らか化され,トレーニングプロセスを通じてモデルの予測を用いて徐々に修正される。
さらに、同一アーキテクチャであるがパラメータの初期化が異なる2つのモデルが同時に訓練され、自己学習型スキーマにおける既知の「確認バイアス」問題を修復する。
その結果、正確なシーケンスレベルの分類と、その後にレパートリーレベルの分類が得られる。
ケトメガロウイルス(CMV)および癌データセットを用いた実験は, シークエンスレベルおよびレパートリーレベルの課題に対する方法の有効性と優れた性能を示す。
関連論文リスト
- LayerMatch: Do Pseudo-labels Benefit All Layers? [77.59625180366115]
半教師付き学習はラベル付きデータの依存性を軽減するための有望なソリューションを提供する。
我々はGrad-ReLUとAvg-Clusteringという2つの層固有の擬似ラベル戦略を開発した。
提案手法は,標準的な半教師付き学習ベンチマークにおいて,例外的な性能を示す。
論文 参考訳(メタデータ) (2024-06-20T11:25:50Z) - Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple
Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。
提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-01T03:27:08Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Semi-supervised Predictive Clustering Trees for (Hierarchical) Multi-label Classification [2.706328351174805]
本稿では,予測クラスタリング木の半教師付き学習に基づく階層型マルチラベル分類手法を提案する。
また,この手法をアンサンブル学習に拡張し,ランダムな森林アプローチに基づく手法を提案する。
論文 参考訳(メタデータ) (2022-07-19T12:49:00Z) - Test-time Adaptation with Calibration of Medical Image Classification
Nets for Label Distribution Shift [24.988087560120366]
医用画像分類のためのラベルシフトに最初に取り組む手法を提案する。
本手法は,1つのトレーニングラベル分布から学習したモデルを任意の未知のテストラベル分布に効果的に適用する。
肝線維症ステージングと重症度予測の2つの重要な医用画像分類タスクについて,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2022-07-02T07:55:23Z) - ACPL: Anti-curriculum Pseudo-labelling forSemi-supervised Medical Image
Classification [22.5935068122522]
我々は、反キュリキュラム擬似ラベリング(ACPL)と呼ばれる新しいSSLアルゴリズムを提案する。
ACPLは、情報のないサンプルを選択するための新しいテクニックを導入し、トレーニングバランスを改善し、マルチラベルとマルチクラスの両方でモデルが動作できるようにする。
本手法は, 従来のSOTA SSL方式よりも優れていた。
論文 参考訳(メタデータ) (2021-11-25T05:31:52Z) - Rethinking Pseudo Labels for Semi-Supervised Object Detection [84.697097472401]
物体検出に適した確実な擬似ラベルを導入する。
我々は,クラス不均衡問題を緩和するために,各カテゴリの擬似ラベルと再重み付き損失関数を生成するために使用する閾値を動的に調整する。
提案手法では,COCOのラベル付きデータのみを用いて,教師付きベースラインを最大10%改善する。
論文 参考訳(メタデータ) (2021-06-01T01:32:03Z) - Binary Classification: Counterbalancing Class Imbalance by Applying
Regression Models in Combination with One-Sided Label Shifts [0.4970364068620607]
クラス不均衡の問題に対処する新しい手法を提案する。
我々は、対応する回帰タスクが均衡するように、負と正の目標ラベルのセットを生成する。
我々は,複数の公開データセットに対するアプローチを評価し,提案手法を最もポピュラーなオーバーサンプリング手法と比較した。
論文 参考訳(メタデータ) (2020-11-30T13:24:47Z) - Unsupervised Person Re-identification via Multi-label Classification [55.65870468861157]
本稿では,教師なしのReIDを多ラベル分類タスクとして定式化し,段階的に真のラベルを求める。
提案手法は,まず,各人物画像に単一クラスラベルを割り当てることから始まり,ラベル予測のために更新されたReIDモデルを活用することで,多ラベル分類へと進化する。
マルチラベル分類におけるReIDモデルのトレーニング効率を高めるために,メモリベースマルチラベル分類損失(MMCL)を提案する。
論文 参考訳(メタデータ) (2020-04-20T12:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。