論文の概要: Learning Image Labels On-the-fly for Training Robust Classification
Models
- arxiv url: http://arxiv.org/abs/2009.10325v2
- Date: Fri, 2 Oct 2020 04:35:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 21:31:37.563185
- Title: Learning Image Labels On-the-fly for Training Robust Classification
Models
- Title(参考訳): 学習画像ラベルを用いたロバスト分類モデルの学習
- Authors: Xiaosong Wang, Ziyue Xu, Dong Yang, Leo Tam, Holger Roth, Daguang Xu
- Abstract要約: ノイズの多いアノテーション(例えば、異なるアルゴリズムベースのラベル付け子から)を一緒に利用し、相互に分類タスクの学習に役立てることができるかを示す。
メタトレーニングベースのラベルサンプリングモジュールは、追加のバックプロパゲーションプロセスを通じてモデル学習の恩恵を受けるラベルに出席するように設計されている。
- 参考スコア(独自算出の注目度): 13.669654965671604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current deep learning paradigms largely benefit from the tremendous amount of
annotated data. However, the quality of the annotations often varies among
labelers. Multi-observer studies have been conducted to study these annotation
variances (by labeling the same data for multiple times) and its effects on
critical applications like medical image analysis. This process indeed adds an
extra burden to the already tedious annotation work that usually requires
professional training and expertise in the specific domains. On the other hand,
automated annotation methods based on NLP algorithms have recently shown
promise as a reasonable alternative, relying on the existing diagnostic reports
of those images that are widely available in the clinical system. Compared to
human labelers, different algorithms provide labels with varying qualities that
are even noisier. In this paper, we show how noisy annotations (e.g., from
different algorithm-based labelers) can be utilized together and mutually
benefit the learning of classification tasks. Specifically, the concept of
attention-on-label is introduced to sample better label sets on-the-fly as the
training data. A meta-training based label-sampling module is designed to
attend the labels that benefit the model learning the most through additional
back-propagation processes. We apply the attention-on-label scheme on the
classification task of a synthetic noisy CIFAR-10 dataset to prove the concept,
and then demonstrate superior results (3-5% increase on average in multiple
disease classification AUCs) on the chest x-ray images from a hospital-scale
dataset (MIMIC-CXR) and hand-labeled dataset (OpenI) in comparison to regular
training paradigms.
- Abstract(参考訳): 現在のディープラーニングパラダイムは、大量の注釈付きデータの恩恵を受けています。
しかし、アノテーションの品質はしばしばラベル付け者によって異なる。
これらのアノテーションのばらつき(同じデータを複数回ラベル付けすることで)と、医用画像分析のような重要なアプリケーションに対する影響を研究するために、マルチオブザーバーの研究が行われている。
このプロセスは、特定のドメインで専門的なトレーニングと専門知識を必要とする、すでに退屈なアノテーション作業に余計な負担をもたらします。
一方,NLPアルゴリズムに基づく自動アノテーション手法は,臨床システムで広く利用可能である画像の診断報告を頼りに,将来的な代替手段として期待されている。
人間のラベルと比較すると、異なるアルゴリズムは、よりノイズの多い様々な品質のラベルを提供する。
本稿では,ノイズの多いアノテーション(例えば,異なるアルゴリズムに基づくラベル付け)を併用して,分類タスクの学習に相互に役立てる方法について述べる。
具体的には、アテンション・オン・ラベルの概念を導入して、トレーニングデータとして、より優れたラベルセットをオン・ザ・フライでサンプリングする。
メタトレーニングベースのラベルサンプリングモジュールは、追加のバックプロパゲーションプロセスを通じてモデル学習の恩恵を受けるラベルに対応するように設計されている。
CIFAR-10データセットの分類課題にアテンション・オン・ラベル・スキームを適用し, 病院規模データセット (MIMIC-CXR) とハンドラベルデータセット (OpenI) の胸部X線画像に対して, 通常の訓練パラダイムと比較し, より優れた結果(AUC) を示す。
関連論文リスト
- Leveraging Fixed and Dynamic Pseudo-labels for Semi-supervised Medical Image Segmentation [7.9449756510822915]
半教師付き医用画像セグメンテーションは、注釈のないデータを利用する能力によって、関心が高まりつつある。
現在の最先端の手法は、主にコトレーニングフレームワーク内の擬似ラベルに依存している。
本稿では,同一の未注釈画像に対する複数の擬似ラベルを用いてラベルのないデータから学習する手法を提案する。
論文 参考訳(メタデータ) (2024-05-12T11:30:01Z) - Virtual Category Learning: A Semi-Supervised Learning Method for Dense
Prediction with Extremely Limited Labels [63.16824565919966]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
仮想カテゴリー(VC)は、モデルの最適化に安全に貢献できるように、各混乱したサンプルに割り当てられる。
私たちの興味深い発見は、密集した視覚タスクにおけるVC学習の利用に注目しています。
論文 参考訳(メタデータ) (2023-12-02T16:23:52Z) - Channel-Wise Contrastive Learning for Learning with Noisy Labels [60.46434734808148]
チャネルワイド・コントラッシブ・ラーニング(CWCL)を導入し,真正なラベル情報とノイズを区別する。
従来のインスタンス単位のコントラスト学習(IWCL)とは異なり、CWCLはよりニュアンスでレジリエントな特徴を真のラベルと一致させる傾向にある。
まずCWCLを用いて、クリーンにラベル付けされたサンプルを識別し、次に、これらのサンプルを段階的に微調整する。
論文 参考訳(メタデータ) (2023-08-14T06:04:50Z) - A Deep Model for Partial Multi-Label Image Classification with Curriculum Based Disambiguation [42.0958430465578]
部分多重ラベル(PML)画像分類問題について検討する。
既存のPMLメソッドは通常、ノイズの多いラベルをフィルタリングするための曖昧な戦略を設計する。
本稿では,PMLの表現能力と識別能力を高めるための深層モデルを提案する。
論文 参考訳(メタデータ) (2022-07-06T02:49:02Z) - BoMD: Bag of Multi-label Descriptors for Noisy Chest X-ray
Classification [25.76256302330625]
新しい医用画像分類問題は、放射線医学レポートから抽出された機械生成ノイズラベルに依存する必要があるかもしれない。
マルチクラス問題に対して設計された現在の雑音ラベル学習法は容易には適用できない。
本稿では,データセットからサンプルを検出し,スムーズに再ラベルする,ノイズの多い多ラベルCXR学習のための新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-03T08:04:59Z) - A Survey on Deep Learning with Noisy Labels: How to train your model
when you cannot trust on the annotations? [21.562089974755125]
ノイズラベルの存在下でのディープラーニングモデルのトレーニングを改善するために,いくつかのアプローチが提案されている。
本稿では,ロバストな損失,サンプル重み付け,サンプル選択,メタラーニング,組み合わせアプローチの3つのグループでアルゴリズムを分類する。
論文 参考訳(メタデータ) (2020-12-05T15:45:20Z) - Multi-label Few/Zero-shot Learning with Knowledge Aggregated from
Multiple Label Graphs [8.44680447457879]
本稿では,異なる意味的ラベル関係をコードする複数のラベルグラフから知識を融合する,シンプルな多グラフ集約モデルを提案する。
本研究は,多グラフ知識集約を用いた手法が,少数・ゼロショットラベルのほとんどすべてにおいて,大幅な性能向上を実現していることを示す。
論文 参考訳(メタデータ) (2020-10-15T01:15:43Z) - Attention-Aware Noisy Label Learning for Image Classification [97.26664962498887]
大規模ラベル付きサンプルで学習した深層畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンにおいて顕著な進歩を遂げている。
大量のラベル付きビジュアルデータを取得する最も安価な方法は、Flickrのようなユーザーが提供するラベルでウェブサイトからクロールすることである。
本稿では,潜在的なラベルノイズのあるデータセットに基づいて学習したネットワークの識別能力を向上させるために,注目に敏感なラベル学習手法を提案する。
論文 参考訳(メタデータ) (2020-09-30T15:45:36Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z) - Unsupervised Person Re-identification via Multi-label Classification [55.65870468861157]
本稿では,教師なしのReIDを多ラベル分類タスクとして定式化し,段階的に真のラベルを求める。
提案手法は,まず,各人物画像に単一クラスラベルを割り当てることから始まり,ラベル予測のために更新されたReIDモデルを活用することで,多ラベル分類へと進化する。
マルチラベル分類におけるReIDモデルのトレーニング効率を高めるために,メモリベースマルチラベル分類損失(MMCL)を提案する。
論文 参考訳(メタデータ) (2020-04-20T12:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。