論文の概要: Improving Medical Annotation Quality to Decrease Labeling Burden Using
Stratified Noisy Cross-Validation
- arxiv url: http://arxiv.org/abs/2009.10858v1
- Date: Tue, 22 Sep 2020 23:32:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 22:16:42.190106
- Title: Improving Medical Annotation Quality to Decrease Labeling Burden Using
Stratified Noisy Cross-Validation
- Title(参考訳): 階層化雑音クロスバリデーションによるラベル付けバーデンの診断精度の向上
- Authors: Joy Hsu, Sonia Phene, Akinori Mitani, Jieying Luo, Naama Hammel,
Jonathan Krause, Rory Sayres
- Abstract要約: 医用画像の診断における多様性は十分に確立されており、トレーニングにおける多様性と医療ラベルの課題への注意がこの問題を悪化させる可能性がある。
Noisy Cross-Validationはトレーニングデータを半分に分割し、コンピュータビジョンタスクの低品質ラベルを特定する。
本稿では, SNCV (Stratified Noisy Cross-Validation) について紹介する。
- 参考スコア(独自算出の注目度): 3.690031561736533
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As machine learning has become increasingly applied to medical imaging data,
noise in training labels has emerged as an important challenge. Variability in
diagnosis of medical images is well established; in addition, variability in
training and attention to task among medical labelers may exacerbate this
issue. Methods for identifying and mitigating the impact of low quality labels
have been studied, but are not well characterized in medical imaging tasks. For
instance, Noisy Cross-Validation splits the training data into halves, and has
been shown to identify low-quality labels in computer vision tasks; but it has
not been applied to medical imaging tasks specifically. In this work we
introduce Stratified Noisy Cross-Validation (SNCV), an extension of noisy cross
validation. SNCV can provide estimates of confidence in model predictions by
assigning a quality score to each example; stratify labels to handle class
imbalance; and identify likely low-quality labels to analyze the causes. We
assess performance of SNCV on diagnosis of glaucoma suspect risk from retinal
fundus photographs, a clinically important yet nuanced labeling task. Using
training data from a previously-published deep learning model, we compute a
continuous quality score (QS) for each training example. We relabel 1,277
low-QS examples using a trained glaucoma specialist; the new labels agree with
the SNCV prediction over the initial label >85% of the time, indicating that
low-QS examples mostly reflect labeler errors. We then quantify the impact of
training with only high-QS labels, showing that strong model performance may be
obtained with many fewer examples. By applying the method to randomly
sub-sampled training dataset, we show that our method can reduce labelling
burden by approximately 50% while achieving model performance non-inferior to
using the full dataset on multiple held-out test sets.
- Abstract(参考訳): 医療画像データに機械学習がますます応用されるにつれて、トレーニングラベルのノイズが重要な課題となっている。
医用画像の診断における多様性は十分に確立されており、また、トレーニングにおける多様性と医療ラベルの課題への注意が、この問題を悪化させる可能性がある。
低品質ラベルの影響を同定し緩和する手法が研究されているが、医用画像検査の課題には適していない。
例えば、Noisy Cross-Validationはトレーニングデータを半分に分割し、コンピュータビジョンタスクの低品質ラベルを特定することが示されているが、特に医療画像タスクには適用されていない。
本研究では,雑音クロス検証の拡張である階層化雑音クロスバリデーション(sncv)を導入する。
SNCVは、各例に品質スコアを割り当て、クラス不均衡を処理するためにラベルを階層化し、原因を分析するために低品質なラベルを特定することによって、モデル予測の信頼性を見積もることができる。
網膜眼底撮影による緑内障疑いの診断におけるsncvの有用性について検討した。
これまでに公表されたディープラーニングモデルのトレーニングデータを用いて,トレーニング例毎に連続品質スコア(QS)を算出する。
トレーニングした緑内障専門医を用いた低QS例は1,277例であり,新ラベルは初期ラベルの85%以上のSNCV予測と一致しており,低QS例はラベルの誤りをほとんど反映している。
次に,高QSラベルのみによるトレーニングの効果を定量化し,より少ない例で強力なモデル性能が得られることを示す。
本手法をランダムにサブサンプル化したトレーニングデータセットに適用することにより,モデル性能の非推論を実現しつつ,ラベル付け負荷を約50%削減できることを示す。
関連論文リスト
- Self-Supervised Learning as a Means To Reduce the Need for Labeled Data
in Medical Image Analysis [64.4093648042484]
胸部X線画像のデータセットとバウンディングボックスラベルを用いて,13種類の異常の分類を行った。
ラベル付きデータの平均精度と精度を60%に抑えることで,完全教師付きモデルと同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:20:30Z) - Robust Medical Image Classification from Noisy Labeled Data with Global
and Local Representation Guided Co-training [73.60883490436956]
本稿では,ロバストな医用画像分類のためのグローバルおよびローカルな表現学習を用いた新しい協調学習パラダイムを提案する。
ノイズラベルフィルタを用いた自己アンサンブルモデルを用いて、クリーンでノイズの多いサンプルを効率的に選択する。
また,ネットワークを暗黙的に正規化してノイズの多いサンプルを利用するための,グローバルかつ局所的な表現学習手法を設計する。
論文 参考訳(メタデータ) (2022-05-10T07:50:08Z) - Incorporating Semi-Supervised and Positive-Unlabeled Learning for
Boosting Full Reference Image Quality Assessment [73.61888777504377]
フル参照(FR)画像品質評価(IQA)は、その知覚的差異をプリズム品質基準で測定することにより、歪み画像の視覚的品質を評価する。
ラベルなしデータは、画像劣化または復元プロセスから容易に収集することができ、ラベルなしのトレーニングデータを利用してFR-IQA性能を高めることを奨励する。
本稿では, 半教師付き, 正の未ラベル学習(PU)を用いて, ラベルなしデータを活用し, オフレーヤの悪影響を軽減することを提案する。
論文 参考訳(メタデータ) (2022-04-19T09:10:06Z) - Improving Medical Image Classification with Label Noise Using
Dual-uncertainty Estimation [72.0276067144762]
医用画像における2種類のラベルノイズについて論じ,定義する。
医用画像分類作業中にこれら2つのラベルノイズを処理する不確実性推定に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-28T14:56:45Z) - Learning Image Labels On-the-fly for Training Robust Classification
Models [13.669654965671604]
ノイズの多いアノテーション(例えば、異なるアルゴリズムベースのラベル付け子から)を一緒に利用し、相互に分類タスクの学習に役立てることができるかを示す。
メタトレーニングベースのラベルサンプリングモジュールは、追加のバックプロパゲーションプロセスを通じてモデル学習の恩恵を受けるラベルに出席するように設計されている。
論文 参考訳(メタデータ) (2020-09-22T05:38:44Z) - Multi-label Thoracic Disease Image Classification with Cross-Attention
Networks [65.37531731899837]
胸部X線画像から胸部疾患を自動分類するためのCAN(Cross-Attention Networks)を提案する。
また,クロスエントロピー損失を超える新たな損失関数を設計し,クラス間の不均衡を克服する。
論文 参考訳(メタデータ) (2020-07-21T14:37:00Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。