論文の概要: Accuracy versus time frontiers of semi-supervised and self-supervised
learning on medical images
- arxiv url: http://arxiv.org/abs/2307.08919v1
- Date: Tue, 18 Jul 2023 01:31:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 16:50:32.294597
- Title: Accuracy versus time frontiers of semi-supervised and self-supervised
learning on medical images
- Title(参考訳): 医用画像における半教師型・自己教師型学習の精度と時間フロンティア
- Authors: Zhe Huang, Ruijie Jiang, Shuchin Aeron, and Michael C. Hughes
- Abstract要約: 2つの主要な研究方向は、追加のラベルのないデータが分類器のパフォーマンスを向上させることを約束する。
両方向からの最近の手法は、非医療的タスクに顕著な利得を主張している。
この研究は、実践者の重要な疑問に答えるために、慎重に設計されたベンチマークに寄与する。
- 参考スコア(独自算出の注目度): 11.259483040894814
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For many applications of classifiers to medical images, a trustworthy label
for each image can be difficult or expensive to obtain. In contrast, images
without labels are more readily available. Two major research directions both
promise that additional unlabeled data can improve classifier performance:
self-supervised learning pretrains useful representations on unlabeled data
only, then fine-tunes a classifier on these representations via the labeled
set; semi-supervised learning directly trains a classifier on labeled and
unlabeled data simultaneously. Recent methods from both directions have claimed
significant gains on non-medical tasks, but do not systematically assess
medical images and mostly compare only to methods in the same direction. This
study contributes a carefully-designed benchmark to help answer a
practitioner's key question: given a small labeled dataset and a limited budget
of hours to spend on training, what gains from additional unlabeled images are
possible and which methods best achieve them? Unlike previous benchmarks, ours
uses realistic-sized validation sets to select hyperparameters, assesses
runtime-performance tradeoffs, and bridges two research fields. By comparing 6
semi-supervised methods and 5 self-supervised methods to strong labeled-only
baselines on 3 medical datasets with 30-1000 labels per class, we offer
insights to resource-constrained, results-focused practitioners: MixMatch,
SimCLR, and BYOL represent strong choices that were not surpassed by more
recent methods. After much effort selecting hyperparameters on one dataset, we
publish settings that enable strong methods to perform well on new medical
tasks within a few hours, with further search over dozens of hours delivering
modest additional gains.
- Abstract(参考訳): 医用画像への分類器の応用の多くは、画像ごとに信頼できるラベルを得るのが困難またはコストがかかる。
対照的に、ラベルのない画像はより簡単に入手できる。
自己教師学習は、ラベル付きデータのみに有用な表現を事前訓練し、ラベル付きセットを介してこれらの表現に分類器を微調整し、半教師付き学習はラベル付きデータとラベル付きデータに同時に分類器を訓練する。
両方向からの最近の手法は、非医療的作業において顕著な効果を主張しているが、医療画像の体系的評価は行わず、ほとんど同じ方向の方法と比較している。
小さいラベル付きデータセットとトレーニングに要する時間に制限された予算を考えると、追加のラベル付きイメージから得られるものは何か、どれが最適な方法なのか?
従来のベンチマークとは違って,ハイパーパラメータの選択や実行時のパフォーマンストレードオフの評価,2つの研究分野のブリッジに,現実的なサイズの検証セットを使用している。
6つの半教師付きメソッドと5つの自己教師付きメソッドを、30~1000のラベルを持つ3つの医学データセット上で強力なラベル付きベースラインと比較することにより、リソース制約のある結果重視実践者(MixMatch、SimCLR、BYOL)に洞察を提供する。
1つのデータセットでハイパーパラメータを選択することに多くの労力を費やした後、私たちは、強力なメソッドが数時間以内に新しい医療タスクでうまく機能することを可能にする設定を公開します。
関連論文リスト
- Incremental Self-training for Semi-supervised Learning [56.57057576885672]
ISTは単純だが有効であり、既存の自己学習に基づく半教師あり学習手法に適合する。
提案したISTを5つのデータセットと2種類のバックボーンで検証し,認識精度と学習速度を効果的に向上させる。
論文 参考訳(メタデータ) (2024-04-14T05:02:00Z) - One-bit Supervision for Image Classification: Problem, Solution, and
Beyond [114.95815360508395]
本稿では,ラベルの少ない新しい学習環境である,画像分類のための1ビット監督について述べる。
多段階学習パラダイムを提案し、負ラベル抑圧を半教師付き半教師付き学習アルゴリズムに組み込む。
複数のベンチマークにおいて、提案手法の学習効率は、フルビットの半教師付き監視手法よりも優れている。
論文 参考訳(メタデータ) (2023-11-26T07:39:00Z) - Dual-Decoder Consistency via Pseudo-Labels Guided Data Augmentation for
Semi-Supervised Medical Image Segmentation [13.707121013895929]
本稿では, Pseudo-Labels Guided Data Augmentation を用いた新しい半教師付き学習手法である Dual-Decoder Consistency を提案する。
我々は、同じエンコーダを維持しながら、生徒と教師のネットワークに異なるデコーダを使用します。
ラベルのないデータから学習するために、教師ネットワークによって生成された擬似ラベルを作成し、擬似ラベルでトレーニングデータを増強する。
論文 参考訳(メタデータ) (2023-08-31T09:13:34Z) - Semi-Supervised Learning with Multiple Imputations on Non-Random Missing
Labels [0.0]
Semi-Supervised Learning (SSL)は、ラベル付きデータとラベルなしデータの両方でアルゴリズムがトレーニングされるときに実装される。
本稿では,より高精度でバイアスの少ない複数の計算モデルを組み合わせるための2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-15T04:09:53Z) - Enhancing Adversarial Robustness in Low-Label Regime via Adaptively
Weighted Regularization and Knowledge Distillation [1.675857332621569]
ラベル付きデータが少ない半教師付き対人訓練について検討した。
提案する正則化項と知識蒸留を組み合わせた半教師付き対角訓練アルゴリズムを開発した。
提案アルゴリズムは,既存のアルゴリズムと比較して,最先端の性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-08-08T05:48:38Z) - Debiased Pseudo Labeling in Self-Training [77.83549261035277]
ディープニューラルネットワークは、大規模ラベル付きデータセットの助けを借りて、幅広いタスクで顕著なパフォーマンスを達成する。
ラベル付きデータの要求を軽減するため、ラベル付けされていないデータに擬似ラベルを付けることにより、学術と産業の両方で自己学習が広く使われている。
疑似ラベルの生成と利用を2つの独立した頭文字で分離するデバイアスドを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:14:33Z) - Uncertainty-Guided Mutual Consistency Learning for Semi-Supervised
Medical Image Segmentation [9.745971699005857]
医用画像セグメンテーションのための新しい不確実性誘導相互整合学習フレームワークを提案する。
タスクレベルの正規化によるタスク内一貫性学習と、タスク間の整合性学習を統合して、幾何学的な形状情報を活用する。
本手法は,ラベルのないデータを活用し,既存の半教師付きセグメンテーション法より優れた性能を実現する。
論文 参考訳(メタデータ) (2021-12-05T08:19:41Z) - Tune it the Right Way: Unsupervised Validation of Domain Adaptation via
Soft Neighborhood Density [125.64297244986552]
本稿では,点間の類似度分布のエントロピーを計算し,ソフト近傍の密度を測定する教師なし検証基準を提案する。
私たちの基準は、競合する検証方法よりもシンプルですが、より効果的です。
論文 参考訳(メタデータ) (2021-08-24T17:41:45Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z) - Deep Semi-supervised Metric Learning with Dual Alignment for Cervical
Cancer Cell Detection [49.78612417406883]
子宮頸癌細胞検出のための新しい半教師付き深度測定法を提案する。
私たちのモデルは、埋め込みメトリック空間を学習し、提案レベルとプロトタイプレベルの両方でセマンティック機能の二重アライメントを行います。
本研究は,240,860個の頸部細胞画像からなる半監督型頸部がん細胞検出のための大規模データセットを初めて構築した。
論文 参考訳(メタデータ) (2021-04-07T17:11:27Z) - Matching the Clinical Reality: Accurate OCT-Based Diagnosis From Few
Labels [2.891413712995642]
ラベルのないデータはクリニックで多用されることが多く、半教師付き学習に基づく機械学習手法がこの設定に適している。
最近提案されたMixMatchアルゴリズムとFixMatchアルゴリズムは有用な表現を抽出する有望な結果を証明している。
いずれのアルゴリズムも、ラベル付きデータの全ての部分において、転送学習ベースラインを上回ります。
論文 参考訳(メタデータ) (2020-10-23T11:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。