論文の概要: Curriculum Fine-tuning of Vision Foundation Model for Medical Image Classification Under Label Noise
- arxiv url: http://arxiv.org/abs/2412.00150v1
- Date: Fri, 29 Nov 2024 05:18:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:42:54.857231
- Title: Curriculum Fine-tuning of Vision Foundation Model for Medical Image Classification Under Label Noise
- Title(参考訳): ラベルノイズ下における医用画像分類のための視覚基礎モデルのカリキュラム微調整
- Authors: Yeonguk Yu, Minhwan Ko, Sungho Shin, Kangmin Kim, Kyoobin Lee,
- Abstract要約: ノイズラベルは医療データセットにおいて重要な問題であり、モデルパフォーマンスを著しく低下させる可能性がある。
従来のクリーンサンプル選択法では,視覚基礎モデルの事前学習した特徴は利用されていない。
ラベルノイズ下での医用画像分類のためのVFMのカリキュラム微調整パラダイムであるCUFITを提案する。
- 参考スコア(独自算出の注目度): 7.221345843492201
- License:
- Abstract: Deep neural networks have demonstrated remarkable performance in various vision tasks, but their success heavily depends on the quality of the training data. Noisy labels are a critical issue in medical datasets and can significantly degrade model performance. Previous clean sample selection methods have not utilized the well pre-trained features of vision foundation models (VFMs) and assumed that training begins from scratch. In this paper, we propose CUFIT, a curriculum fine-tuning paradigm of VFMs for medical image classification under label noise. Our method is motivated by the fact that linear probing of VFMs is relatively unaffected by noisy samples, as it does not update the feature extractor of the VFM, thus robustly classifying the training samples. Subsequently, curriculum fine-tuning of two adapters is conducted, starting with clean sample selection from the linear probing phase. Our experimental results demonstrate that CUFIT outperforms previous methods across various medical image benchmarks. Specifically, our method surpasses previous baselines by 5.0%, 2.1%, 4.6%, and 5.8% at a 40% noise rate on the HAM10000, APTOS-2019, BloodMnist, and OrgancMnist datasets, respectively. Furthermore, we provide extensive analyses to demonstrate the impact of our method on noisy label detection. For instance, our method shows higher label precision and recall compared to previous approaches. Our work highlights the potential of leveraging VFMs in medical image classification under challenging conditions of noisy labels.
- Abstract(参考訳): 深層ニューラルネットワークは様々な視覚タスクにおいて顕著なパフォーマンスを示してきたが、その成功はトレーニングデータの品質に大きく依存している。
ノイズラベルは医療データセットにおいて重要な問題であり、モデルパフォーマンスを著しく低下させる可能性がある。
従来のクリーンサンプル選択法では、視覚基礎モデル(VFM)の十分に訓練された特徴を利用せず、訓練はゼロから始まると仮定した。
本稿では,ラベルノイズ下での医用画像分類のためのVFMのカリキュラム微調整パラダイムであるCUFITを提案する。
本手法は, VFMの特徴抽出器を更新せず, トレーニングサンプルを頑健に分類するので, VFMの線形プローブはノイズの少ないサンプルによって比較的影響を受けない。
その後、2つのアダプタのカリキュラム微調整を行い、線形探索フェーズからのクリーンなサンプル選択から始める。
実験の結果,CUFITは様々な医用画像のベンチマークで過去の手法よりも優れていた。
具体的には,HAM10000,APTOS-2019,BloodMnist,OrgancMnistの4割のノイズレートで,従来のベースラインを5.0%,2.1%,4.6%,5.8%超えた。
さらに,本手法がノイズラベル検出に与える影響について広範な解析を行った。
例えば,本手法では,従来の手法に比べてラベルの精度とリコールが向上している。
我々の研究は、ノイズラベルの困難な条件下での医用画像分類におけるVFMの利用の可能性を強調した。
関連論文リスト
- Opinion-Unaware Blind Image Quality Assessment using Multi-Scale Deep Feature Statistics [54.08757792080732]
我々は,事前学習された視覚モデルからの深い特徴を統計的解析モデルと統合して,意見認識のないBIQA(OU-BIQA)を実現することを提案する。
提案モデルは,最先端のBIQAモデルと比較して,人間の視覚的知覚との整合性に優れる。
論文 参考訳(メタデータ) (2024-05-29T06:09:34Z) - Investigating the Robustness of Vision Transformers against Label Noise
in Medical Image Classification [8.578500152567164]
医用画像分類データセットにおけるラベルノイズは、教師付き深層学習法の訓練を邪魔する。
プレトレーニングは、教師あり訓練におけるラベルノイズに対するViTの堅牢性向上に不可欠であることを示す。
論文 参考訳(メタデータ) (2024-02-26T16:53:23Z) - Uncertainty-aware Sampling for Long-tailed Semi-supervised Learning [89.98353600316285]
擬似ラベルサンプリングのモデル化プロセスに不確実性を導入し、各クラスにおけるモデル性能が異なる訓練段階によって異なることを考慮した。
このアプローチにより、モデルは異なる訓練段階における擬似ラベルの不確かさを認識でき、それによって異なるクラスの選択閾値を適応的に調整できる。
FixMatchのような他の手法と比較して、UDTSは自然シーン画像データセットの精度を少なくとも5.26%、1.75%、9.96%、1.28%向上させる。
論文 参考訳(メタデータ) (2024-01-09T08:59:39Z) - Sample selection with noise rate estimation in noise learning of medical image analysis [3.9934250802854376]
本稿では,ノイズの多いデータセットでトレーニングされた場合のニューラルネットワークの性能を向上させる新しいサンプル選択手法を提案する。
本手法では,線形回帰を用いて損失値の分布を解析することにより,データセットの雑音率を推定する。
モデルのノイズ堅牢性をさらに高めるために,スパース正規化を採用している。
論文 参考訳(メタデータ) (2023-12-23T11:57:21Z) - Plug-and-Play Feature Generation for Few-Shot Medical Image
Classification [23.969183389866686]
限られた訓練データを用いた医用画像分類におけるモデル一般化と実用性の向上に大きな可能性を秘めている。
MedMFGは,限られたサンプルから十分なクラス識別機能を生成するために設計された,フレキシブルで軽量なプラグアンドプレイ方式である。
論文 参考訳(メタデータ) (2023-10-14T02:36:14Z) - Robust Medical Image Classification from Noisy Labeled Data with Global
and Local Representation Guided Co-training [73.60883490436956]
本稿では,ロバストな医用画像分類のためのグローバルおよびローカルな表現学習を用いた新しい協調学習パラダイムを提案する。
ノイズラベルフィルタを用いた自己アンサンブルモデルを用いて、クリーンでノイズの多いサンプルを効率的に選択する。
また,ネットワークを暗黙的に正規化してノイズの多いサンプルを利用するための,グローバルかつ局所的な表現学習手法を設計する。
論文 参考訳(メタデータ) (2022-05-10T07:50:08Z) - How Transferable Are Self-supervised Features in Medical Image
Classification Tasks? [0.7734726150561086]
トランスファーラーニングは、医学分類タスクにおけるラベル付きデータの欠如を軽減するための標準的プラクティスとなっている。
自己教師付き事前訓練モデルでは、教師付きモデルよりもリッチな埋め込みが得られる。
Dynamic Visual Meta-Embedding (DVME)は、複数のモデルから事前学習された埋め込みを融合するエンドツーエンドのトランスファー学習アプローチである。
論文 参考訳(メタデータ) (2021-08-23T10:39:31Z) - Improving Medical Image Classification with Label Noise Using
Dual-uncertainty Estimation [72.0276067144762]
医用画像における2種類のラベルノイズについて論じ,定義する。
医用画像分類作業中にこれら2つのラベルノイズを処理する不確実性推定に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-28T14:56:45Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。