論文の概要: Information Gain Sampling for Active Learning in Medical Image
Classification
- arxiv url: http://arxiv.org/abs/2208.00974v1
- Date: Mon, 1 Aug 2022 16:25:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 14:11:27.872325
- Title: Information Gain Sampling for Active Learning in Medical Image
Classification
- Title(参考訳): 医学画像分類におけるアクティブラーニングのための情報ゲインサンプリング
- Authors: Raghav Mehta, Changjian Shui, Brennan Nichyporuk, Tal Arbel
- Abstract要約: 本研究は,ラベル付け対象プールからの最適な画像選択を誘導する情報理論のアクティブラーニングフレームワークを提案する。
2つの異なる医用画像分類データセットで実験を行う。
- 参考スコア(独自算出の注目度): 3.1619162190378787
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large, annotated datasets are not widely available in medical image analysis
due to the prohibitive time, costs, and challenges associated with labelling
large datasets. Unlabelled datasets are easier to obtain, and in many contexts,
it would be feasible for an expert to provide labels for a small subset of
images. This work presents an information-theoretic active learning framework
that guides the optimal selection of images from the unlabelled pool to be
labeled based on maximizing the expected information gain (EIG) on an
evaluation dataset. Experiments are performed on two different medical image
classification datasets: multi-class diabetic retinopathy disease scale
classification and multi-class skin lesion classification. Results indicate
that by adapting EIG to account for class-imbalances, our proposed Adapted
Expected Information Gain (AEIG) outperforms several popular baselines
including the diversity based CoreSet and uncertainty based maximum entropy
sampling. Specifically, AEIG achieves ~95% of overall performance with only 19%
of the training data, while other active learning approaches require around
25%. We show that, by careful design choices, our model can be integrated into
existing deep learning classifiers.
- Abstract(参考訳): 大規模な注釈付きデータセットは、大規模なデータセットのラベル付けに伴う制限時間、コスト、課題のため、医用画像解析では広く利用できない。
ラベルなしのデータセットは入手が容易であり、多くの文脈では、専門家が画像の小さなサブセットにラベルを提供することが可能である。
本研究は,評価データセット上での期待情報ゲイン(EIG)の最大化に基づいて,ラベル付け対象プールからの最適な画像選択を誘導する情報理論アクティブラーニングフレームワークを提案する。
多型糖尿病網膜症疾患の分類と多型皮膚病変の分類の2つの異なる医用画像分類データセットで実験を行った。
その結果,適応予測情報ゲイン(AEIG)は,多様性に基づくCoreSetや不確実性に基づく最大エントロピーサンプリングなど,いくつかの一般的なベースラインを上回っていることがわかった。
具体的には、aeigはトレーニングデータのわずか19%で全体のパフォーマンスの95%を達成し、他のアクティブラーニングアプローチでは約25%を必要とする。
注意深い設計選択により、我々のモデルは既存のディープラーニング分類器に統合できることが示される。
関連論文リスト
- Additional Look into GAN-based Augmentation for Deep Learning COVID-19
Image Classification [57.1795052451257]
我々は,GANに基づく拡張性能のデータセットサイズ依存性について,小サンプルに着目して検討した。
両方のセットでStyleGAN2-ADAをトレーニングし、生成した画像の品質を検証した後、マルチクラス分類問題における拡張アプローチの1つとしてトレーニングされたGANを使用する。
GANベースの拡張アプローチは、中規模および大規模データセットでは古典的な拡張に匹敵するが、より小さなデータセットでは不十分である。
論文 参考訳(メタデータ) (2024-01-26T08:28:13Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - A Knowledge Distillation framework for Multi-Organ Segmentation of
Medaka Fish in Tomographic Image [5.881800919492064]
メダカ魚のトモグラフィー画像における多臓器セグメンテーションのための自己学習フレームワークを提案する。
本研究では,事前訓練されたモデルから得られた擬似ラベルデータを利用して,擬似ラベルデータを洗練するために品質教師を採用する。
実験結果から,本手法は全データセット上で平均IoU(Intersection over Union)を5.9%改善することが示された。
論文 参考訳(メタデータ) (2023-02-24T10:31:29Z) - Data Augmentation using Feature Generation for Volumetric Medical Images [0.08594140167290097]
医用画像分類は画像認識領域で最も重要な問題の一つである。
この分野での大きな課題の1つは、ラベル付きトレーニングデータの不足である。
特にディープラーニングモデルでは,画像のセグメンテーションや分類問題に関する有望な結果が示されている。
論文 参考訳(メタデータ) (2022-09-28T13:46:24Z) - Exploiting Diversity of Unlabeled Data for Label-Efficient
Semi-Supervised Active Learning [57.436224561482966]
アクティブラーニング(英: Active Learning)は、ラベリングのための最も重要なサンプルを選択することで、高価なラベリングの問題に対処する研究分野である。
アクティブな学習環境における初期ラベル付けのための最も情報性の高いサンプル群を選択するために,多様性に基づく新しい初期データセット選択アルゴリズムを提案する。
また、一貫性に基づく埋め込みの多様性に基づくサンプリングを用いた、新しいアクティブな学習クエリ戦略を提案する。
論文 参考訳(メタデータ) (2022-07-25T16:11:55Z) - Deep reinforced active learning for multi-class image classification [0.0]
高精度な医用画像分類は、既存の画像のラベル付けに必要な時間と専門知識だけでなく、より多くのデータを取得するコストによって制限される。
本研究では,医療画像分類にアクティブラーニングを適用し,より大規模なデータプールから最小限のサブセット上でのモデル性能を最大化する手法を提案する。
論文 参考訳(メタデータ) (2022-06-20T09:30:55Z) - Application of Transfer Learning and Ensemble Learning in Image-level
Classification for Breast Histopathology [9.037868656840736]
CAD(Computer-Aided Diagnosis)では、従来の分類モデルでは、主に1つのネットワークを使って特徴を抽出する。
本稿では良性病変と悪性病変のバイナリ分類のための画像レベルラベルに基づく深層アンサンブルモデルを提案する。
結果: アンサンブルネットワークモデルにおいて、画像レベルのバイナリ分類は9,8.90%の精度を達成する。
論文 参考訳(メタデータ) (2022-04-18T13:31:53Z) - Improving Contrastive Learning on Imbalanced Seed Data via Open-World
Sampling [96.8742582581744]
我々は、Model-Aware K-center (MAK)と呼ばれるオープンワールドなラベルなしデータサンプリングフレームワークを提案する。
MAKは、尾性、近接性、多様性の3つの単純な原則に従う。
我々はMAKが学習した機能の全体的な表現品質とクラスバランス性の両方を継続的に改善できることを実証した。
論文 参考訳(メタデータ) (2021-11-01T15:09:41Z) - A Real Use Case of Semi-Supervised Learning for Mammogram Classification
in a Local Clinic of Costa Rica [0.5541644538483946]
ディープラーニングモデルのトレーニングには、かなりの量のラベル付きイメージが必要です。
多くの公開データセットが、さまざまな病院や診療所のデータで構築されている。
ラベルなしデータを利用した半教師付き深層学習手法であるMixMatchを提案し評価した。
論文 参考訳(メタデータ) (2021-07-24T22:26:50Z) - ATSO: Asynchronous Teacher-Student Optimization for Semi-Supervised
Medical Image Segmentation [99.90263375737362]
教師-学生最適化の非同期版であるATSOを提案する。
ATSOはラベルのないデータを2つのサブセットに分割し、モデルの微調整に1つのサブセットを交互に使用し、他のサブセットのラベルを更新する。
医用画像のセグメンテーションデータセットを2つ評価し,様々な半教師付き環境において優れた性能を示す。
論文 参考訳(メタデータ) (2020-06-24T04:05:12Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。