論文の概要: Open-Set Semi-Supervised Learning for Long-Tailed Medical Datasets
- arxiv url: http://arxiv.org/abs/2505.14846v1
- Date: Tue, 20 May 2025 19:21:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 15:42:58.719241
- Title: Open-Set Semi-Supervised Learning for Long-Tailed Medical Datasets
- Title(参考訳): 長期医療データセットのためのオープンセット半教師付き学習
- Authors: Daniya Najiha A. Kareem, Jean Lahoud, Mustansar Fiaz, Amandeep Kumar, Hisham Cholakkal,
- Abstract要約: 現実世界の一般化には、現実世界で遭遇する様々な複雑さを考慮する必要がある。
半教師付きアプローチを用いて、高度に不均衡な医療データセットに対するオープンセット学習法を提案する。
分析の結果、分類におけるロングテールデータの影響に対処することで、ネットワーク全体の性能が大幅に向上することが示された。
- 参考スコア(独自算出の注目度): 17.82752126823939
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many practical medical imaging scenarios include categories that are under-represented but still crucial. The relevance of image recognition models to real-world applications lies in their ability to generalize to these rare classes as well as unseen classes. Real-world generalization requires taking into account the various complexities that can be encountered in the real-world. First, training data is highly imbalanced, which may lead to model exhibiting bias toward the more frequently represented classes. Moreover, real-world data may contain unseen classes that need to be identified, and model performance is affected by the data scarcity. While medical image recognition has been extensively addressed in the literature, current methods do not take into account all the intricacies in the real-world scenarios. To this end, we propose an open-set learning method for highly imbalanced medical datasets using a semi-supervised approach. Understanding the adverse impact of long-tail distribution at the inherent model characteristics, we implement a regularization strategy at the feature level complemented by a classifier normalization technique. We conduct extensive experiments on the publicly available datasets, ISIC2018, ISIC2019, and TissueMNIST with various numbers of labelled samples. Our analysis shows that addressing the impact of long-tail data in classification significantly improves the overall performance of the network in terms of closed-set and open-set accuracies on all datasets. Our code and trained models will be made publicly available at https://github.com/Daniyanaj/OpenLTR.
- Abstract(参考訳): 多くの実用的な医療画像のシナリオは、表現不足だが重要なカテゴリーを含んでいる。
画像認識モデルと実世界の応用との関連性は、これらの稀なクラスや目に見えないクラスに一般化する能力にある。
現実世界の一般化には、現実世界で遭遇する様々な複雑さを考慮する必要がある。
まず、トレーニングデータは極めて不均衡であり、モデルがより頻繁に表現されるクラスに対してバイアスを示す可能性がある。
さらに、現実世界のデータには識別する必要のないクラスが含まれており、データ不足によってモデルのパフォーマンスが影響を受ける可能性がある。
医学的な画像認識は文献で広く取り上げられてきたが、現在の手法は現実のシナリオにおけるすべての複雑さを考慮に入れていない。
そこで本研究では,半教師付きアプローチを用いて,高度不均衡な医療データセットのオープンセット学習手法を提案する。
固有モデル特性における長細分布の悪影響を理解するため,分類器正規化手法によって補完される特徴レベルで正則化戦略を実装した。
公開データセットであるISIC2018, ISIC2019, tissueMNISTについて, 多数のラベル付きサンプルを用いて広範な実験を行った。
分析の結果、分類におけるロングテールデータの影響に対処することで、全データセットにおけるクローズド・セットおよびオープン・セット・アキュラシーの観点からネットワーク全体の性能が大幅に向上することが示された。
私たちのコードとトレーニングされたモデルは、https://github.com/Daniyanaj/OpenLTRで公開されます。
関連論文リスト
- Enhancing Image Classification in Small and Unbalanced Datasets through Synthetic Data Augmentation [0.0]
本稿では,クラス固有変分オートエンコーダ(VAE)と潜在空間を用いた,識別能力向上のための新しい合成拡張戦略を提案する。
特徴空間ギャップを埋めるリアルで多様な合成データを生成することにより、データの不足とクラス不均衡の問題に対処する。
提案手法は,エゾファゴガストロデュオ内視鏡画像の清潔度を自動評価する方法を訓練し,検証するために作成した321枚の画像の小さなデータセットで検証した。
論文 参考訳(メタデータ) (2024-09-16T13:47:52Z) - Generalization in medical AI: a perspective on developing scalable models [2.6728181032975598]
医療用AIモデルの配布外一般化性能を特徴付ける3段階尺度が導入された。
このスケールは、現実世界の医療シナリオの多様性と、対象のドメインデータとラベルがモデル再分類に利用できるかどうかに対処する。
論文 参考訳(メタデータ) (2023-11-09T14:54:28Z) - From Isolation to Collaboration: Federated Class-Heterogeneous Learning for Chest X-Ray Classification [4.0907576027258985]
フェデレートラーニングは,グローバル胸部X線分類モデル(CXR)を協調的にトレーニングするための,有望なパラダイムである。
本研究では,選択的アグリゲーションを用いてグローバルモデルの協調学習を行うFL法である外科的アグリゲーションを提案する。
その結果,本手法は現在の手法よりも優れ,一般化性が高いことがわかった。
論文 参考訳(メタデータ) (2023-01-17T03:53:29Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - A Real Use Case of Semi-Supervised Learning for Mammogram Classification
in a Local Clinic of Costa Rica [0.5541644538483946]
ディープラーニングモデルのトレーニングには、かなりの量のラベル付きイメージが必要です。
多くの公開データセットが、さまざまな病院や診療所のデータで構築されている。
ラベルなしデータを利用した半教師付き深層学習手法であるMixMatchを提案し評価した。
論文 参考訳(メタデータ) (2021-07-24T22:26:50Z) - Relational Subsets Knowledge Distillation for Long-tailed Retinal
Diseases Recognition [65.77962788209103]
本研究では,長尾データを知識に基づいて複数のクラスサブセットに分割し,クラスサブセット学習を提案する。
モデルがサブセット固有の知識の学習に集中するように強制する。
提案手法は長期網膜疾患認識タスクに有効であることが判明した。
論文 参考訳(メタデータ) (2021-04-22T13:39:33Z) - Domain Generalization for Medical Imaging Classification with
Linear-Dependency Regularization [59.5104563755095]
本稿では,医用画像分類分野におけるディープニューラルネットワークの一般化能力向上のための,シンプルだが効果的なアプローチを提案する。
医用画像の領域変数がある程度コンパクトであることに感銘を受けて,変分符号化による代表的特徴空間の学習を提案する。
論文 参考訳(メタデータ) (2020-09-27T12:30:30Z) - Rethinking Class-Balanced Methods for Long-Tailed Visual Recognition
from a Domain Adaptation Perspective [98.70226503904402]
現実世界のオブジェクトの周波数は、しばしば電力法則に従い、長い尾のクラス分布を持つデータセット間のミスマッチを引き起こす。
メタラーニング手法を用いて,クラス条件分布の違いを明示的に推定し,古典的なクラスバランス学習を強化することを提案する。
論文 参考訳(メタデータ) (2020-03-24T11:28:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。