論文の概要: Synthetic Data Generation for Long-Tail Medical Image Classification: A Case Study in Skin Lesions
- arxiv url: http://arxiv.org/abs/2605.03221v1
- Date: Mon, 04 May 2026 23:18:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.6801
- Title: Synthetic Data Generation for Long-Tail Medical Image Classification: A Case Study in Skin Lesions
- Title(参考訳): 長距離医用画像分類のための合成データ生成:皮膚病変を事例として
- Authors: Jiaxiang Jiang, Mahesh Subedar, Omesh Tickoo,
- Abstract要約: 長い尾の分布クラスは、マルチクラスの医療データセットで広く使われている。
この制限は、まれなクラスが重篤または高リスクの疾患に対応することが多い医学的応用において特に問題となる。
医療用長期分類に適した拡散モデル駆動型合成データ拡張パイプラインを提案する。
- 参考スコア(独自算出の注目度): 6.219934229461855
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Long-tailed class distributions are pervasive in multi-class medical datasets and pose significant challenges for deep learning models which typically underperform on tail classes with limited samples. This limitation is particularly problematic in medical applications, where rare classes often correspond to severe or high-risk diseases and therefore require high diagnostic accuracy. Existing solutions-including specialized architectures, rebalanced loss functions, and handcrafted data augmentation-offer only marginal improvements and struggle to scale due to their limited and largely deterministic variability. To address these challenges, we introduce a diffusion-model-driven synthetic data augmentation pipeline tailored for medical long-tailed classification. Our approach features a novel inpainting diffusion model combined with an Out-of-Distribution (OOD) post-selection mechanism to ensure diverse, realistic, and clinically meaningful synthetic samples. Evaluated on the ISIC2019 skin lesion classification dataset, one of the largest and most imbalanced medical imaging benchmarks, our method yields substantial improvements in overall performance, with particularly pronounced gains on tail classes with more than $28\%$ improvement on the class with the fewest samples. These results demonstrate the effectiveness of diffusion-based augmentation in mitigating long-tail imbalance and enhancing medical classification robustness.
- Abstract(参考訳): 長い尾のクラス分布は、マルチクラスの医療データセットに広く浸透しており、典型的には限られたサンプルを持つ尾のクラスで性能が劣るディープラーニングモデルに重大な課題を提起する。
この制限は、まれなクラスが重篤な疾患や高リスクな疾患に対応し、高い診断精度を必要とする医学的応用において特に問題となる。
既存のソリューション(特殊アーキテクチャ、再均衡損失関数、手作りデータ拡張オフ)は、制限された決定論的変動のため、限界的な改善とスケールに苦慮するのみである。
これらの課題に対処するために,医療用長期分類に適した拡散モデル駆動型合成データ拡張パイプラインを導入する。
提案手法は, 多様な, 現実的, 臨床的に有意義な合成試料を確実にするために, アウト・オブ・ディストリビューション (OOD) と組み合わせた新規な塗布拡散モデルである。
本手法はISIC2019皮膚病変分類データセットに基づいて評価され,最も大きく,最も不均衡な医用画像のベンチマークである。
これらの結果は, 長期不均衡を緩和し, 医学的分類の堅牢性を高めるために, 拡散に基づく拡張の有効性を示すものである。
関連論文リスト
- Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - One Shot GANs for Long Tail Problem in Skin Lesion Dataset using novel content space assessment metric [1.833650794546064]
医療分野では、まれな状態の医療データが不足しているため、長い尾の問題は頻繁に発生する。
One Shot GANsは、追加のサンプルを生成することで、HAM10000データセットのテールクラスを拡張するために使用された。
論文 参考訳(メタデータ) (2024-09-30T04:51:54Z) - LoGex: Improved tail detection of extremely rare histopathology classes via guided diffusion [36.56346240815833]
現実的な医療環境では、データは長い尾を持つことが多く、ほとんどのサンプルは少数のクラスと稀なクラスの長い尾に集中しており、通常は少数のサンプルしか含まれていない。
この分布は、希少な条件が検出しにくく、限られたデータのために分類することが難しいため、重大な課題である。
本稿では,レアクラスを分類する代わりに,配布外データとして確実に検出することを目的とする。
論文 参考訳(メタデータ) (2024-09-02T15:18:15Z) - Meta-Transfer Derm-Diagnosis: Exploring Few-Shot Learning and Transfer Learning for Skin Disease Classification in Long-Tail Distribution [0.9384603486206738]
稀な皮膚疾患の正確なモデルを作るのは難しい。
我々は,エピソード学習,教師あり移行学習,対照的自己指導事前学習の3つの学習戦略を比較した。
伝統的な移動学習アプローチは、訓練例の数が増えるにつれて、エピソード的および自己指導的手法を一貫して上回る。
論文 参考訳(メタデータ) (2024-04-25T17:56:45Z) - Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - Achieving Reliable and Fair Skin Lesion Diagnosis via Unsupervised Domain Adaptation [43.1078084014722]
教師なしドメイン適応(UDA)は、信頼性の高い分類器を開発するために、大きな外部データセットを統合することができる。
UDAは少数派に対する偏見を効果的に軽減し、診断システムの公平性を高めることができる。
論文 参考訳(メタデータ) (2023-07-06T17:32:38Z) - Generative models improve fairness of medical classifiers under
distribution shifts [49.10233060774818]
データから現実的な拡張を自動的に学習することは、生成モデルを用いてラベル効率の良い方法で可能であることを示す。
これらの学習の強化は、モデルをより堅牢で統計的に公平に配布できることを示した。
論文 参考訳(メタデータ) (2023-04-18T18:15:38Z) - Hierarchical Knowledge Guided Learning for Real-world Retinal Diseases
Recognition [20.88407972858568]
眼科AIで最近発表されたいくつかのデータセットは、40種類以上の網膜疾患からなり、複雑な異常と様々な致死性がある。
モデリングの観点からは、これらのデータセットでトレーニングされたほとんどのディープラーニングモデルは、まれな疾患に一般化する能力に欠ける可能性がある。
本稿では,網膜疾患認識のための長期データベースから深部ニューラルネットワークを学習するための新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-17T05:44:39Z) - Relational Subsets Knowledge Distillation for Long-tailed Retinal
Diseases Recognition [65.77962788209103]
本研究では,長尾データを知識に基づいて複数のクラスサブセットに分割し,クラスサブセット学習を提案する。
モデルがサブセット固有の知識の学習に集中するように強制する。
提案手法は長期網膜疾患認識タスクに有効であることが判明した。
論文 参考訳(メタデータ) (2021-04-22T13:39:33Z) - Single Model Deep Learning on Imbalanced Small Datasets for Skin Lesion
Classification [5.642359877598896]
本稿では,小・不均衡なデータセットに基づく皮膚病変の単一モデル分類のための新しいデータ拡張戦略を提案する。
このデータセット上で、様々なDCNNがトレーニングされ、適度な複雑さを持つモデルがより大きなモデルより優れていることを示す。
修正RandAugmentとMulti-weighted Focal Lossを1つのDCNNモデルで組み合わせることで、ISIC 2018チャレンジテストデータセット上の複数のアンサンブルモデルに匹敵する分類精度を達成した。
論文 参考訳(メタデータ) (2021-02-02T03:48:55Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。