論文の概要: Diffusion-based Data Augmentation for Skin Disease Classification:
Impact Across Original Medical Datasets to Fully Synthetic Images
- arxiv url: http://arxiv.org/abs/2301.04802v1
- Date: Thu, 12 Jan 2023 04:22:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 14:09:54.883854
- Title: Diffusion-based Data Augmentation for Skin Disease Classification:
Impact Across Original Medical Datasets to Fully Synthetic Images
- Title(参考訳): 皮膚疾患分類のための拡散法に基づくデータ拡張:医用データから全合成画像へ及ぼす影響
- Authors: Mohamed Akrout, B\'alint Gyepesi, P\'eter Holl\'o, Adrienn Po\'or,
Bl\'aga Kincs\H{o}, Stephen Solis, Katrina Cirone, Jeremy Kawahara, Dekker
Slade, Latif Abid, M\'at\'e Kov\'acs, Istv\'an Fazekas
- Abstract要約: 深層ニューラルネットワークは、過度な適合を避けるために、依然として大量のトレーニングデータに依存している。
医療のような現実世界のアプリケーションのためのラベル付きトレーニングデータには制限があり、アクセスが困難である。
我々は,我々の大脳皮質皮膚疾患データセットのトレーニングサンプルを増強する上で,テキスト・画像拡散確率モデルの成功を生かした。
- 参考スコア(独自算出の注目度): 2.5075774184834803
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite continued advancement in recent years, deep neural networks still
rely on large amounts of training data to avoid overfitting. However, labeled
training data for real-world applications such as healthcare is limited and
difficult to access given longstanding privacy, and strict data sharing
policies. By manipulating image datasets in the pixel or feature space,
existing data augmentation techniques represent one of the effective ways to
improve the quantity and diversity of training data. Here, we look to advance
augmentation techniques by building upon the emerging success of text-to-image
diffusion probabilistic models in augmenting the training samples of our
macroscopic skin disease dataset. We do so by enabling fine-grained control of
the image generation process via input text prompts. We demonstrate that this
generative data augmentation approach successfully maintains a similar
classification accuracy of the visual classifier even when trained on a fully
synthetic skin disease dataset. Similar to recent applications of generative
models, our study suggests that diffusion models are indeed effective in
generating high-quality skin images that do not sacrifice the classifier
performance, and can improve the augmentation of training datasets after
curation.
- Abstract(参考訳): 近年の進歩にもかかわらず、深層ニューラルネットワークは過度な適合を避けるために大量のトレーニングデータに依存している。
しかし、医療などの現実世界のアプリケーションのためのラベル付きトレーニングデータは、長年のプライバシーと厳格なデータ共有ポリシーによって、限定的でアクセスが困難である。
画素や特徴空間で画像データセットを操作することにより、既存のデータ拡張技術は、トレーニングデータの量と多様性を改善する効果的な方法の1つである。
そこで本研究では,大脳皮質皮膚疾患データセットのトレーニングサンプルを増強する上で,テキスト・画像拡散確率モデルの成功を生かして,拡張手法の進歩を目指す。
入力テキストプロンプトによる画像生成プロセスのきめ細かい制御を可能にした。
この生成データ拡張手法は、完全合成皮膚疾患データセットでトレーニングした場合でも、視覚分類器の類似した分類精度を維持することを実証する。
近年のジェネレーティブ・モデルの応用と同様に、拡散モデルは分類器の性能を犠牲にせず、キュレーション後のトレーニングデータセットの増大を改善できる高品質な皮膚画像を生成するのに有効であることを示す。
関連論文リスト
- Active Generation for Image Classification [50.18107721267218]
本稿では,モデルのニーズと特徴に着目し,画像生成の効率性に対処することを提案する。
能動学習の中心的傾向として,ActGenという手法が,画像生成のトレーニング・アウェア・アプローチを取り入れている。
論文 参考訳(メタデータ) (2024-03-11T08:45:31Z) - Training Class-Imbalanced Diffusion Model Via Overlap Optimization [55.96820607533968]
実世界のデータセットで訓練された拡散モデルは、尾クラスの忠実度が劣ることが多い。
拡散モデルを含む深い生成モデルは、豊富な訓練画像を持つクラスに偏りがある。
本研究では,異なるクラスに対する合成画像の分布の重複を最小限に抑えるために,コントラスト学習に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-02-16T16:47:21Z) - Boosting Dermatoscopic Lesion Segmentation via Diffusion Models with
Visual and Textual Prompts [27.222844687360823]
我々は、病変特異的な視覚的およびテキスト的プロンプトを用いた制御フローを追加して、生成モデルの最新の進歩に適応する。
SSIM画像の品質測定では9%以上,Dice係数は5%以上向上する。
論文 参考訳(メタデータ) (2023-10-04T15:43:26Z) - Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images
with Free Attention Masks [64.67735676127208]
テキストと画像の拡散モデルは、画像認識の恩恵を受ける大きな可能性を示している。
有望ではあるが、拡散生成画像の教師なし学習に特化した調査は不十分である。
上記フリーアテンションマスクをフル活用することで、カスタマイズされたソリューションを導入する。
論文 参考訳(メタデータ) (2023-08-13T10:07:46Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Effective Data Augmentation With Diffusion Models [65.09758931804478]
我々は、事前訓練されたテキスト・画像拡散モデルによりパラメータ化された画像・画像変換によるデータ拡張の多様性の欠如に対処する。
本手法は,市販の拡散モデルを用いて画像のセマンティクスを編集し,いくつかのラベル付き例から新しい視覚概念に一般化する。
本手法は,実世界の雑草認識タスクと数ショット画像分類タスクにおいて評価し,テスト領域における精度の向上を観察する。
論文 参考訳(メタデータ) (2023-02-07T20:42:28Z) - Leaving Reality to Imagination: Robust Classification via Generated
Datasets [24.411444438920988]
近年のロバスト性に関する研究では、テストセットと同様のデータセットでトレーニングされたニューラルイメージ分類器間での顕著なパフォーマンスギャップが明らかになった。
生成したデータセットは、画像分類器の自然な堅牢性にどのように影響するのか?
生成したデータで強化された実データに基づいて訓練された画像ネット分類器は、標準トレーニングよりも精度が高く、効果的に頑健であることがわかった。
論文 参考訳(メタデータ) (2023-02-05T22:49:33Z) - Improving dermatology classifiers across populations using images
generated by large diffusion models [4.291548465691441]
大規模なテキスト・画像拡散モデルであるDALL$cdot$E2は皮膚疾患の光写実画像を生成することができることを示す。
DALL$cdot$E2生成合成画像によるトレーニングデータの拡大は、皮膚疾患の全体的分類、特に表現不足群の分類を改善することを実証した。
論文 参考訳(メタデータ) (2022-11-23T23:53:03Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - Unlabeled Data Guided Semi-supervised Histopathology Image Segmentation [34.45302976822067]
生成法に基づく半教師付き学習(SSL)は,多様な画像特性の活用に有効であることが証明されている。
非ラベルデータ分布を利用した病理組織像分割のための新しいデータガイド生成法を提案する。
本手法は腺および核データセット上で評価される。
論文 参考訳(メタデータ) (2020-12-17T02:54:19Z) - Evaluation of Deep Convolutional Generative Adversarial Networks for
data augmentation of chest X-ray images [0.0]
医用画像データセットは通常、データを取得し、アノテーションを消費するコストが高いため、不均衡である。
本研究では,Chest X-raysデータセット上で生成モデルを用いてデータ拡張を行った。
論文 参考訳(メタデータ) (2020-09-02T16:43:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。