論文の概要: Cancer-Net SCa-Synth: An Open Access Synthetically Generated 2D Skin Lesion Dataset for Skin Cancer Classification
- arxiv url: http://arxiv.org/abs/2411.05269v1
- Date: Fri, 08 Nov 2024 02:04:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 14:55:22.524695
- Title: Cancer-Net SCa-Synth: An Open Access Synthetically Generated 2D Skin Lesion Dataset for Skin Cancer Classification
- Title(参考訳): 癌ネットワークSCa合成 : 皮膚癌分類のためのオープンアクセス合成2次元皮膚病変データセット
- Authors: Chi-en Amy Tai, Oustan Ding, Alexander Wong,
- Abstract要約: アメリカ合衆国では、皮膚がんが最も一般的に診断されるがんと位置づけられており、公衆衛生上の問題となっている。
データセットのキュレーションとディープラーニングの進歩により、皮膚がんの迅速かつ正確な検出が期待できる。
Cancer-Net SCa- Synthは、皮膚がん分類のためのオープンアクセス合成された2D皮膚病変データセットである。
- 参考スコア(独自算出の注目度): 65.83291923029985
- License:
- Abstract: In the United States, skin cancer ranks as the most commonly diagnosed cancer, presenting a significant public health issue due to its high rates of occurrence and the risk of serious complications if not caught early. Recent advancements in dataset curation and deep learning have shown promise in quick and accurate detection of skin cancer. However, current open-source datasets have significant class imbalances which impedes the effectiveness of these deep learning models. In healthcare, generative artificial intelligence (AI) models have been employed to create synthetic data, addressing data imbalance in datasets by augmenting underrepresented classes and enhancing the overall quality and performance of machine learning models. In this paper, we build on top of previous work by leveraging new advancements in generative AI, notably Stable Diffusion and DreamBooth. We introduce Cancer-Net SCa-Synth, an open access synthetically generated 2D skin lesion dataset for skin cancer classification. Further analysis on the data effectiveness by comparing the ISIC 2020 test set performance for training with and without these synthetic images for a simple model highlights the benefits of leveraging synthetic data to improve performance. Cancer-Net SCa-Synth is publicly available at https://github.com/catai9/Cancer-Net-SCa-Synth as part of a global open-source initiative for accelerating machine learning for cancer care.
- Abstract(参考訳): アメリカ合衆国では、皮膚がんが最も一般的に診断されるがんと位置づけられており、発生率が高く、早期に治療を受けなければ深刻な合併症のリスクがあるため、公衆衛生上の重大な問題を抱えている。
データセットのキュレーションとディープラーニングの進歩により、皮膚がんの迅速かつ正確な検出が期待できる。
しかし、現在のオープンソースのデータセットは、これらのディープラーニングモデルの有効性を阻害する重要なクラス不均衡を持っている。
医療分野では、生成人工知能(AI)モデルを使用して合成データを作成し、未表現のクラスを増やし、機械学習モデルの全体的な品質と性能を向上させることでデータセットにおけるデータの不均衡に対処している。
本稿では、生成AIの新たな進歩、特にStable DiffusionとDreamBoothを活用することで、これまでの成果の上に構築する。
皮膚癌分類のためのオープンアクセス合成2次元皮膚病変データセットである Cancer-Net SCa-Synth を紹介する。
簡易なモデルとして,ISIC 2020テストセットの性能とこれらの合成画像とを比較してデータの有効性を更に分析することにより,合成データを活用して性能を向上させることのメリットを浮き彫りにした。
Cancer-Net SCa-Synthは、がん治療のための機械学習を加速するためのグローバルなオープンソースイニシアチブの一環として、https://github.com/catai9/Cancer-Net-SCa-Synthで公開されている。
関連論文リスト
- Little Giants: Synthesizing High-Quality Embedding Data at Scale [71.352883755806]
SPEEDは,オープンソースの小型モデルと協調して大規模な埋め込みデータを効率的に生成するフレームワークである。
SPEEDはGPT API呼び出しの1/10未満しか使用せず、両者が合成データのみに基づいてトレーニングされている場合、最先端の埋め込みモデルE5_mistralよりも優れている。
論文 参考訳(メタデータ) (2024-10-24T10:47:30Z) - Generation of synthetic data using breast cancer dataset and classification with resnet18 [0.0]
合成データは、実際のデータの制約、ラベル付きデータの収集のコスト、プライバシとセキュリティの問題など、さまざまな理由から必要とされる。
GAN(Generative Adversarial Networks)と呼ばれるディープラーニングモデルは,合成データを生成する目的で開発された。
本研究では,乳腺病理組織学的データセットを用いて悪性および陰性にラベル付けされた合成パッチ画像を生成する。
論文 参考訳(メタデータ) (2024-05-25T15:53:27Z) - An Interpretable Deep Learning Approach for Skin Cancer Categorization [0.0]
我々は、皮膚がん検出の問題に対処するために、現代のディープラーニング手法と説明可能な人工知能(XAI)アプローチを使用する。
皮膚病変の分類には,XceptionNet,EfficientNetV2S,InceptionResNetV2,EfficientNetV2Mの4つの最先端事前訓練モデルを用いる。
我々の研究は、ディープラーニングと説明可能な人工知能(XAI)が皮膚がんの診断をどのように改善するかを示している。
論文 参考訳(メタデータ) (2023-12-17T12:11:38Z) - Cancer-Net PCa-Gen: Synthesis of Realistic Prostate Diffusion Weighted
Imaging Data via Anatomic-Conditional Controlled Latent Diffusion [68.45407109385306]
カナダでは、前立腺がんは男性でもっとも一般的ながんであり、2022年のこの人口統計では、新しいがん症例の20%を占めている。
拡散強調画像(DWI)データを用いた前立腺癌診断,予後,治療計画のためのディープニューラルネットワークの開発には大きな関心が寄せられている。
本研究では,解剖学的条件制御型潜伏拡散戦略の導入により,現実的な前立腺DWIデータを生成するための潜伏拡散の有効性について検討した。
論文 参考訳(メタデータ) (2023-11-30T15:11:03Z) - Double-Condensing Attention Condenser: Leveraging Attention in Deep Learning to Detect Skin Cancer from Skin Lesion Images [61.36288157482697]
皮膚がんはアメリカ合衆国で最も一般的な種類のがんであり、5人に1人のアメリカ人に影響を与えると推定されている。
近年の進歩は,SIIM-ISICメラノーマ分類チャレンジのアートパフォーマンスの状況から,皮膚がん検出に強い効果を示している。
本稿では,皮膚病変画像の皮膚癌検出に効率的な自己注意構造を活用し,皮膚病変画像からの皮膚癌検出をカスタマイズしたDC-ACを用いたディープニューラルネットワーク設計を提案する。
論文 参考訳(メタデータ) (2023-11-20T10:45:39Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Machine Learning Against Cancer: Accurate Diagnosis of Cancer by Machine
Learning Classification of the Whole Genome Sequencing Data [0.0]
我々は,MLAC(Machine Learning Against Cancer)の新たな手法を開発し,完全精度,感度,特異性を実現した。
The Cancer Genome Atlas and Genotype-Tissue Expression project for cancerous and healthy tissues。
論文 参考訳(メタデータ) (2020-09-12T18:51:47Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - CorGAN: Correlation-Capturing Convolutional Generative Adversarial
Networks for Generating Synthetic Healthcare Records [0.0]
本稿では,CorGAN (Relationed-capturing Generative Adversarial Network) という,人工的な医療記録を生成するフレームワークを提案する。
モデル忠実度を示すために,CorGANは各種機械学習設定における実データと同様の性能の合成データを生成する。
論文 参考訳(メタデータ) (2020-01-25T18:43:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。