論文の概要: Disparities in Dermatology AI Performance on a Diverse, Curated Clinical
Image Set
- arxiv url: http://arxiv.org/abs/2203.08807v1
- Date: Tue, 15 Mar 2022 20:33:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-18 13:07:21.303676
- Title: Disparities in Dermatology AI Performance on a Diverse, Curated Clinical
Image Set
- Title(参考訳): 皮膚科aiの多彩なキュレーション画像セットにおける性能の相違
- Authors: Roxana Daneshjou, Kailas Vodrahalli, Roberto A Novoa, Melissa Jenkins,
Weixin Liang, Veronica Rotemberg, Justin Ko, Susan M Swetter, Elizabeth E
Bailey, Olivier Gevaert, Pritam Mukherjee, Michelle Phung, Kiana Yekrang,
Bradley Fong, Rachna Sahasrabudhe, Johan A. C. Allerup, Utako Okata-Karigane,
James Zou, Albert Chiou
- Abstract要約: 現状のAIモデルでは、Diverse Dermatology Imagesデータセットでは、はるかにパフォーマンスが悪くなっている。
皮膚科医は、通常、AIトレーニングやデータセットのテストのために視覚的なラベルを提供するが、暗い肌のトーンや珍しい病気のイメージに悪影響を及ぼす。
- 参考スコア(独自算出の注目度): 10.212881174103996
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Access to dermatological care is a major issue, with an estimated 3 billion
people lacking access to care globally. Artificial intelligence (AI) may aid in
triaging skin diseases. However, most AI models have not been rigorously
assessed on images of diverse skin tones or uncommon diseases. To ascertain
potential biases in algorithm performance in this context, we curated the
Diverse Dermatology Images (DDI) dataset-the first publicly available, expertly
curated, and pathologically confirmed image dataset with diverse skin tones.
Using this dataset of 656 images, we show that state-of-the-art dermatology AI
models perform substantially worse on DDI, with receiver operator curve area
under the curve (ROC-AUC) dropping by 27-36 percent compared to the models'
original test results. All the models performed worse on dark skin tones and
uncommon diseases, which are represented in the DDI dataset. Additionally, we
find that dermatologists, who typically provide visual labels for AI training
and test datasets, also perform worse on images of dark skin tones and uncommon
diseases compared to ground truth biopsy annotations. Finally, fine-tuning AI
models on the well-characterized and diverse DDI images closed the performance
gap between light and dark skin tones. Moreover, algorithms fine-tuned on
diverse skin tones outperformed dermatologists on identifying malignancy on
images of dark skin tones. Our findings identify important weaknesses and
biases in dermatology AI that need to be addressed to ensure reliable
application to diverse patients and diseases.
- Abstract(参考訳): 皮膚科医療へのアクセスは大きな問題であり、世界中で30億人の人々がケアへのアクセスを欠いている。
人工知能(AI)は皮膚疾患の治療に役立つ。
しかし、ほとんどのaiモデルは、多様な肌色やまれな疾患の画像で厳格に評価されていない。
この文脈でアルゴリズム性能の潜在的なバイアスを確認するために、我々は、多種多様な皮膚科画像(ddi)データセットをキュレートした。
656画像のこのデータセットを用いて、最先端の皮膚科AIモデルはDDIにおいて著しく悪化し、この曲線下(ROC-AUC)のレシーバ演算子曲線面積は、元の試験結果と比較して27~36%減少している。
すべてのモデルは、ddiデータセットで表される暗い肌色とまれな疾患でより良く行われた。
さらに、AIトレーニングやデータセットのテストのための視覚的なラベルを提供する皮膚科医は、地上の真実の生検アノテーションと比較して、暗い肌のトーンや珍しい病気の画像に悪影響を及ぼすこともわかりました。
最後に、多彩なDDI画像上の微調整AIモデルは、光と暗い肌のトーンのパフォーマンスギャップを埋めた。
さらに、皮膚の色調の異なる画像の悪性度を識別するアルゴリズムは、皮膚科医より優れていた。
本研究は,多様な患者や疾患に対する信頼性を確保するために対処する必要がある皮膚科AIの重要な弱点とバイアスを明らかにする。
関連論文リスト
- PASSION for Dermatology: Bridging the Diversity Gap with Pigmented Skin Images from Sub-Saharan Africa [29.405369900938393]
アフリカでは皮膚科医が大幅に不足しており、人口は100万人に満たない。
これは、皮膚疾患に苦しむ小児人口の80%が皮膚疾患に悩まされている皮膚科医に対する高い需要とは対照的である。
PASSIONプロジェクトは、このデータをオープンソース化することを目的として、サブサハラ諸国の皮膚疾患の画像を収集し、この問題に対処することを目的としている。
論文 参考訳(メタデータ) (2024-11-07T10:11:37Z) - FairSkin: Fair Diffusion for Skin Disease Image Generation [54.29840149709033]
拡散モデル (DM) は, 合成医用画像の生成において主要な手法となっているが, 臨界二倍偏差に悩まされている。
このようなバイアスを3段階のリサンプリング機構によって緩和する新しいDMフレームワークであるFairSkinを提案する。
本手法は, 画像の多様性と品質を著しく向上させ, 臨床環境における皮膚疾患の検出精度の向上に寄与する。
論文 参考訳(メタデータ) (2024-10-29T21:37:03Z) - Equitable Skin Disease Prediction Using Transfer Learning and Domain Adaptation [1.9505972437091028]
皮膚科学における既存の人工知能(AI)モデルは、様々な皮膚のトーンで病気を正確に診断する上で困難に直面している。
我々は、様々な画像領域からのリッチでトランスファー可能な知識を活かしたトランスファーラーニングアプローチを採用する。
あらゆる手法の中で、Med-ViTは様々な画像ソースから学んだ包括的な特徴表現のためにトップパフォーマーとして登場した。
論文 参考訳(メタデータ) (2024-09-01T23:48:26Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - DDI-CoCo: A Dataset For Understanding The Effect Of Color Contrast In
Machine-Assisted Skin Disease Detection [51.92255321684027]
皮膚のトーンと色差効果の相互作用について検討し,色差が皮膚のトーン間のモデル性能バイアスの新たな原因となる可能性が示唆された。
我々の研究は皮膚疾患の検出を改善するために皮膚科のAIに補完的な角度を提供する。
論文 参考訳(メタデータ) (2024-01-24T07:45:24Z) - Skin Lesion Diagnosis Using Convolutional Neural Networks [0.30458514384586394]
本研究の目的は,様々な分野から画像分類のための最先端技術を収集し,この問題に対処することである。
モデルは8012画像のデータセットを用いて訓練され、その性能は2003画像を用いて評価された。
このモデルは、手作りの機能抽出を必要とせずに、イメージからラベルに直接、エンドツーエンドでトレーニングされています。
論文 参考訳(メタデータ) (2023-05-18T17:15:08Z) - Improving Deep Facial Phenotyping for Ultra-rare Disorder Verification
Using Model Ensembles [52.77024349608834]
我々は、DCNNを最先端の顔認識手法であるiResNetとArcFaceに置き換える影響を分析する。
提案するアンサンブルモデルにより,目視と目視の両障害に対する最先端のパフォーマンスが達成される。
論文 参考訳(メタデータ) (2022-11-12T23:28:54Z) - Automatic Facial Skin Feature Detection for Everyone [60.31670960526022]
本研究では,野生の自撮り自撮りのために,さまざまな肌のトーンと年齢群にまたがって機能する顔顔の特徴自動検出法を提案する。
具体的には,肌の色,重度度,照明条件の異なる自撮り画像に対して,アクネ,顔料,ニキビの位置を注釈する。
論文 参考訳(メタデータ) (2022-03-30T04:52:54Z) - Disparities in Dermatology AI: Assessments Using Diverse Clinical Images [9.767299882513825]
異種皮膚画像データセットでは,最先端の皮膚科AIモデルの性能が著しく低下していることが示される。
DDIデータセットでよく表現されているダークスキンのトーンや異常な病気が、パフォーマンスの低下につながることが分かりました。
論文 参考訳(メタデータ) (2021-11-15T07:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。