論文の概要: Crowdsourcing Dermatology Images with Google Search Ads: Creating a
Real-World Skin Condition Dataset
- arxiv url: http://arxiv.org/abs/2402.18545v1
- Date: Wed, 28 Feb 2024 18:29:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 13:55:56.484706
- Title: Crowdsourcing Dermatology Images with Google Search Ads: Creating a
Real-World Skin Condition Dataset
- Title(参考訳): google検索広告でdermatologyイメージをクラウドソーシングする: 現実世界の皮膚状態データセットの作成
- Authors: Abbi Ward, Jimmy Li, Julie Wang, Sriram Lakshminarasimhan, Ashley
Carrick, Bilson Campana, Jay Hartford, Pradeep Kumar S, Tiya
Tiyasirichokchai, Sunny Virmani, Renee Wong, Yossi Matias, Greg S. Corrado,
Dale R. Webster, Dawn Siegel, Steven Lin, Justin Ko, Alan Karthikesalingam,
Christopher Semturs and Pooja Rao
- Abstract要約: このデータセットは、2023年3月から8ヶ月にわたって、米国のインターネットユーザーから5,033件のコントリビューションから10,408件の画像を含んでいる。
女性(66.72%)と若年(52%が40歳)のコントリビューターは、アメリカの人口と比較してデータセットの表現率が高い。
鑑別診断における皮膚科医の信頼性は, 変数数の増加とともに増大した。
- 参考スコア(独自算出の注目度): 7.60704693971239
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: Health datasets from clinical sources do not reflect the breadth
and diversity of disease in the real world, impacting research, medical
education, and artificial intelligence (AI) tool development. Dermatology is a
suitable area to develop and test a new and scalable method to create
representative health datasets.
Methods: We used Google Search advertisements to invite contributions to an
open access dataset of images of dermatology conditions, demographic and
symptom information. With informed contributor consent, we describe and release
this dataset containing 10,408 images from 5,033 contributions from internet
users in the United States over 8 months starting March 2023. The dataset
includes dermatologist condition labels as well as estimated Fitzpatrick Skin
Type (eFST) and Monk Skin Tone (eMST) labels for the images.
Results: We received a median of 22 submissions/day (IQR 14-30). Female
(66.72%) and younger (52% < age 40) contributors had a higher representation in
the dataset compared to the US population, and 32.6% of contributors reported a
non-White racial or ethnic identity. Over 97.5% of contributions were genuine
images of skin conditions. Dermatologist confidence in assigning a differential
diagnosis increased with the number of available variables, and showed a weaker
correlation with image sharpness (Spearman's P values <0.001 and 0.01
respectively). Most contributions were short-duration (54% with onset < 7 days
ago ) and 89% were allergic, infectious, or inflammatory conditions. eFST and
eMST distributions reflected the geographical origin of the dataset. The
dataset is available at github.com/google-research-datasets/scin .
Conclusion: Search ads are effective at crowdsourcing images of health
conditions. The SCIN dataset bridges important gaps in the availability of
representative images of common skin conditions.
- Abstract(参考訳): 背景:臨床資料からの健康データセットは、現実世界の病気の広さや多様性を反映せず、研究、医学教育、人工知能(AI)ツール開発に影響を与える。
皮膚科学は、代表的な健康データセットを作成するための新しいスケーラブルな方法の開発とテストに適した分野である。
方法:我々はGoogle Searchの広告を用いて,皮膚疾患,人口統計,症状情報の画像のオープンアクセスデータセットへのコントリビューションを招待した。
インフォームドコントリビュータの同意を得て、2023年3月から8ヶ月にわたり、米国のインターネットユーザから5,033件のコントリビューションから10,408件の画像を含むデータセットを記述、リリースします。
このデータセットには、皮膚科の条件ラベルと、画像のFitzpatrick Skin Type (eFST)とMonk Skin Tone (eMST)のラベルが含まれる。
結果: 毎日22件(IQR 14~30件)の提出があった。
女性 (66.72%) と若い (52% < 40歳) のコントリビューターは、アメリカの人口よりもデータセットの表現率が高く、32.6%のコントリビューターが非白人の人種または民族のアイデンティティを報告した。
97.5%以上が本物の皮膚状態の画像である。
鑑別診断における皮膚科医の信頼性は, 画像の鮮明度との相関が低かった(SpearmanのP値<0.001, 0.01)。
コントリビューションの大部分は短期(54%が発症7日前)で,89%がアレルギー,感染症,炎症性であった。
eFSTとeMST分布はデータセットの地理的起源を反映している。
データセットはgithub.com/google-research-datasets/scinで入手できる。
結論: 検索広告は健康状態の画像のクラウドソーシングに有効である。
SCINデータセットは、一般的な皮膚状態の代表画像の可用性において重要なギャップを橋渡しする。
関連論文リスト
- PASSION for Dermatology: Bridging the Diversity Gap with Pigmented Skin Images from Sub-Saharan Africa [29.405369900938393]
アフリカでは皮膚科医が大幅に不足しており、人口は100万人に満たない。
これは、皮膚疾患に苦しむ小児人口の80%が皮膚疾患に悩まされている皮膚科医に対する高い需要とは対照的である。
PASSIONプロジェクトは、このデータをオープンソース化することを目的として、サブサハラ諸国の皮膚疾患の画像を収集し、この問題に対処することを目的としている。
論文 参考訳(メタデータ) (2024-11-07T10:11:37Z) - FairSkin: Fair Diffusion for Skin Disease Image Generation [54.29840149709033]
拡散モデル (DM) は, 合成医用画像の生成において主要な手法となっているが, 臨界二倍偏差に悩まされている。
このようなバイアスを3段階のリサンプリング機構によって緩和する新しいDMフレームワークであるFairSkinを提案する。
本手法は, 画像の多様性と品質を著しく向上させ, 臨床環境における皮膚疾患の検出精度の向上に寄与する。
論文 参考訳(メタデータ) (2024-10-29T21:37:03Z) - A Demographic-Conditioned Variational Autoencoder for fMRI Distribution Sampling and Removal of Confounds [49.34500499203579]
変動型オートエンコーダ(VAE)ベースのモデルであるDemoVAEを作成し、人口統計学から fMRI の特徴を推定する。
ユーザが供給する人口動態に基づいて,高品質な合成fMRIデータを生成する。
論文 参考訳(メタデータ) (2024-05-13T17:49:20Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - The Development and Performance of a Machine Learning Based Mobile
Platform for Visually Determining the Etiology of Penile Pathology [0.0]
我々は5つのペニス病を分類する機械学習モデルを開発した。
このモデルは現在世界中で使用されており、ペニス病の診断サービスへのアクセスを改善する可能性を秘めている。
論文 参考訳(メタデータ) (2024-03-13T11:05:40Z) - DDI-CoCo: A Dataset For Understanding The Effect Of Color Contrast In
Machine-Assisted Skin Disease Detection [51.92255321684027]
皮膚のトーンと色差効果の相互作用について検討し,色差が皮膚のトーン間のモデル性能バイアスの新たな原因となる可能性が示唆された。
我々の研究は皮膚疾患の検出を改善するために皮膚科のAIに補完的な角度を提供する。
論文 参考訳(メタデータ) (2024-01-24T07:45:24Z) - On the notion of Hallucinations from the lens of Bias and Validity in
Synthetic CXR Images [0.35998666903987897]
拡散モデルのような生成モデルは、データ品質と臨床情報の格差を軽減することを目的としている。
スタンフォード大学の研究者たちは、医療画像データ拡張のための微調整された安定拡散モデル(RoentGen)の有用性を探求した。
我々はRoentGenを利用してChest-XRay(CXR)画像を生成し、バイアス、妥当性、幻覚の評価を行った。
論文 参考訳(メタデータ) (2023-12-12T04:41:20Z) - Generative models improve fairness of medical classifiers under
distribution shifts [49.10233060774818]
データから現実的な拡張を自動的に学習することは、生成モデルを用いてラベル効率の良い方法で可能であることを示す。
これらの学習の強化は、モデルをより堅牢で統計的に公平に配布できることを示した。
論文 参考訳(メタデータ) (2023-04-18T18:15:38Z) - The EMory BrEast imaging Dataset (EMBED): A Racially Diverse, Granular
Dataset of 3.5M Screening and Diagnostic Mammograms [2.243792799100692]
EMory BrEast画像データセットには3650,000の2Dと診断用マンモグラフィーが含まれており、白人とアフリカ系アメリカ人の患者に等しく分けられている。
私たちの目標は、このデータセットを研究パートナーと共有し、すべての患者に公平に提供し、医療AIのバイアスを減らすための乳房AIモデルの開発と検証を支援することです。
論文 参考訳(メタデータ) (2022-02-08T14:40:59Z) - Disparities in Dermatology AI: Assessments Using Diverse Clinical Images [9.767299882513825]
異種皮膚画像データセットでは,最先端の皮膚科AIモデルの性能が著しく低下していることが示される。
DDIデータセットでよく表現されているダークスキンのトーンや異常な病気が、パフォーマンスの低下につながることが分かりました。
論文 参考訳(メタデータ) (2021-11-15T07:04:58Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。