論文の概要: TrueSkin: Towards Fair and Accurate Skin Tone Recognition and Generation
- arxiv url: http://arxiv.org/abs/2509.10980v1
- Date: Sat, 13 Sep 2025 20:58:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:22.865116
- Title: TrueSkin: Towards Fair and Accurate Skin Tone Recognition and Generation
- Title(参考訳): True Skin: 公正で正確な肌のトーン認識と生成を目指して
- Authors: Haoming Lu,
- Abstract要約: 7299の画像を体系的に6つのクラスに分類したデータセットであるTrueSkinを紹介する。
既存の認識と生成のアプローチをベンチマークし、重大なバイアスを明らかにします。
TrueSkin上での認識モデルのトレーニングにより,分類精度が20%以上向上することが実証された。
- 参考スコア(独自算出の注目度): 0.6768558752130311
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Skin tone recognition and generation play important roles in model fairness, healthcare, and generative AI, yet they remain challenging due to the lack of comprehensive datasets and robust methodologies. Compared to other human image analysis tasks, state-of-the-art large multimodal models (LMMs) and image generation models struggle to recognize and synthesize skin tones accurately. To address this, we introduce TrueSkin, a dataset with 7299 images systematically categorized into 6 classes, collected under diverse lighting conditions, camera angles, and capture settings. Using TrueSkin, we benchmark existing recognition and generation approaches, revealing substantial biases: LMMs tend to misclassify intermediate skin tones as lighter ones, whereas generative models struggle to accurately produce specified skin tones when influenced by inherent biases from unrelated attributes in the prompts, such as hairstyle or environmental context. We further demonstrate that training a recognition model on TrueSkin improves classification accuracy by more than 20\% compared to LMMs and conventional approaches, and fine-tuning with TrueSkin significantly improves skin tone fidelity in image generation models. Our findings highlight the need for comprehensive datasets like TrueSkin, which not only serves as a benchmark for evaluating existing models but also provides a valuable training resource to enhance fairness and accuracy in skin tone recognition and generation tasks.
- Abstract(参考訳): 皮膚のトーン認識と生成は、モデルフェアネス、ヘルスケア、生成AIにおいて重要な役割を果たすが、包括的なデータセットや堅牢な方法論が欠如しているため、これらは依然として困難である。
他の人間の画像解析タスクと比較して、最先端の大規模マルチモーダルモデル(LMM)と画像生成モデルは、皮膚のトーンを正確に認識し、合成するのに苦労する。
7299の画像が体系的に6つのクラスに分類されたデータセットであるTrueSkinを導入し、様々な照明条件、カメラアングル、キャプチャ設定で収集する。
一方、生成モデルでは、ヘアスタイルや環境文脈のようなプロンプトの無関係な属性から固有のバイアスの影響を受ければ、特定の皮膚のトーンを正確に生成することができない。
さらに、TrueSkinによる認識モデルのトレーニングは、LMMや従来の手法と比較して20倍以上の分類精度向上を実現し、TrueSkinによる微調整は、画像生成モデルにおける皮膚のトーン忠実度を著しく向上させることを示した。
このデータセットは既存のモデルを評価するためのベンチマークとして機能するだけでなく、皮膚のトーン認識と生成タスクの公平性と正確性を高めるための貴重なトレーニングリソースも提供します。
関連論文リスト
- Are generative models fair? A study of racial bias in dermatological image generation [15.812312064457865]
臨床皮膚学における生成モデルの妥当性を,人種的偏見から評価した。
Fitzpatrick17kデータセットを用いて、人種的バイアスがこれらのモデルの表現と性能にどのように影響するかを調べる。
論文 参考訳(メタデータ) (2025-01-20T21:24:15Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - S-SYNTH: Knowledge-Based, Synthetic Generation of Skin Images [2.79604239303318]
S-SYNTHは知識ベースで適応可能なオープンソーススキンシミュレーションフレームワークである。
我々は、解剖学的にインスパイアされた多層多層皮膚と成長する病変モデルを用いて、合成皮膚、3次元モデル、デジタル化された画像を生成する。
また, 合成データを用いて得られた結果は, 実際の皮膚画像と類似した傾向を示した。
論文 参考訳(メタデータ) (2024-07-31T23:16:29Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Bias and Diversity in Synthetic-based Face Recognition [12.408456748469426]
合成顔認証データセットの多様性が、真正なデータセットとどのように比較されるかを検討する。
性別、民族、年齢、地位の分布に注目します。
バイアスに関しては、合成ベースモデルが真ベースモデルと類似したバイアス挙動を持っていることが分かる。
論文 参考訳(メタデータ) (2023-11-07T13:12:34Z) - Improving Fairness using Vision-Language Driven Image Augmentation [60.428157003498995]
公平性は、特に顔領域において、ディープラーニングの識別モデルを訓練する際に重要である。
モデルは、特定の特性(年齢や肌の色など)と無関係な属性(下流タスク)を関連付ける傾向がある
本稿では,これらの相関を緩和し,公平性を向上する手法を提案する。
論文 参考訳(メタデータ) (2023-11-02T19:51:10Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - Meta Balanced Network for Fair Face Recognition [51.813457201437195]
我々は、データとアルゴリズムの両方の側面からバイアスを体系的に科学的に研究する。
本稿では,メタバランスネットワーク(MBN)と呼ばれるメタ学習アルゴリズムを提案する。
大規模な実験により、MBNは偏見を緩和し、顔認識において異なる肌のトーンを持つ人々に対してよりバランスの取れたパフォーマンスを学ぶことができた。
論文 参考訳(メタデータ) (2022-05-13T10:25:44Z) - Conformer and Blind Noisy Students for Improved Image Quality Assessment [80.57006406834466]
知覚品質評価(IQA)のための学習ベースアプローチは、通常、知覚品質を正確に測定するために歪んだ画像と参照画像の両方を必要とする。
本研究では,変換器を用いた全参照IQAモデルの性能について検討する。
また,全教師モデルから盲人学生モデルへの半教師付き知識蒸留に基づくIQAの手法を提案する。
論文 参考訳(メタデータ) (2022-04-27T10:21:08Z) - EdgeMixup: Improving Fairness for Skin Disease Classification and
Segmentation [9.750368551427494]
皮膚病変は、広範囲の感染症やその他の病気の早期の指標である可能性がある。
深層学習(DL)モデルを用いた皮膚病変の診断は,プレスクリーニング患者を支援できる可能性が高い。
これらのモデルは、トレーニングデータに固有のバイアスを学習することが多く、ライトやダークスキンのトーンを持つ人の診断において、パフォーマンスのギャップを生じさせる可能性がある。
論文 参考訳(メタデータ) (2022-02-28T15:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。