論文の概要: Bias Amplification in Stable Diffusion's Representation of Stigma Through Skin Tones and Their Homogeneity
- arxiv url: http://arxiv.org/abs/2508.17465v1
- Date: Sun, 24 Aug 2025 17:47:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.538781
- Title: Bias Amplification in Stable Diffusion's Representation of Stigma Through Skin Tones and Their Homogeneity
- Title(参考訳): 安定拡散のスキントーンによるスティグマ表現におけるバイアス増幅とその均一性
- Authors: Kyra Wilson, Sourojit Ghosh, Aylin Caliskan,
- Abstract要約: テキスト・ツー・イメージ・ジェネレータ(T2Is)は、社会的ステレオタイプを永続する画像を生成する責任がある。
安定拡散の3つのバージョンが、画像中の特定の皮膚のトーンとスティグマタイズされたアイデンティティを関連付けることを判断するために、93種類のスティグマタイズされたアイデンティティの包括的セットを用いている。
- 参考スコア(独自算出の注目度): 11.26615855554004
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Text-to-image generators (T2Is) are liable to produce images that perpetuate social stereotypes, especially in regards to race or skin tone. We use a comprehensive set of 93 stigmatized identities to determine that three versions of Stable Diffusion (v1.5, v2.1, and XL) systematically associate stigmatized identities with certain skin tones in generated images. We find that SD XL produces skin tones that are 13.53% darker and 23.76% less red (both of which indicate higher likelihood of societal discrimination) than previous models and perpetuate societal stereotypes associating people of color with stigmatized identities. SD XL also shows approximately 30% less variability in skin tones when compared to previous models and 18.89-56.06% compared to human face datasets. Measuring variability through metrics which directly correspond to human perception suggest a similar pattern, where SD XL shows the least amount of variability in skin tones of people with stigmatized identities and depicts most (60.29%) stigmatized identities as being less diverse than non-stigmatized identities. Finally, SD shows more homogenization of skin tones of racial and ethnic identities compared to other stigmatized or non-stigmatized identities, reinforcing incorrect equivalence of biologically-determined skin tone and socially-constructed racial and ethnic identity. Because SD XL is the largest and most complex model and users prefer its generations compared to other models examined in this study, these findings have implications for the dynamics of bias amplification in T2Is, increasing representational harms and challenges generating diverse images depicting people with stigmatized identities.
- Abstract(参考訳): テキスト・ツー・イメージ・ジェネレータ(T2Is)は、特に人種や肌のトーンに関して、社会的なステレオタイプを永続するイメージを生成する責任がある。
安定拡散(v1.5,v2.1,XL)の3つのバージョンが、生成した画像中の特定の皮膚のトーンと分類されたIDを体系的に関連付けることを判断するために、93個のスティグマタイズIDの包括的セットを用いる。
SD XLは従来のモデルよりも13.53%の暗さと23.76%の赤さ(どちらも社会的差別の可能性が高かった)の皮膚のトーンを生産し、着色した人物と識別された人物を連想させる社会のステレオタイプを持続させることが判明した。
SD XLは、以前のモデルと比べて肌の色調の変動が約30%減少し、18.89-56.06%が人間の顔データと比較された。
SD XLは、スティグマタイズされたアイデンティティを持つ人の肌のトーンにおける変動の最小量を示し、多くの(60.29%)スティグマタイズされたアイデンティティは、非スティグマタイズされたアイデンティティよりも多様性が低いと描写している。
最後に、SDは、生物学的に決定された皮膚のトーンと社会的に構築された人種的および民族的アイデンティティの不正な同値性を強化する他のスティグマティズドまたは非スティグマティズドIDと比較して、人種的および民族的アイデンティティの皮膚のトーンの均質化がより進んでいる。
SD XLは最大かつ最も複雑なモデルであり、ユーザーは他のモデルと比較して世代を選好するので、これらの発見はT2Isにおけるバイアス増幅のダイナミクス、表現上の害の増大、および、分類されたアイデンティティを持つ人々を描いた多様な画像の生成に影響を及ぼす。
関連論文リスト
- Are generative models fair? A study of racial bias in dermatological image generation [15.812312064457865]
臨床皮膚学における生成モデルの妥当性を,人種的偏見から評価した。
Fitzpatrick17kデータセットを用いて、人種的バイアスがこれらのモデルの表現と性能にどのように影響するかを調べる。
論文 参考訳(メタデータ) (2025-01-20T21:24:15Z) - Vision-Language Models Generate More Homogeneous Stories for Phenotypically Black Individuals [0.0]
本研究では,人種的特徴が視覚言語モデルのアウトプットに与える影響について検討した。
まず、VLMは、表現特異性が高い黒人について、より均質なストーリーを生成する。
第二に、黒人女性に関する話は、すべてのモデルでテストされた黒人男性に関する話よりもずっと均一である。
第3に、この均質性バイアスは、主に黒人女性のコンテンツ変化に顕著に影響を及ぼすが、黒人男性にはほとんど影響を与えない、顕著な相互作用によって引き起こされる。
論文 参考訳(メタデータ) (2024-12-12T18:53:49Z) - FairSkin: Fair Diffusion for Skin Disease Image Generation [54.29840149709033]
拡散モデル (DM) は, 合成医用画像の生成において主要な手法となっているが, 臨界二倍偏差に悩まされている。
このようなバイアスを3段階のリサンプリング機構によって緩和する新しいDMフレームワークであるFairSkinを提案する。
本手法は, 画像の多様性と品質を著しく向上させ, 臨床環境における皮膚疾患の検出精度の向上に寄与する。
論文 参考訳(メタデータ) (2024-10-29T21:37:03Z) - ID$^3$: Identity-Preserving-yet-Diversified Diffusion Models for Synthetic Face Recognition [60.15830516741776]
合成顔認識(SFR)は、実際の顔データの分布を模倣するデータセットを生成することを目的としている。
拡散燃料SFRモデルであるtextID3$を紹介します。
textID3$はID保存損失を利用して、多様だがアイデンティティに一貫性のある顔の外観を生成する。
論文 参考訳(メタデータ) (2024-09-26T06:46:40Z) - The Factuality Tax of Diversity-Intervened Text-to-Image Generation: Benchmark and Fact-Augmented Intervention [61.80236015147771]
我々は多様性の介入とT2Iモデルにおける人口統計学的事実性とのトレードオフを定量化する。
DoFaiRの実験では、多様性指向の指示によって、性別や人種の異なる集団の数が増加することが明らかになった。
本研究では,歴史における世代ごとのジェンダーや人種構成について,言語化された事実情報を反映したFact-Augmented Intervention (FAI)を提案する。
論文 参考訳(メタデータ) (2024-06-29T09:09:42Z) - AI-generated faces influence gender stereotypes and racial homogenization [1.6647208383676708]
6つの人種、2つの性別、32の専門職、8つの属性にまたがる安定拡散の重大なバイアスを文書化しています。
この分析は、ほぼすべての中東の男性がひげを生やし、茶色く肌を生やし、伝統的な服装を身に着けている、重要な人種的均質化を示している。
本稿では、画像を生成する際に、人種や性別の望ましい分布をユーザが指定できるようにデバイアス化ソリューションを提案する。
論文 参考訳(メタデータ) (2024-02-01T20:32:14Z) - Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。
我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。
我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文 参考訳(メタデータ) (2023-03-20T19:32:49Z) - Asymmetric Rejection Loss for Fairer Face Recognition [1.52292571922932]
訓練データセットの人種的不均衡により、異なる民族集団間での顔認識性能の違いが示されている。
これは実際には、顔のデータセットが通常収集されるセロブドムにおける非コーカサス民族集団の下位表現にシンプトマティックである。
本研究は,非表示群をフル活用することを目的とした非対称リジェクションロスを提案する。
論文 参考訳(メタデータ) (2020-02-09T04:01:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。