論文の概要: Beyond the Surface: A Global-Scale Analysis of Visual Stereotypes in
Text-to-Image Generation
- arxiv url: http://arxiv.org/abs/2401.06310v1
- Date: Fri, 12 Jan 2024 00:43:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 20:45:27.840485
- Title: Beyond the Surface: A Global-Scale Analysis of Visual Stereotypes in
Text-to-Image Generation
- Title(参考訳): 表面を超えて:テキスト・画像生成における視覚ステレオタイプの分析
- Authors: Akshita Jha, Vinodkumar Prabhakaran, Remi Denton, Sarah Laszlo, Shachi
Dave, Rida Qadri, Chandan K. Reddy, Sunipa Dev
- Abstract要約: 我々は既存のステレオタイプベンチマークを用いて、世界規模で視覚ステレオタイプを特定し評価する。
生成した画像の描写が、異なる国籍に対してどう異なるかについて検討する。
- 参考スコア(独自算出の注目度): 25.797828188371604
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent studies have highlighted the issue of stereotypical depictions for
people of different identity groups in Text-to-Image (T2I) model generations.
However, these existing approaches have several key limitations, including a
noticeable lack of coverage of global identity groups in their evaluation, and
the range of their associated stereotypes. Additionally, they often lack a
critical distinction between inherently visual stereotypes, such as
`underweight' or `sombrero', and culturally dependent stereotypes like
`attractive' or `terrorist'. In this work, we address these limitations with a
multifaceted approach that leverages existing textual resources to ground our
evaluation of geo-cultural stereotypes in the generated images from T2I models.
We employ existing stereotype benchmarks to identify and evaluate visual
stereotypes at a global scale, spanning 135 nationality-based identity groups.
We demonstrate that stereotypical attributes are thrice as likely to be present
in images of these identities as compared to other attributes. We further
investigate how disparately offensive the depictions of generated images are
for different nationalities. Finally, through a detailed case study, we reveal
how the 'default' representations of all identity groups have a stereotypical
appearance. Moreover, for the Global South, images across different attributes
are visually similar, even when explicitly prompted otherwise. CONTENT WARNING:
Some examples may contain offensive stereotypes.
- Abstract(参考訳): 最近の研究では、テキスト・ツー・イメージ(t2i)モデル世代における異なるアイデンティティグループの人々のためのステレオタイプ描写の問題が強調されている。
しかしながら、これらの既存のアプローチには、評価におけるグローバルアイデンティティグループの範囲の顕著な欠如や、関連するステレオタイプの範囲など、いくつかの重要な制限がある。
さらに、それらは「アンダーウェイト」や「ソンブレロ」のような本質的に視覚的なステレオタイプと、「魅力」や「テロ主義者」のような文化的に依存するステレオタイプとを区別しないことが多い。
本稿では,t2iモデルから生成した画像における地理文化的ステレオタイプの評価を行うために,既存のテクスト資源を活用する多面的手法を用いて,これらの制約に対処する。
我々は既存のステレオタイプベンチマークを用いて、世界規模で視覚ステレオタイプを特定し評価し、国籍に基づくアイデンティティグループ135にまたがる。
ステレオタイプ属性は,他の属性と比較して,これらの特徴のイメージに存在する可能性が示唆された。
さらに、生成した画像の描写が、異なる国籍に対してどう異なるかについて検討する。
最後に、詳細なケーススタディを通じて、すべての同一性群の「デフォルト」表現がどのようにステレオタイプ的外観を持つかを明らかにする。
さらに、グローバル・サウスでは、異なる属性にまたがるイメージが視覚的に類似している。
Content WARNING: 攻撃的なステレオタイプを含む場合もある。
関連論文リスト
- The Male CEO and the Female Assistant: Probing Gender Biases in
Text-To-Image Models Through Paired Stereotype Test [68.84245853250906]
DALLE-3のような最近の大規模テキスト・ツー・イメージ(T2I)モデルは、新しいアプリケーションにおいて大きな可能性を秘めているが、前例のない公平さの課題に直面している。
本稿では,Paired Stereotype Test (PST) のバイアス評価フレームワークを提案する。
以上の結果から,現代T2Iモデルにおける男女差の複雑なパターンが明らかとなり,マルチモーダル生成システムにおける批判的公平性の課題が浮き彫りになった。
論文 参考訳(メタデータ) (2024-02-16T21:32:27Z) - 'Person' == Light-skinned, Western Man, and Sexualization of Women of
Color: Stereotypes in Stable Diffusion [5.870257045294649]
我々は、最も人気のあるテキスト・画像生成装置の1つに埋め込まれたステレオタイプについて研究する。
性別・国籍・大陸アイデンティティのステレオタイプが,そのような情報がない状態で安定拡散表示を行うかを検討する。
論文 参考訳(メタデータ) (2023-10-30T19:57:01Z) - Building Socio-culturally Inclusive Stereotype Resources with Community
Engagement [9.131536842607069]
インド社会の文脈における評価資源の社会的に意識した拡大、特にステレオタイピングの害について示す。
結果として得られた資源は、インドの文脈で知られているステレオタイプの数を増やし、多くのユニークなアイデンティティにわたって1000以上のステレオタイプを拡大する。
論文 参考訳(メタデータ) (2023-07-20T01:26:34Z) - Stereotypes and Smut: The (Mis)representation of Non-cisgender
Identities by Text-to-Image Models [6.92043136971035]
マルチモーダルモデルが男女同一性をどのように扱うかを検討する。
特定の非シスジェンダーのアイデンティティは、人間より少なく、ステレオタイプで、性的にも、一貫して(ミス)表現されている。
これらの改善は、影響のあるコミュニティによって変革が導かれる未来への道を開く可能性がある。
論文 参考訳(メタデータ) (2023-05-26T16:28:49Z) - SeeGULL: A Stereotype Benchmark with Broad Geo-Cultural Coverage
Leveraging Generative Models [15.145145928670827]
SeeGULLは英語の広い範囲のステレオタイプデータセットである。
6大陸にまたがる8つの異なる地政学的領域にまたがる178か国にまたがるアイデンティティグループに関するステレオタイプを含んでいる。
また、異なるステレオタイプに対するきめ細かい攻撃性スコアも含み、そのグローバルな格差を示す。
論文 参考訳(メタデータ) (2023-05-19T17:30:19Z) - Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。
我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。
我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文 参考訳(メタデータ) (2023-03-20T19:32:49Z) - Easily Accessible Text-to-Image Generation Amplifies Demographic
Stereotypes at Large Scale [61.555788332182395]
危険で複雑なステレオタイプを増幅する機械学習モデルの可能性を検討する。
さまざまな通常のプロンプトがステレオタイプを生成しており、それらは単に特性、記述子、職業、オブジェクトに言及するプロンプトを含む。
論文 参考訳(メタデータ) (2022-11-07T18:31:07Z) - How well can Text-to-Image Generative Models understand Ethical Natural
Language Interventions? [67.97752431429865]
倫理的介入を加える際の画像の多様性への影響について検討した。
予備研究は、モデル予測の大きな変化が「性別の無視」のような特定のフレーズによって引き起こされることを示している。
論文 参考訳(メタデータ) (2022-10-27T07:32:39Z) - The Principle of Diversity: Training Stronger Vision Transformers Calls
for Reducing All Levels of Redundancy [111.49944789602884]
本稿では,パッチ埋め込み,アテンションマップ,ウェイトスペースという3つのレベルにおいて,冗長性のユビキタスな存在を体系的に研究する。
各レベルにおける表現の多様性とカバレッジを促進するための対応正規化器を提案する。
論文 参考訳(メタデータ) (2022-03-12T04:48:12Z) - Fairness for Image Generation with Uncertain Sensitive Attributes [97.81354305427871]
この研究は、画像超解像のような生成手順の文脈における公平性の問題に取り組む。
伝統的群フェアネスの定義は通常、指定された保護された群に関して定義されるが、本質的な真偽は存在しないことを強調する。
人口比率の自然拡大はグループ化に強く依存しており、明白に達成可能であることを示す。
論文 参考訳(メタデータ) (2021-06-23T06:17:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。