論文の概要: Beyond the Surface: A Global-Scale Analysis of Visual Stereotypes in
Text-to-Image Generation
- arxiv url: http://arxiv.org/abs/2401.06310v1
- Date: Fri, 12 Jan 2024 00:43:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 20:45:27.840485
- Title: Beyond the Surface: A Global-Scale Analysis of Visual Stereotypes in
Text-to-Image Generation
- Title(参考訳): 表面を超えて:テキスト・画像生成における視覚ステレオタイプの分析
- Authors: Akshita Jha, Vinodkumar Prabhakaran, Remi Denton, Sarah Laszlo, Shachi
Dave, Rida Qadri, Chandan K. Reddy, Sunipa Dev
- Abstract要約: 我々は既存のステレオタイプベンチマークを用いて、世界規模で視覚ステレオタイプを特定し評価する。
生成した画像の描写が、異なる国籍に対してどう異なるかについて検討する。
- 参考スコア(独自算出の注目度): 25.797828188371604
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent studies have highlighted the issue of stereotypical depictions for
people of different identity groups in Text-to-Image (T2I) model generations.
However, these existing approaches have several key limitations, including a
noticeable lack of coverage of global identity groups in their evaluation, and
the range of their associated stereotypes. Additionally, they often lack a
critical distinction between inherently visual stereotypes, such as
`underweight' or `sombrero', and culturally dependent stereotypes like
`attractive' or `terrorist'. In this work, we address these limitations with a
multifaceted approach that leverages existing textual resources to ground our
evaluation of geo-cultural stereotypes in the generated images from T2I models.
We employ existing stereotype benchmarks to identify and evaluate visual
stereotypes at a global scale, spanning 135 nationality-based identity groups.
We demonstrate that stereotypical attributes are thrice as likely to be present
in images of these identities as compared to other attributes. We further
investigate how disparately offensive the depictions of generated images are
for different nationalities. Finally, through a detailed case study, we reveal
how the 'default' representations of all identity groups have a stereotypical
appearance. Moreover, for the Global South, images across different attributes
are visually similar, even when explicitly prompted otherwise. CONTENT WARNING:
Some examples may contain offensive stereotypes.
- Abstract(参考訳): 最近の研究では、テキスト・ツー・イメージ(t2i)モデル世代における異なるアイデンティティグループの人々のためのステレオタイプ描写の問題が強調されている。
しかしながら、これらの既存のアプローチには、評価におけるグローバルアイデンティティグループの範囲の顕著な欠如や、関連するステレオタイプの範囲など、いくつかの重要な制限がある。
さらに、それらは「アンダーウェイト」や「ソンブレロ」のような本質的に視覚的なステレオタイプと、「魅力」や「テロ主義者」のような文化的に依存するステレオタイプとを区別しないことが多い。
本稿では,t2iモデルから生成した画像における地理文化的ステレオタイプの評価を行うために,既存のテクスト資源を活用する多面的手法を用いて,これらの制約に対処する。
我々は既存のステレオタイプベンチマークを用いて、世界規模で視覚ステレオタイプを特定し評価し、国籍に基づくアイデンティティグループ135にまたがる。
ステレオタイプ属性は,他の属性と比較して,これらの特徴のイメージに存在する可能性が示唆された。
さらに、生成した画像の描写が、異なる国籍に対してどう異なるかについて検討する。
最後に、詳細なケーススタディを通じて、すべての同一性群の「デフォルト」表現がどのようにステレオタイプ的外観を持つかを明らかにする。
さらに、グローバル・サウスでは、異なる属性にまたがるイメージが視覚的に類似している。
Content WARNING: 攻撃的なステレオタイプを含む場合もある。
関連論文リスト
- Who is better at math, Jenny or Jingzhen? Uncovering Stereotypes in Large Language Models [9.734705470760511]
我々はGlobalBiasを使って世界中の幅広いステレオタイプを研究しています。
与えられた名前に基づいて文字プロファイルを生成し、モデル出力におけるステレオタイプの有効性を評価する。
論文 参考訳(メタデータ) (2024-07-09T14:52:52Z) - Vision-Language Models under Cultural and Inclusive Considerations [53.614528867159706]
視覚言語モデル(VLM)は、日常生活の画像を記述することで視覚障害者を支援する。
現在の評価データセットは、多様な文化的ユーザ背景や、このユースケースの状況を反映していない可能性がある。
我々は、字幕の好みを決定するための調査を作成し、視覚障害者によって撮影された画像を含む既存のデータセットであるVizWizをフィルタリングすることで、文化中心の評価ベンチマークを提案する。
次に,複数のVLMを評価し,その信頼性を文化的に多様な環境で視覚アシスタントとして検証した。
論文 参考訳(メタデータ) (2024-07-08T17:50:00Z) - The Male CEO and the Female Assistant: Evaluation and Mitigation of Gender Biases in Text-To-Image Generation of Dual Subjects [58.27353205269664]
本稿では,Paired Stereotype Test (PST) フレームワークを提案する。
PSTクエリT2Iモデルは、男性ステレオタイプと女性ステレオタイプに割り当てられた2つの個人を描写する。
PSTを用いて、ジェンダーバイアスの2つの側面、つまり、ジェンダーの職業におけるよく知られたバイアスと、組織力におけるバイアスという新しい側面を評価する。
論文 参考訳(メタデータ) (2024-02-16T21:32:27Z) - 'Person' == Light-skinned, Western Man, and Sexualization of Women of
Color: Stereotypes in Stable Diffusion [5.870257045294649]
我々は、最も人気のあるテキスト・画像生成装置の1つに埋め込まれたステレオタイプについて研究する。
性別・国籍・大陸アイデンティティのステレオタイプが,そのような情報がない状態で安定拡散表示を行うかを検討する。
論文 参考訳(メタデータ) (2023-10-30T19:57:01Z) - Building Socio-culturally Inclusive Stereotype Resources with Community
Engagement [9.131536842607069]
インド社会の文脈における評価資源の社会的に意識した拡大、特にステレオタイピングの害について示す。
結果として得られた資源は、インドの文脈で知られているステレオタイプの数を増やし、多くのユニークなアイデンティティにわたって1000以上のステレオタイプを拡大する。
論文 参考訳(メタデータ) (2023-07-20T01:26:34Z) - SeeGULL: A Stereotype Benchmark with Broad Geo-Cultural Coverage
Leveraging Generative Models [15.145145928670827]
SeeGULLは英語の広い範囲のステレオタイプデータセットである。
6大陸にまたがる8つの異なる地政学的領域にまたがる178か国にまたがるアイデンティティグループに関するステレオタイプを含んでいる。
また、異なるステレオタイプに対するきめ細かい攻撃性スコアも含み、そのグローバルな格差を示す。
論文 参考訳(メタデータ) (2023-05-19T17:30:19Z) - Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。
我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。
我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文 参考訳(メタデータ) (2023-03-20T19:32:49Z) - Easily Accessible Text-to-Image Generation Amplifies Demographic
Stereotypes at Large Scale [61.555788332182395]
危険で複雑なステレオタイプを増幅する機械学習モデルの可能性を検討する。
さまざまな通常のプロンプトがステレオタイプを生成しており、それらは単に特性、記述子、職業、オブジェクトに言及するプロンプトを含む。
論文 参考訳(メタデータ) (2022-11-07T18:31:07Z) - The Principle of Diversity: Training Stronger Vision Transformers Calls
for Reducing All Levels of Redundancy [111.49944789602884]
本稿では,パッチ埋め込み,アテンションマップ,ウェイトスペースという3つのレベルにおいて,冗長性のユビキタスな存在を体系的に研究する。
各レベルにおける表現の多様性とカバレッジを促進するための対応正規化器を提案する。
論文 参考訳(メタデータ) (2022-03-12T04:48:12Z) - Fairness for Image Generation with Uncertain Sensitive Attributes [97.81354305427871]
この研究は、画像超解像のような生成手順の文脈における公平性の問題に取り組む。
伝統的群フェアネスの定義は通常、指定された保護された群に関して定義されるが、本質的な真偽は存在しないことを強調する。
人口比率の自然拡大はグループ化に強く依存しており、明白に達成可能であることを示す。
論文 参考訳(メタデータ) (2021-06-23T06:17:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。