Fugu-MT 論文翻訳(概要): Beyond the Surface: A Global-Scale Analysis of Visual Stereotypes in Text-to-Image Generation

論文の概要: Beyond the Surface: A Global-Scale Analysis of Visual Stereotypes in Text-to-Image Generation

arxiv url: http://arxiv.org/abs/2401.06310v1
Date: Fri, 12 Jan 2024 00:43:57 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-15 20:45:27.840485
Title: Beyond the Surface: A Global-Scale Analysis of Visual Stereotypes in Text-to-Image Generation
Title（参考訳）: 表面を超えて:テキスト・画像生成における視覚ステレオタイプの分析
Authors: Akshita Jha, Vinodkumar Prabhakaran, Remi Denton, Sarah Laszlo, Shachi Dave, Rida Qadri, Chandan K. Reddy, Sunipa Dev
Abstract要約: 我々は既存のステレオタイプベンチマークを用いて、世界規模で視覚ステレオタイプを特定し評価する。生成した画像の描写が、異なる国籍に対してどう異なるかについて検討する。
参考スコア（独自算出の注目度）: 25.797828188371604
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent studies have highlighted the issue of stereotypical depictions for people of different identity groups in Text-to-Image (T2I) model generations. However, these existing approaches have several key limitations, including a noticeable lack of coverage of global identity groups in their evaluation, and the range of their associated stereotypes. Additionally, they often lack a critical distinction between inherently visual stereotypes, such as `underweight' or `sombrero', and culturally dependent stereotypes like `attractive' or `terrorist'. In this work, we address these limitations with a multifaceted approach that leverages existing textual resources to ground our evaluation of geo-cultural stereotypes in the generated images from T2I models. We employ existing stereotype benchmarks to identify and evaluate visual stereotypes at a global scale, spanning 135 nationality-based identity groups. We demonstrate that stereotypical attributes are thrice as likely to be present in images of these identities as compared to other attributes. We further investigate how disparately offensive the depictions of generated images are for different nationalities. Finally, through a detailed case study, we reveal how the 'default' representations of all identity groups have a stereotypical appearance. Moreover, for the Global South, images across different attributes are visually similar, even when explicitly prompted otherwise. CONTENT WARNING: Some examples may contain offensive stereotypes.
Abstract（参考訳）: 最近の研究では、テキスト・ツー・イメージ(t2i)モデル世代における異なるアイデンティティグループの人々のためのステレオタイプ描写の問題が強調されている。しかしながら、これらの既存のアプローチには、評価におけるグローバルアイデンティティグループの範囲の顕著な欠如や、関連するステレオタイプの範囲など、いくつかの重要な制限がある。さらに、それらは「アンダーウェイト」や「ソンブレロ」のような本質的に視覚的なステレオタイプと、「魅力」や「テロ主義者」のような文化的に依存するステレオタイプとを区別しないことが多い。本稿では,t2iモデルから生成した画像における地理文化的ステレオタイプの評価を行うために,既存のテクスト資源を活用する多面的手法を用いて,これらの制約に対処する。我々は既存のステレオタイプベンチマークを用いて、世界規模で視覚ステレオタイプを特定し評価し、国籍に基づくアイデンティティグループ135にまたがる。ステレオタイプ属性は,他の属性と比較して,これらの特徴のイメージに存在する可能性が示唆された。さらに、生成した画像の描写が、異なる国籍に対してどう異なるかについて検討する。最後に、詳細なケーススタディを通じて、すべての同一性群の「デフォルト」表現がどのようにステレオタイプ的外観を持つかを明らかにする。さらに、グローバル・サウスでは、異なる属性にまたがるイメージが視覚的に類似している。 Content WARNING: 攻撃的なステレオタイプを含む場合もある。

関連論文リスト

Can we Debias Social Stereotypes in AI-Generated Images? Examining Text-to-Image Outputs and User Perceptions [6.87895735248661]
本稿では,T2I出力の社会的バイアスを評価するために,理論駆動型バイアス検出ルーブリックと社会ステレオタイプ指標(SSI)を提案する。我々は,T2Iモデルの3つの主要なアウトプットを,地理的・職業的・形容詞的な3つのカテゴリにわたる100のクエリを用いて監査した。迅速な改良はステレオタイプを緩和するが、コンテキストアライメントを制限することができる。
論文参考訳（メタデータ） (2025-05-27T04:01:03Z)
StereoDetect: Detecting Stereotypes and Anti-stereotypes the Correct Way Using Social Psychological Underpinnings [47.02959423049043]
ステレオタイプとアンチステレオタイプの検出は、社会的知識を必要とする問題である。本稿では, ステレオタイプ, アンチステレオタイプ, ステレオタイプバイアス, 一般バイアスの5つの定義を提案する。サブ10B言語モデルとGPT-4oは、しばしば反ステレオタイプを誤分類し、中立的過一般化を認識できないことを示す。
論文参考訳（メタデータ） (2025-04-04T11:14:38Z)
Visual Cues of Gender and Race are Associated with Stereotyping in Vision-Language Models [0.2812395851874055]
プロトタイプ性が異なる標準化された顔画像を用いて、4つの視覚言語モデルを用いて、オープンエンドコンテキストにおける特徴関連と均質性バイアスの両方を検査する。 VLMは男性に比べて一貫して女性向けの均一なストーリーを生成しており、外見がより独特な人はより均一に表現される。特徴的関連性については、ステレオタイピングと黒人が全てのモデルで一貫してバスケットボールと結びついているという限られた証拠が得られ、他の人種的関連性(芸術、医療、外見など)は特定のVLMによって異なる。
論文参考訳（メタデータ） (2025-03-07T02:25:16Z)
OASIS Uncovers: High-Quality T2I Models, Same Old Stereotypes [12.89895306269771]
テキスト・トゥ・イメージ(T2I)モデルによって生成された画像は、しばしば文化や職業といった概念の視覚的バイアスやステレオタイプを示す。本稿では,その社会学的定義に沿ったステレオタイプを定量的に測定する。 OASISには、生成された画像データセットからステレオタイプを測定するための2つのスコアが含まれている。
論文参考訳（メタデータ） (2025-01-01T21:47:52Z)
Who is better at math, Jenny or Jingzhen? Uncovering Stereotypes in Large Language Models [9.734705470760511]
我々はGlobalBiasを使って世界中の幅広いステレオタイプを研究しています。与えられた名前に基づいて文字プロファイルを生成し、モデル出力におけるステレオタイプの有効性を評価する。
論文参考訳（メタデータ） (2024-07-09T14:52:52Z)
Vision-Language Models under Cultural and Inclusive Considerations [53.614528867159706]
視覚言語モデル(VLM)は、日常生活の画像を記述することで視覚障害者を支援する。現在の評価データセットは、多様な文化的ユーザ背景や、このユースケースの状況を反映していない可能性がある。我々は、字幕の好みを決定するための調査を作成し、視覚障害者によって撮影された画像を含む既存のデータセットであるVizWizをフィルタリングすることで、文化中心の評価ベンチマークを提案する。次に,複数のVLMを評価し,その信頼性を文化的に多様な環境で視覚アシスタントとして検証した。
論文参考訳（メタデータ） (2024-07-08T17:50:00Z)
The Male CEO and the Female Assistant: Evaluation and Mitigation of Gender Biases in Text-To-Image Generation of Dual Subjects [58.27353205269664]
本稿では,Paired Stereotype Test (PST) フレームワークを提案する。 PSTクエリT2Iモデルは、男性ステレオタイプと女性ステレオタイプに割り当てられた2つの個人を描写する。 PSTを用いて、ジェンダーバイアスの2つの側面、つまり、ジェンダーの職業におけるよく知られたバイアスと、組織力におけるバイアスという新しい側面を評価する。
論文参考訳（メタデータ） (2024-02-16T21:32:27Z)
'Person' == Light-skinned, Western Man, and Sexualization of Women of Color: Stereotypes in Stable Diffusion [5.870257045294649]
我々は、最も人気のあるテキスト・画像生成装置の1つに埋め込まれたステレオタイプについて研究する。性別・国籍・大陸アイデンティティのステレオタイプが,そのような情報がない状態で安定拡散表示を行うかを検討する。
論文参考訳（メタデータ） (2023-10-30T19:57:01Z)
Will the Prince Get True Love's Kiss? On the Model Sensitivity to Gender Perturbation over Fairytale Texts [80.21033860436081]
本稿では, モデルが非現実的データ拡張を通じて, ジェンダーステレオタイプ摂動にどう反応するかを検討する。実験結果から, 性別の摂動に直面すると, モデルの性能低下がわずかであることがわかった。反現実的なトレーニングデータに基づいて微調整を行うと、モデルは反ステレオタイプな物語に対してより堅牢になる。
論文参考訳（メタデータ） (2023-10-16T22:25:09Z)
Building Socio-culturally Inclusive Stereotype Resources with Community Engagement [9.131536842607069]
インド社会の文脈における評価資源の社会的に意識した拡大、特にステレオタイピングの害について示す。結果として得られた資源は、インドの文脈で知られているステレオタイプの数を増やし、多くのユニークなアイデンティティにわたって1000以上のステレオタイプを拡大する。
論文参考訳（メタデータ） (2023-07-20T01:26:34Z)
SeeGULL: A Stereotype Benchmark with Broad Geo-Cultural Coverage Leveraging Generative Models [15.145145928670827]
SeeGULLは英語の広い範囲のステレオタイプデータセットである。 6大陸にまたがる8つの異なる地政学的領域にまたがる178か国にまたがるアイデンティティグループに関するステレオタイプを含んでいる。また、異なるステレオタイプに対するきめ細かい攻撃性スコアも含み、そのグローバルな格差を示す。
論文参考訳（メタデータ） (2023-05-19T17:30:19Z)
Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文参考訳（メタデータ） (2023-03-20T19:32:49Z)
Easily Accessible Text-to-Image Generation Amplifies Demographic Stereotypes at Large Scale [61.555788332182395]
危険で複雑なステレオタイプを増幅する機械学習モデルの可能性を検討する。さまざまな通常のプロンプトがステレオタイプを生成しており、それらは単に特性、記述子、職業、オブジェクトに言及するプロンプトを含む。
論文参考訳（メタデータ） (2022-11-07T18:31:07Z)
The Principle of Diversity: Training Stronger Vision Transformers Calls for Reducing All Levels of Redundancy [111.49944789602884]
本稿では,パッチ埋め込み,アテンションマップ,ウェイトスペースという3つのレベルにおいて,冗長性のユビキタスな存在を体系的に研究する。各レベルにおける表現の多様性とカバレッジを促進するための対応正規化器を提案する。
論文参考訳（メタデータ） (2022-03-12T04:48:12Z)
Fairness for Image Generation with Uncertain Sensitive Attributes [97.81354305427871]
この研究は、画像超解像のような生成手順の文脈における公平性の問題に取り組む。伝統的群フェアネスの定義は通常、指定された保護された群に関して定義されるが、本質的な真偽は存在しないことを強調する。人口比率の自然拡大はグループ化に強く依存しており、明白に達成可能であることを示す。
論文参考訳（メタデータ） (2021-06-23T06:17:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。