論文の概要: Interpretations, Representations, and Stereotypes of Caste within Text-to-Image Generators
- arxiv url: http://arxiv.org/abs/2408.01590v1
- Date: Fri, 2 Aug 2024 22:06:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-06 19:30:18.805359
- Title: Interpretations, Representations, and Stereotypes of Caste within Text-to-Image Generators
- Title(参考訳): テキスト・画像・ジェネレータにおける鋳物の解釈・表現・ステレオタイプ
- Authors: Sourojit Ghosh,
- Abstract要約: 本稿では,T2I研究における悲劇的に未解明な文脈を取り巻く解釈,表現,ステレオタイプについて述べる。
我々は、T2I安定拡散が、様々なキャストの人々をいかに表示するか、そして、彼らが演じている職業をどう表現するかを考察する。
以上の結果から, 安定拡散は「キャスタレスネス」の系を永久に出力し, 高いキャスタネスと同一視し, 貧困の指標とキャスタブルに抑圧されたアイデンティティを表現していることが明らかとなった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The surge in the popularity of text-to-image generators (T2Is) has been matched by extensive research into ensuring fairness and equitable outcomes, with a focus on how they impact society. However, such work has typically focused on globally-experienced identities or centered Western contexts. In this paper, we address interpretations, representations, and stereotypes surrounding a tragically underexplored context in T2I research: caste. We examine how the T2I Stable Diffusion displays people of various castes, and what professions they are depicted as performing. Generating 100 images per prompt, we perform CLIP-cosine similarity comparisons with default depictions of an 'Indian person' by Stable Diffusion, and explore patterns of similarity. Our findings reveal how Stable Diffusion outputs perpetuate systems of 'castelessness', equating Indianness with high-castes and depicting caste-oppressed identities with markers of poverty. In particular, we note the stereotyping and representational harm towards the historically-marginalized Dalits, prominently depicted as living in rural areas and always at protests. Our findings underscore a need for a caste-aware approach towards T2I design, and we conclude with design recommendations.
- Abstract(参考訳): テキスト・ツー・イメージ・ジェネレータ(T2Is)の普及は、公正性と公平な結果の確保に関する広範な研究と、それらが社会に与える影響に焦点が当てられている。
しかし、このような研究は一般的に、世界的な経験のあるアイデンティティや、西洋の文脈中心に焦点を絞ったものである。
本稿では,T2I研究における悲劇的に未解明な文脈を取り巻く解釈,表現,ステレオタイプについて述べる。
我々は、T2I安定拡散が、様々なキャストの人々をいかに表示するか、そして、彼らが演じている職業をどう表現するかを考察する。
1プロンプトあたり100個の画像を生成し、安定拡散による「インド人」の既定描写とCLIP-cosine類似性の比較を行い、類似性のパターンを探索する。
以上の結果から, 安定拡散は「キャスタレスネス」の系を永久に出力し, 高いキャスタネスと同一視し, 貧困の指標とキャスタブルに抑圧されたアイデンティティを表現していることが明らかとなった。
特に、歴史的に結婚したダリト族に対するステレオタイプと表現上の害は、農村部に住み、常に抗議活動で顕著に描写されている。
以上の結果から,T2I設計に対するキャストアウェアアプローチの必要性が浮き彫りにされ,デザインレコメンデーションで結論が得られた。
関連論文リスト
- "I don't see myself represented here at all": User Experiences of Stable Diffusion Outputs Containing Representational Harms across Gender Identities and Nationalities [4.4212441764241]
133人のクラウドワーカーによるクラウドソースデータと、多様な国や性別における14の半構造化インタビューを組み合わせることで、安定拡散に関する最大の人的研究を行う。
われわれはまず,安定拡散出力に対するユーザ期待と,そのような期待から遠く離れたイメージを提供する人物の安定拡散反射のセットによって証明された出力との大規模な不一致を実証した。
そして、この一般的な不満の発見を、安定拡散によって引き起こされる表現的害、特に伝統的に疎外化されたアイデンティティを持つ被験者の強調に拡張する。
論文 参考訳(メタデータ) (2024-08-02T22:37:50Z) - Discriminative Probing and Tuning for Text-to-Image Generation [129.39674951747412]
テキスト・ツー・イメージ生成(T2I)は、しばしば、生成された画像における関係の混乱のようなテキスト・イメージの誤調整問題に直面している。
本稿では,T2Iモデルの識別能力を向上し,より正確なテキストと画像のアライメントを実現することを提案する。
本稿では,T2Iモデル上に構築された識別アダプターを用いて,2つの代表課題における識別能力を探索し,テキスト画像のアライメントを改善するために識別微調整を利用する。
論文 参考訳(メタデータ) (2024-03-07T08:37:33Z) - The Male CEO and the Female Assistant: Evaluation and Mitigation of Gender Biases in Text-To-Image Generation of Dual Subjects [58.27353205269664]
本稿では,Paired Stereotype Test (PST) フレームワークを提案する。
PSTクエリT2Iモデルは、男性ステレオタイプと女性ステレオタイプに割り当てられた2つの個人を描写する。
PSTを用いて、ジェンダーバイアスの2つの側面、つまり、ジェンダーの職業におけるよく知られたバイアスと、組織力におけるバイアスという新しい側面を評価する。
論文 参考訳(メタデータ) (2024-02-16T21:32:27Z) - Exploring Social Bias in Downstream Applications of Text-to-Image
Foundation Models [72.06006736916821]
合成画像を用いて、社会的バイアスに対するテキスト・画像モデル、画像編集と分類の2つの応用を探索する。
提案手法を用いて,最先端のオープンソーステキスト・ツー・イメージ・モデルであるtextitStable Diffusion における有意義かつ有意義なセクション間社会的バイアスを明らかにする。
本研究は、下流業務・サービスにおけるテキスト・ツー・イメージ基盤モデルの導入について、未発表の点に注意を払っている。
論文 参考訳(メタデータ) (2023-12-05T14:36:49Z) - 'Person' == Light-skinned, Western Man, and Sexualization of Women of
Color: Stereotypes in Stable Diffusion [5.870257045294649]
我々は、最も人気のあるテキスト・画像生成装置の1つに埋め込まれたステレオタイプについて研究する。
性別・国籍・大陸アイデンティティのステレオタイプが,そのような情報がない状態で安定拡散表示を行うかを検討する。
論文 参考訳(メタデータ) (2023-10-30T19:57:01Z) - Indian-BhED: A Dataset for Measuring India-Centric Biases in Large Language Models [18.201326983938014]
大規模言語モデル(LLM)は社会的バイアスを符号化し、ユーザを表現上の害に晒す。
本研究は,LLMにおけるステレオタイプバイアスを,そのタイプデータセットであるIndian-BhEDを用いて,インド中心のフレームに従って定量化する。
テストされたLLMの大多数は、インドの文脈でステレオタイプを出力する確率が強いことが判明した。
論文 参考訳(メタデータ) (2023-09-15T17:38:41Z) - Social Biases through the Text-to-Image Generation Lens [9.137275391251517]
テキスト・トゥ・イメージ(T2I)生成は、プロダクティビティソフトウェアのクリエーター、デザイナ、一般ユーザをサポートする新しいアプリケーションを可能にする。
生成した画像に反映された一般的な社会的偏見の研究と定量化に多次元的アプローチを採用する。
DALLE-v2とStable Diffusionの2つのT2Iモデルについて検討した。
論文 参考訳(メタデータ) (2023-03-30T05:29:13Z) - Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。
我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。
我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文 参考訳(メタデータ) (2023-03-20T19:32:49Z) - Easily Accessible Text-to-Image Generation Amplifies Demographic
Stereotypes at Large Scale [61.555788332182395]
危険で複雑なステレオタイプを増幅する機械学習モデルの可能性を検討する。
さまざまな通常のプロンプトがステレオタイプを生成しており、それらは単に特性、記述子、職業、オブジェクトに言及するプロンプトを含む。
論文 参考訳(メタデータ) (2022-11-07T18:31:07Z) - On Disentangled and Locally Fair Representations [95.6635227371479]
人種や性別などのセンシティブなグループに対して公平な方法で分類を行うという課題について検討する。
局所的公正表現を学習し、学習された表現の下で、各サンプルの近傍は感度特性の観点からバランスをとる。
論文 参考訳(メタデータ) (2022-05-05T14:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。