論文の概要: DrawL: Understanding the Effects of Non-Mainstream Dialects in Prompted Image Generation
- arxiv url: http://arxiv.org/abs/2405.05382v1
- Date: Wed, 8 May 2024 19:16:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-10 14:52:18.609423
- Title: DrawL: Understanding the Effects of Non-Mainstream Dialects in Prompted Image Generation
- Title(参考訳): DrawL: プロンプト画像生成における非主ストリーム辞書の効果の理解
- Authors: Joshua N. Williams, Molly FitzMorris, Osman Aka, Sarah Laszlo,
- Abstract要約: 本研究は,方言などの暗黙のマーカーが,テキスト・画像出力における人物の描写に影響を及ぼすかどうかを考察する。
我々は、最小限の構文のみの変更をプロンプトにすることで、生成した画像の人の肌の色や性別を体系的にシフトできることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-image models are now easy to use and ubiquitous. However, prior work has found that they are prone to recapitulating harmful Western stereotypes. For example, requesting that a model generate an "African person and their house," may produce a person standing next to a straw hut. In this example, the word "African" is an explicit descriptor of the person that the prompt is seeking to depict. Here, we examine whether implicit markers, such as dialect, can also affect the portrayal of people in text-to-image outputs. We pair prompts in Mainstream American English with counterfactuals that express grammatical constructions found in dialects correlated with historically marginalized groups. We find that through minimal, syntax-only changes to prompts, we can systematically shift the skin tone and gender of people in the generated images. We conclude with a discussion of whether dialectic distribution shifts like this are harmful or are expected, possibly even desirable, model behavior.
- Abstract(参考訳): テキスト・ツー・イメージのモデルは使いやすく、ユビキタスになった。
しかし、以前の研究では、有害な西洋のステレオタイプを再捕獲する傾向があることが判明している。
例えば、モデルが「アフリカ人とその家」を生成するように要求すると、ストロー小屋の隣に立っている人が生まれる可能性がある。
この例では、「アフリカ」という言葉は、プロンプトが描写しようとしている人物の明示的な記述である。
ここでは、方言などの暗黙のマーカーが、テキスト・画像出力における人物の描写にも影響を及ぼすかどうかを検討する。
メインストリーム・アメリカン・イングリッシュ(英語版)では、歴史的に辺境化されたグループと相関する方言で見られる文法的構成を表現する反事実とペアプロンプトを組む。
我々は、最小限の構文のみの変更をプロンプトにすることで、生成した画像の人の肌の色や性別を体系的にシフトできることがわかった。
このような方言分布の変化が有害なのか、あるいは、おそらく望ましいモデル行動なのか、という議論から締めくくります。
関連論文リスト
- Gender Bias in Instruction-Guided Speech Synthesis Models [55.2480439325792]
本研究では、モデルが職業関連プロンプトをどのように解釈するかにおける潜在的な性別バイアスについて検討する。
このようなプロンプトを解釈する際に、これらのモデルがジェンダーステレオタイプを増幅する傾向を示すかどうかを検討する。
実験の結果, ある職業において, 性別偏見を示す傾向が示された。
論文 参考訳(メタデータ) (2025-02-08T17:38:24Z) - Anti-stereotypical Predictive Text Suggestions Do Not Reliably Yield Anti-stereotypical Writing [28.26615961488287]
私たちは、言語モデルが予測テキストシナリオで、人々が言語モデルを使用して記述するストーリーにどのように影響するかを検討します。
特定のシナリオでは、共通の社会的ステレオタイプと整合する言語モデルの提案が、人間の著者によって受け入れられる可能性が高くなる。
論文 参考訳(メタデータ) (2024-09-30T15:21:25Z) - Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models [50.40276881893513]
本研究では,音声大言語モデル(SLLM)における社会的バイアスの評価を目的としたデータセットであるSpken Stereosetを紹介する。
多様な人口集団の発話に対して異なるモデルがどのように反応するかを調べることで、これらのバイアスを特定することを目指している。
これらの結果から,ほとんどのモデルではバイアスが最小であるが,ステレオタイプや反ステレオタイプ傾向がわずかにみられた。
論文 参考訳(メタデータ) (2024-08-14T16:55:06Z) - Word-Level Explanations for Analyzing Bias in Text-to-Image Models [72.71184730702086]
Text-to-image(T2I)モデルは、人種や性別に基づいて少数派を過小評価する画像を生成することができる。
本稿では,入力プロンプトのどの単語が生成画像のバイアスの原因となるかを検討する。
論文 参考訳(メタデータ) (2023-06-03T21:39:07Z) - Easily Accessible Text-to-Image Generation Amplifies Demographic
Stereotypes at Large Scale [61.555788332182395]
危険で複雑なステレオタイプを増幅する機械学習モデルの可能性を検討する。
さまざまな通常のプロンプトがステレオタイプを生成しており、それらは単に特性、記述子、職業、オブジェクトに言及するプロンプトを含む。
論文 参考訳(メタデータ) (2022-11-07T18:31:07Z) - How well can Text-to-Image Generative Models understand Ethical Natural
Language Interventions? [67.97752431429865]
倫理的介入を加える際の画像の多様性への影響について検討した。
予備研究は、モデル予測の大きな変化が「性別の無視」のような特定のフレーズによって引き起こされることを示している。
論文 参考訳(メタデータ) (2022-10-27T07:32:39Z) - Exploiting Cultural Biases via Homoglyphs in Text-to-Image Synthesis [33.080261792998826]
テキスト・ツー・イメージ合成のモデルは近年,アカデミックや一般大衆から多くの関心を集めている。
テキスト記述に1文字の非ラテン語文字を挿入するだけで、共通のモデルが生成した画像の文化的ステレオタイプやバイアスを反映することを示す。
本稿では,テキストエンコーダを微調整する新しいホモグリフアンラーニング手法を提案する。
論文 参考訳(メタデータ) (2022-09-19T09:48:17Z) - It's Morphin' Time! Combating Linguistic Discrimination with
Inflectional Perturbations [68.16751625956243]
完全な標準英語コーパスのみが、非標準言語的背景から少数民族を区別するためにニューラルネットワークを前提としている。
我々は、単語の屈折形態を乱して、可塑性で意味論的に類似した逆の例を作る。
論文 参考訳(メタデータ) (2020-05-09T04:01:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。