論文の概要: Visual Stereotypes of Autism Spectrum in DALL-E, Stable Diffusion, SDXL, and Midjourney
- arxiv url: http://arxiv.org/abs/2407.16292v1
- Date: Tue, 23 Jul 2024 08:48:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-24 18:06:10.906013
- Title: Visual Stereotypes of Autism Spectrum in DALL-E, Stable Diffusion, SDXL, and Midjourney
- Title(参考訳): DALL-E、Stable Diffusion、SDXL、Midjourneyにおける自閉症スペクトラムの視覚ステレオタイプ
- Authors: Maciej Wodziński, Marcin Rządeczka, Anastazja Szuła, Marta Sokół, Marcin Moskalewicz,
- Abstract要約: 本研究では,テキスト・ツー・イメージモデルが,自閉症に関する非合理的な信念を意図せず永続させる方法について検討した。
研究プロトコルでは、具体的な物体や自閉症に関する抽象概念を可視化する53のプロンプトに基づいて画像を生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Avoiding systemic discrimination requires investigating AI models' potential to propagate stereotypes resulting from the inherent biases of training datasets. Our study investigated how text-to-image models unintentionally perpetuate non-rational beliefs regarding autism. The research protocol involved generating images based on 53 prompts aimed at visualizing concrete objects and abstract concepts related to autism across four models: DALL-E, Stable Diffusion, SDXL, and Midjourney (N=249). Expert assessment of results was performed via a framework of 10 deductive codes representing common stereotypes contested by the community regarding their presence and spatial intensity, quantified on ordinal scales and subject to statistical analysis of inter-rater reliability and size effects. The models frequently utilised controversial themes and symbols which were unevenly distributed, however, with striking homogeneity in terms of skin colour, gender, and age, with autistic individuals portrayed as engaged in solitary activities, interacting with objects rather than people, and displaying stereotypical emotional expressions such as pale, anger, or sad. Secondly we observed representational insensitivity regarding autism images despite directional prompting aimed at falsifying the above results. Additionally, DALL-E explicitly denied perpetuating stereotypes. We interpret this as ANNs mirroring the human cognitive architecture regarding the discrepancy between background and reflective knowledge, as justified by our previous research on autism-related stereotypes in humans.
- Abstract(参考訳): システム的差別を避けるには、トレーニングデータセット固有のバイアスから生じるステレオタイプを伝播するAIモデルの可能性を調べる必要がある。
本研究では,テキスト・ツー・イメージ・モデルが,自閉症に関する非合理的な信念を意図せず永続させる方法について検討した。
研究プロトコルでは、DALL-E、Stable Diffusion、SDXL、Midjourney(N=249)という4つのモデルにまたがる、具体的な物体や自閉症に関する抽象概念を可視化するための53のプロンプトに基づいて画像を生成する。
実験結果の有意な評価は,コミュニティが提案する共通ステレオタイプを表す10の導出符号の枠組みを用いて行われ,その存在と空間的強度の定量化,および層間信頼性とサイズ効果の統計的解析を行った。
モデルは不均一に配布された議論の的となっているテーマやシンボルをしばしば利用したが、肌の色、性別、年齢の点で顕著な均一性があり、自閉症の個人は孤独な活動に従事し、人ではなく物と交流し、青、怒り、悲しみといったステレオタイプ的な感情表現を見せる。
第2に, 以上の結果の偽造を目的とした指向性プロンプトにもかかわらず, 自閉症画像に対する表現的不感度を観察した。
さらに、DALL-Eは永続ステレオタイプを明示的に否定した。
我々は、人間における自閉症関連ステレオタイプに関するこれまでの研究で正当化されたように、背景と反射的知識の相違に関する人間の認知アーキテクチャを反映するANNと解釈する。
関連論文リスト
- Hugging Rain Man: A Novel Facial Action Units Dataset for Analyzing Atypical Facial Expressions in Children with Autism Spectrum Disorder [2.3001245059699014]
我々は,ASDと典型的発達(TD)の双方に対して,FACSの専門家が手動でアノテートした顔アクションユニット(AU)を含む,新しいデータセットHugging Rain Manを紹介する。
データセットには、ポーズと自発的な表情の豊富なコレクションが含まれており、合計で約130,000フレーム、22のAU、10のAction Descriptors(AD)、非定型評価が含まれている。
論文 参考訳(メタデータ) (2024-11-21T02:51:52Z) - Closely Interactive Human Reconstruction with Proxemics and Physics-Guided Adaption [64.07607726562841]
既存の人間再建アプローチは主に、正確なポーズの回復や侵入を避けることに焦点を当てている。
本研究では,モノクロ映像から密に対話的な人間を再構築する作業に取り組む。
本稿では,視覚情報の欠如を補うために,確率的行動や物理からの知識を活用することを提案する。
論文 参考訳(メタデータ) (2024-04-17T11:55:45Z) - Hear Me, See Me, Understand Me: Audio-Visual Autism Behavior Recognition [47.550391816383794]
本稿では,音声・視覚自閉症の行動認識の新たな課題について紹介する。
社会的行動認識は、AIによる自閉症スクリーニング研究において、これまで省略されてきた重要な側面である。
データセット、コード、事前トレーニングされたモデルをリリースします。
論文 参考訳(メタデータ) (2024-03-22T22:52:35Z) - Decoding Susceptibility: Modeling Misbelief to Misinformation Through a Computational Approach [61.04606493712002]
誤報に対する感受性は、観測不可能な不検証の主張に対する信念の度合いを記述している。
既存の感受性研究は、自己報告された信念に大きく依存している。
本稿では,ユーザの潜在感受性レベルをモデル化するための計算手法を提案する。
論文 参考訳(メタデータ) (2023-11-16T07:22:56Z) - Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。
我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。
我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文 参考訳(メタデータ) (2023-03-20T19:32:49Z) - Improving Deep Facial Phenotyping for Ultra-rare Disorder Verification
Using Model Ensembles [52.77024349608834]
我々は、DCNNを最先端の顔認識手法であるiResNetとArcFaceに置き換える影響を分析する。
提案するアンサンブルモデルにより,目視と目視の両障害に対する最先端のパフォーマンスが達成される。
論文 参考訳(メタデータ) (2022-11-12T23:28:54Z) - Easily Accessible Text-to-Image Generation Amplifies Demographic
Stereotypes at Large Scale [61.555788332182395]
危険で複雑なステレオタイプを増幅する機械学習モデルの可能性を検討する。
さまざまな通常のプロンプトがステレオタイプを生成しており、それらは単に特性、記述子、職業、オブジェクトに言及するプロンプトを含む。
論文 参考訳(メタデータ) (2022-11-07T18:31:07Z) - Spatio-Temporal Attention in Multi-Granular Brain Chronnectomes for
Detection of Autism Spectrum Disorder [5.908259551646475]
グラフベースの学習技術は、静止状態機能型磁気共鳴画像(rs-fMRI)データに顕著な結果を示している。
IMAGINの5倍のクロスバリデーション精度は79.25%であり、現在の最先端を1.5%上回る。
論文 参考訳(メタデータ) (2022-10-30T01:43:17Z) - A Two-stage Multi-modal Affect Analysis Framework for Children with
Autism Spectrum Disorder [3.029434408969759]
実環境における遊び療法におけるASDの影響状態の3つの主要な影響状態を予測するために,音響的および視覚的手がかりを利用したオープンソースの2段階マルチモーダルアプローチを提案する。
この研究は、2段階のスキーマを提案することによって、ASDに対する人間の専門知識とマシンインテリジェンスを組み合わせる新しい方法を示す。
論文 参考訳(メタデータ) (2021-06-17T01:28:53Z) - Gaze-based Autism Detection for Adolescents and Young Adults using
Prosaic Videos [35.54632105027475]
ユーザの視線を監視することで、自閉症スペクトラム障害の個人を識別できることを実証する。
私たちは、35人の自閉症と25人の非自閉症の個人を雇い、ノートパソコンに接続された市販のアイトラッカーを使って視線を捉えました。15秒以内に、我々のアプローチは、自閉症の診断を受けた個人を特定する精度92.5%でした。
論文 参考訳(メタデータ) (2020-05-26T18:14:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。