論文の概要: Visual Stereotypes of Autism Spectrum in Janus-Pro-7B, DALL-E, Stable Diffusion, SDXL, FLUX, and Midjourney
- arxiv url: http://arxiv.org/abs/2407.16292v3
- Date: Thu, 16 Oct 2025 11:56:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.423475
- Title: Visual Stereotypes of Autism Spectrum in Janus-Pro-7B, DALL-E, Stable Diffusion, SDXL, FLUX, and Midjourney
- Title(参考訳): Janus-Pro-7B, DALL-E, 安定拡散, SDXL, FLUX, ミッドジャーニーにおける自閉症スペクトラムの視覚ステレオタイプ
- Authors: Maciej Wodziński, Marcin Rządeczka, Anastazja Szuła, Kacper Dudzic, Marcin Moskalewicz,
- Abstract要約: 本研究は,2024-2025年に生成した画像と制御とを比較し,自閉症に関する非合理的信念を継続する6つのテキスト・ツー・イメージモデルについて検討した。
自閉症の個人は、肌の色(白人)、性別(男性)、年齢(青年)に顕著な均一性を示し、孤独な活動に従事し、人ではなく物と交流し、悲しみ、怒り、感情的な平らさなどのステレオタイプ的な感情表現を示した。
両モデル間に有意差が認められたが, 効果サイズが適度であり, ベースラインと追従要約値の差はなく, いずれのモデルにも類似した画像数に対するステレオタイプ的テーマの比は認められなかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Avoiding systemic discrimination of neurodiverse individuals is an ongoing challenge in training AI models, which often propagate negative stereotypes. This study examined whether six text-to-image models (Janus-Pro-7B VL2 vs. VL3, DALL-E 3 v. April 2024 vs. August 2025, Stable Diffusion v. 1.6 vs. 3.5, SDXL v. April 2024 vs. FLUX.1 Pro, and Midjourney v. 5.1 vs. 7) perpetuate non-rational beliefs regarding autism by comparing images generated in 2024-2025 with controls. 53 prompts aimed at neutrally visualizing concrete objects and abstract concepts related to autism were used against 53 controls (baseline total N=302, follow-up experimental 280 images plus 265 controls). Expert assessment measuring the presence of common autism-related stereotypes employed a framework of 10 deductive codes followed by statistical analysis. Autistic individuals were depicted with striking homogeneity in skin color (white), gender (male), and age (young), often engaged in solitary activities, interacting with objects rather than people, and exhibiting stereotypical emotional expressions such as sadness, anger, or emotional flatness. In contrast, the images of neurotypical individuals were more diverse and lacked such traits. We found significant differences between the models; however, with a moderate effect size, and no differences between baseline and follow-up summary values, with the ratio of stereotypical themes to the number of images similar across all models. The control prompts showed a significantly lower degree of stereotyping with large size effects, confirming the hidden biases of the models. In summary, despite improvements in the technical aspects of image generation, the level of reproduction of potentially harmful autism-related stereotypes remained largely unaffected.
- Abstract(参考訳): 神経異種個体の体系的識別を避けることは、しばしば否定的なステレオタイプを伝播するAIモデルを訓練する上で、現在進行中の課題である。
Janus-Pro-7B VL2 vs. VL3, DALL-E 3 v. April 2024 vs. August 2025, Stable Diffusion v. 1.6 vs. 3.5, SDXL v. April 2024 vs. FLUX.1。
Pro, and Midjourney v. 5.1 vs. 7) は、2024-2025年に生成された画像とコントロールを比較し、自閉症に関する非合理的な信念を継続する。
53のプロンプトは、53のコントロール(ベースラインN=302、フォローアップ実験280のイメージと265のコントロール)に対して、具体的な物体と自閉症に関する抽象概念を中立的に可視化することを目的としていた。
共用自閉症関連ステレオタイプの存在を計測する専門家評価では,10の帰納的符号の枠組みを用いて統計的解析を行った。
自閉症の個人は、肌の色(白人)、性別(男性)、年齢(青年)に顕著な均一性を示し、孤独な活動に従事し、人ではなく物と交流し、悲しみ、怒り、感情的な平らさなどのステレオタイプ的な感情表現を示した。
対照的に、神経型個体の像はより多様性があり、そのような特徴を欠いていた。
両モデル間に有意差が認められたが, 効果サイズは中程度であり, ベースラインと追従要約値の差はなく, 全モデルに類似した画像数に対するステレオタイプ的テーマの比は認められなかった。
コントロールプロンプトは, モデルに隠れたバイアスを確認できるほど, 大型化によるステレオタイピングの程度が有意に低かった。
要約すると、画像生成の技術的側面の改善にもかかわらず、潜在的に有害な自閉症関連ステレオタイプの再現のレベルは、ほとんど影響を受けなかった。
関連論文リスト
- When Cars Have Stereotypes: Auditing Demographic Bias in Objects from Text-to-Image Models [4.240144901142787]
このようなバイアスを測定するための新しいフレームワークであるSODA(Stereotyped Object Diagnostic Audit)を紹介する。
提案手法は, 対象物の視覚特性を人口統計学的手がかりと中性プロンプトとを比較した。
性別や民族によって引き起こされる色パターンの反復など、特定の人口集団と視覚特性の強い関連を明らかにする。
論文 参考訳(メタデータ) (2025-08-05T14:15:53Z) - Fact-or-Fair: A Checklist for Behavioral Testing of AI Models on Fairness-Related Queries [85.909363478929]
本研究では,権威ある情報源から収集した19の実世界統計に着目した。
主観的および主観的な問合せからなるチェックリストを作成し,大規模言語モデルの振る舞いを解析する。
事実性と公平性を評価するためのメトリクスを提案し、これらの2つの側面の間に固有のトレードオフを正式に証明する。
論文 参考訳(メタデータ) (2025-02-09T10:54:11Z) - Hugging Rain Man: A Novel Facial Action Units Dataset for Analyzing Atypical Facial Expressions in Children with Autism Spectrum Disorder [2.3001245059699014]
我々は,ASDと典型的発達(TD)の双方に対して,FACSの専門家が手動でアノテートした顔アクションユニット(AU)を含む,新しいデータセットHugging Rain Manを紹介する。
データセットには、ポーズと自発的な表情の豊富なコレクションが含まれており、合計で約130,000フレーム、22のAU、10のAction Descriptors(AD)、非定型評価が含まれている。
論文 参考訳(メタデータ) (2024-11-21T02:51:52Z) - Closely Interactive Human Reconstruction with Proxemics and Physics-Guided Adaption [64.07607726562841]
既存の人間再建アプローチは主に、正確なポーズの回復や侵入を避けることに焦点を当てている。
本研究では,モノクロ映像から密に対話的な人間を再構築する作業に取り組む。
本稿では,視覚情報の欠如を補うために,確率的行動や物理からの知識を活用することを提案する。
論文 参考訳(メタデータ) (2024-04-17T11:55:45Z) - Hear Me, See Me, Understand Me: Audio-Visual Autism Behavior Recognition [47.550391816383794]
本稿では,音声・視覚自閉症の行動認識の新たな課題について紹介する。
社会的行動認識は、AIによる自閉症スクリーニング研究において、これまで省略されてきた重要な側面である。
データセット、コード、事前トレーニングされたモデルをリリースします。
論文 参考訳(メタデータ) (2024-03-22T22:52:35Z) - Decoding Susceptibility: Modeling Misbelief to Misinformation Through a Computational Approach [61.04606493712002]
誤報に対する感受性は、観測不可能な不検証の主張に対する信念の度合いを記述している。
既存の感受性研究は、自己報告された信念に大きく依存している。
本稿では,ユーザの潜在感受性レベルをモデル化するための計算手法を提案する。
論文 参考訳(メタデータ) (2023-11-16T07:22:56Z) - Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。
我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。
我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文 参考訳(メタデータ) (2023-03-20T19:32:49Z) - Improving Deep Facial Phenotyping for Ultra-rare Disorder Verification
Using Model Ensembles [52.77024349608834]
我々は、DCNNを最先端の顔認識手法であるiResNetとArcFaceに置き換える影響を分析する。
提案するアンサンブルモデルにより,目視と目視の両障害に対する最先端のパフォーマンスが達成される。
論文 参考訳(メタデータ) (2022-11-12T23:28:54Z) - Easily Accessible Text-to-Image Generation Amplifies Demographic
Stereotypes at Large Scale [61.555788332182395]
危険で複雑なステレオタイプを増幅する機械学習モデルの可能性を検討する。
さまざまな通常のプロンプトがステレオタイプを生成しており、それらは単に特性、記述子、職業、オブジェクトに言及するプロンプトを含む。
論文 参考訳(メタデータ) (2022-11-07T18:31:07Z) - Spatio-Temporal Attention in Multi-Granular Brain Chronnectomes for
Detection of Autism Spectrum Disorder [5.908259551646475]
グラフベースの学習技術は、静止状態機能型磁気共鳴画像(rs-fMRI)データに顕著な結果を示している。
IMAGINの5倍のクロスバリデーション精度は79.25%であり、現在の最先端を1.5%上回る。
論文 参考訳(メタデータ) (2022-10-30T01:43:17Z) - A Two-stage Multi-modal Affect Analysis Framework for Children with
Autism Spectrum Disorder [3.029434408969759]
実環境における遊び療法におけるASDの影響状態の3つの主要な影響状態を予測するために,音響的および視覚的手がかりを利用したオープンソースの2段階マルチモーダルアプローチを提案する。
この研究は、2段階のスキーマを提案することによって、ASDに対する人間の専門知識とマシンインテリジェンスを組み合わせる新しい方法を示す。
論文 参考訳(メタデータ) (2021-06-17T01:28:53Z) - Gaze-based Autism Detection for Adolescents and Young Adults using
Prosaic Videos [35.54632105027475]
ユーザの視線を監視することで、自閉症スペクトラム障害の個人を識別できることを実証する。
私たちは、35人の自閉症と25人の非自閉症の個人を雇い、ノートパソコンに接続された市販のアイトラッカーを使って視線を捉えました。15秒以内に、我々のアプローチは、自閉症の診断を受けた個人を特定する精度92.5%でした。
論文 参考訳(メタデータ) (2020-05-26T18:14:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。