論文の概要: GLEaN: A Text-to-image Bias Detection Approach for Public Comprehension
- arxiv url: http://arxiv.org/abs/2604.09923v1
- Date: Fri, 10 Apr 2026 21:42:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.750547
- Title: GLEaN: A Text-to-image Bias Detection Approach for Public Comprehension
- Title(参考訳): GLEaN: 公開理解のためのテキストから画像へのバイアス検出手法
- Authors: Bochu Ding, Brinnae Bent, Augustus Wendell,
- Abstract要約: GLEaN(Generative Likeness Evaluation at N-Scale)は、T2Iモデルのバイアスを視覚的に理解できるようにデザインされたポートレートベースの説明可能性パイプラインである。
GLEaN on Stable Diffusion XL across 40 social and occupational identity prompts, produced Composites that reproduceed biases and surface new associations between skin tone and predict emotion。
- 参考スコア(独自算出の注目度): 0.17205106391379024
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-image (T2I) models, and their encoded biases, increasingly shape the visual media the public encounters. While researchers have produced a rich body of work on bias measurement, auditing, and mitigation in T2I systems, those methods largely target technical stakeholders, leaving a gap in public legibility. We introduce GLEaN (Generative Likeness Evaluation at N-Scale), a portrait-based explainability pipeline designed to make T2I model biases visually understandable to a broad audience. GLEaN comprises three stages: automated large-scale image generation from identity prompts, facial landmark-based filtering and spatial alignment, and median-pixel composition that distills a model's central tendency into a single representative portrait. The resulting composites require no statistical background to interpret; a viewer can see, at a glance, who a model 'imagines' when prompted with 'a doctor' versus a 'felon.' We demonstrate GLEaN on Stable Diffusion XL across 40 social and occupational identity prompts, producing composites that reproduce documented biases and surface new associations between skin tone and predicted emotion. We find in a between-subjects user study (N = 291) that GLEaN portraits communicate biases as effectively as conventional data tables, but require significantly less viewing time. Because the method relies solely on generated outputs, it can also be replicated on any black-box and closed-weight systems without access to model internals. GLEaN offers a scalable, model-agnostic approach to bias explainability, purpose-built for public comprehension, and is publicly available at https://github.com/cultureiolab/GLEaN.
- Abstract(参考訳): テキスト・ツー・イメージ(T2I)モデルとその符号化されたバイアスは、公共の遭遇する視覚メディアをますます形作る。
研究者は、T2Iシステムにおけるバイアス測定、監査、緩和に関する豊富な研究を生み出しているが、これらの手法は主に技術的ステークホルダーを対象としており、公共の妥当性の差を残している。
GLEaN(Generative Likeness Evaluation at N-Scale)は、T2Iモデルのバイアスを視覚的に理解できるようにデザインされたポートレートベースの説明可能性パイプラインである。
GLEaNは、アイデンティティプロンプトからの大規模な画像の自動生成、顔のランドマークに基づくフィルタリングと空間アライメント、モデルの中心的な傾向を単一の代表像に蒸留する中央値画素構成の3段階からなる。
結果として得られる合成物は解釈する統計的背景を必要とせず、ビューアーは一見すると、モデルが「医者」と「フェロン」で刺激されたときに「想像する」のを見ることができる。
GLEaN on Stable Diffusion XL across 40 social and occupational identity prompts, produced Composites that reproduceed biases and surface new associations between skin tone and predict emotion。
我々は、GLEaNポートレートが従来のデータテーブルと同じくらい効果的にバイアスを伝達するが、視聴時間が大幅に少なくなることを発見した(N = 291)。
この方法は生成した出力にのみ依存するため、モデル内部にアクセスすることなく、ブラックボックスやクローズドウェイトシステムでも複製できる。
GLEaNは、バイアス説明可能性に対するスケーラブルでモデルに依存しないアプローチを提供し、公開理解のために構築され、https://github.com/ Cultureiolab/GLEaNで公開されている。
関連論文リスト
- Beyond Frequency: Scoring-Driven Debiasing for Object Detection via Blueprint-Prompted Image Synthesis [97.37770785712475]
オブジェクト検出のための世代ベースデバイアスフレームワークを提案する。
提案手法は,未表現オブジェクト群の性能ギャップを著しく狭める。
論文 参考訳(メタデータ) (2025-10-21T02:19:12Z) - Dataset Scale and Societal Consistency Mediate Facial Impression Bias in Vision-Language AI [17.101569078791492]
43のCLIP視覚言語モデルを用いて、人間の顔の印象バイアスを学習するかどうかを検証した。
社会全体でバイアスが共有される度合いがCLIPモデルに反映される度合いを予測するのはこれが初めてである。
論文 参考訳(メタデータ) (2024-08-04T08:26:58Z) - VersusDebias: Universal Zero-Shot Debiasing for Text-to-Image Models via SLM-Based Prompt Engineering and Generative Adversary [8.24274551090375]
本稿では,任意のテキスト・トゥ・イメージ(T2I)モデルにおけるバイアスに対する新奇で普遍的なデバイアスフレームワークであるVersusDebiasを紹介する。
自己適応モジュールは、プロセス後の幻覚と複数の属性を同時にデバイアスする特別な属性配列を生成する。
ゼロショットと少数ショットの両方のシナリオでは、VersusDebiasは既存のメソッドよりも優れており、例外的なユーティリティを示している。
論文 参考訳(メタデータ) (2024-07-28T16:24:07Z) - VLBiasBench: A Comprehensive Benchmark for Evaluating Bias in Large Vision-Language Model [72.13121434085116]
我々は、LVLM(Large Vision-Language Models)におけるバイアスを評価するベンチマークであるVLBiasBenchを紹介する。
VLBiasBenchは、年齢、障害ステータス、性別、国籍、身体的外観、人種、宗教、職業、社会経済ステータスを含む9つの異なる社会バイアスのカテゴリを含むデータセットと、人種x性別と人種x社会経済ステータスの2つの交叉バイアスのカテゴリを含む。
15のオープンソースモデルと2つの高度なクローズドソースモデルに対して広範な評価を行い、これらのモデルに存在するバイアスに関する新たな洞察を得る。
論文 参考訳(メタデータ) (2024-06-20T10:56:59Z) - Quantifying Bias in Text-to-Image Generative Models [49.60774626839712]
テキスト・トゥ・イメージ(T2I)モデルにおけるバイアスは不公平な社会的表現を伝播させ、アイデアを積極的にマーケティングしたり、議論の的となっている議題を推進したりするのに用いられる。
既存のT2Iモデルバイアス評価手法は、社会的バイアスのみに焦点を当てる。
本稿では,T2I生成モデルにおける一般バイアスの定量化手法を提案する。
論文 参考訳(メタデータ) (2023-12-20T14:26:54Z) - Debiasing Vision-Language Models via Biased Prompts [79.04467131711775]
本稿では,テキスト埋め込みにおけるバイアスのある方向を投影することで,視覚言語基盤モデルを疎外する一般的な手法を提案する。
偏平投影行列を組み込んだテキストのみをデバイアスすることで、ロバストな分類器と公正な生成モデルが得られることを示す。
論文 参考訳(メタデータ) (2023-01-31T20:09:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。