論文の概要: BiasIG: Benchmarking Multi-dimensional Social Biases in Text-to-Image Models
- arxiv url: http://arxiv.org/abs/2604.11934v1
- Date: Mon, 13 Apr 2026 18:22:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.05943
- Title: BiasIG: Benchmarking Multi-dimensional Social Biases in Text-to-Image Models
- Title(参考訳): BiasIG:テキスト・画像モデルにおける多次元社会バイアスのベンチマーク
- Authors: Hanjun Luo, Zhimu Huang, Haoyu Huang, Ziye Deng, Ruizhe Chen, Xinfeng Li, Zuozhu Liu, Hanan Salam,
- Abstract要約: 47,040のプロンプトをキュレートしたデータセット間で社会的バイアスを定量化する統一ベンチマークであるBiasIGを紹介する。
8つのT2Iモデルと3つのデバイアス法に関する大規模な実験は、BiasIGを堅牢な診断ツールとして検証している。
我々の研究は、AIGCにおける公正性に対する正確な分類駆動アプローチを提唱し、将来のクローズドループ緩和におけるフィードバック信号としてBiasIGのメトリクスを使用するための理論的枠組みを提供する。
- 参考スコア(独自算出の注目度): 30.463069540851688
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-to-Image (T2I) generative models have revolutionized content creation, yet they inherently risk amplifying societal biases. While sociological research provides systematic classifications of bias, existing T2I benchmarks largely conflate these nuances or focus narrowly on occupational stereotypes, leaving the multi-dimensional nature of generative bias inadequately measured. In this paper, we introduce BiasIG, a unified benchmark that quantifies social biases across a curated dataset of 47,040 prompts. Grounded in sociological and machine ethics frameworks, BiasIG disentangles biases across 4 dimensions to enable fine-grained diagnosis. To facilitate scalable and reliable evaluation, we propose a fully automated pipeline powered by a fine-tuned multi-modal large language model, achieving high alignment accuracy comparable to human experts. Extensive experiments on 8 T2I models and 3 debiasing methods not only validate BiasIG as a robust diagnostic tool, but also reveal critical insights: interventions on protected attributes often trigger unintended confounding effects on unrelated demographics, and debiasing methods exhibit a persistent tendency toward discrimination rather than mere ignorance. Our work advocates for a precise, taxonomy-driven approach to fairness in AIGC, providing a theoretical framework for using BiasIG's metrics as feedback signals in future closed-loop mitigation. The benchmark is openly available at https://github.com/Astarojth/BiasIG.
- Abstract(参考訳): テキスト・トゥ・イメージ(T2I)生成モデルは、コンテンツ生成に革命をもたらしたが、本質的には社会的バイアスを増幅するリスクがある。
社会学的研究はバイアスの体系的な分類を提供するが、既存のT2Iベンチマークはこれらのニュアンスを概ね説明し、職業的ステレオタイプに焦点を絞って、生成バイアスの多次元的な性質を不十分に測定している。
本稿では,47,040件のプロンプトをキュレートしたデータセットに対して,社会的バイアスを定量化する統一ベンチマークであるBiasIGを紹介する。
社会学と機械倫理の枠組みに基づいて、BiasIGは4次元にわたってバイアスを分散させ、きめ細かい診断を可能にする。
スケーラブルで信頼性の高い評価を容易にするため、我々は、人間の専門家に匹敵する高いアライメント精度を達成し、細調整されたマルチモーダルな大規模言語モデルを利用した完全自動化パイプラインを提案する。
8つのT2Iモデルと3つの脱バイアス法に関する大規模な実験は、BiasIGを堅牢な診断ツールとして評価するだけでなく、重要な洞察も示している。
我々の研究は、AIGCにおける公正性に対する正確な分類駆動アプローチを提唱し、将来のクローズドループ緩和におけるフィードバック信号としてBiasIGのメトリクスを使用するための理論的枠組みを提供する。
ベンチマークはhttps://github.com/Astarojth/BiasIGで公開されている。
関連論文リスト
- Adaptive Generation of Bias-Eliciting Questions for LLMs [18.608477560948003]
大規模言語モデル(LLM)は現在、ユーザ向けアプリケーションに広くデプロイされており、世界中で数億に達しています。
我々は,性,人種,宗教などのセンシティブな属性に対して,現実的でオープンな質問を自動的に生成する,反現実的バイアス評価フレームワークを導入する。
また、非対称な拒絶や偏見の明示的な認識など、ユーザインタラクションにますます関係する異なる応答次元も捉えています。
論文 参考訳(メタデータ) (2025-10-14T13:08:10Z) - To Bias or Not to Bias: Detecting bias in News with bias-detector [1.8024397171920885]
我々は、専門家注釈付きBABEデータセット上でRoBERTaベースのモデルを微調整することで、文レベルのバイアス分類を行う。
本稿では,ドメイン適応型DA-RoBERTaベースラインとの比較において,統計的に有意な性能向上を示す。
メディアバイアス検出のための,より堅牢で説明可能な,社会的に責任のあるNLPシステムの構築に寄与する。
論文 参考訳(メタデータ) (2025-05-19T11:54:39Z) - Identifying and Mitigating Social Bias Knowledge in Language Models [52.52955281662332]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文 参考訳(メタデータ) (2024-08-07T17:14:58Z) - BIGbench: A Unified Benchmark for Evaluating Multi-dimensional Social Biases in Text-to-Image Models [15.250980521130762]
画像生成のバイアスの統一ベンチマークであるBIGbenchを紹介する。
既存のベンチマークとは異なり、BIGbenchは4次元にわたるバイアスを分類し評価する。
BIGbenchを用いて8つの代表的T2Iモデルと3つのデバイアス法を評価する。
論文 参考訳(メタデータ) (2024-07-21T18:09:40Z) - Thinking Racial Bias in Fair Forgery Detection: Models, Datasets and Evaluations [63.52709761339949]
最初に、Fair Forgery Detection(FairFD)データセットと呼ばれる専用のデータセットをコントリビュートし、SOTA(Public State-of-the-art)メソッドの人種的偏見を証明する。
我々は、偽りの結果を避けることができる平均的メトリクスと実用正規化メトリクスを含む新しいメトリクスを設計する。
また,有効で堅牢な後処理技術であるBias Pruning with Fair Activations (BPFA)も提案する。
論文 参考訳(メタデータ) (2024-07-19T14:53:18Z) - VLBiasBench: A Comprehensive Benchmark for Evaluating Bias in Large Vision-Language Model [72.13121434085116]
我々は、LVLM(Large Vision-Language Models)におけるバイアスを評価するベンチマークであるVLBiasBenchを紹介する。
VLBiasBenchは、年齢、障害ステータス、性別、国籍、身体的外観、人種、宗教、職業、社会経済ステータスを含む9つの異なる社会バイアスのカテゴリを含むデータセットと、人種x性別と人種x社会経済ステータスの2つの交叉バイアスのカテゴリを含む。
15のオープンソースモデルと2つの高度なクローズドソースモデルに対して広範な評価を行い、これらのモデルに存在するバイアスに関する新たな洞察を得る。
論文 参考訳(メタデータ) (2024-06-20T10:56:59Z) - Quantifying Bias in Text-to-Image Generative Models [49.60774626839712]
テキスト・トゥ・イメージ(T2I)モデルにおけるバイアスは不公平な社会的表現を伝播させ、アイデアを積極的にマーケティングしたり、議論の的となっている議題を推進したりするのに用いられる。
既存のT2Iモデルバイアス評価手法は、社会的バイアスのみに焦点を当てる。
本稿では,T2I生成モデルにおける一般バイアスの定量化手法を提案する。
論文 参考訳(メタデータ) (2023-12-20T14:26:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。