Fugu-MT 論文翻訳(概要): OpenBias: Open-set Bias Detection in Text-to-Image Generative Models

論文の概要: OpenBias: Open-set Bias Detection in Text-to-Image Generative Models

arxiv url: http://arxiv.org/abs/2404.07990v2
Date: Mon, 5 Aug 2024 12:55:47 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-06 23:07:02.279361
Title: OpenBias: Open-set Bias Detection in Text-to-Image Generative Models
Title（参考訳）: OpenBias: テキストから画像への生成モデルにおけるオープンセットバイアス検出
Authors: Moreno D'Incà, Elia Peruzzo, Massimiliano Mancini, Dejia Xu, Vidit Goel, Xingqian Xu, Zhangyang Wang, Humphrey Shi, Nicu Sebe,
Abstract要約: OpenBiasを提示するテキストから画像生成モデルにおけるオープンセットバイアス検出の課題に対処する。 OpenBiasは、事前コンパイルされた集合にアクセスすることなく、バイアスの深刻度を不可知的に識別し、定量化する。本研究では, 安定拡散1.5, 2, XLの挙動について検討した。
参考スコア（独自算出の注目度）: 108.2219657433884
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Text-to-image generative models are becoming increasingly popular and accessible to the general public. As these models see large-scale deployments, it is necessary to deeply investigate their safety and fairness to not disseminate and perpetuate any kind of biases. However, existing works focus on detecting closed sets of biases defined a priori, limiting the studies to well-known concepts. In this paper, we tackle the challenge of open-set bias detection in text-to-image generative models presenting OpenBias, a new pipeline that identifies and quantifies the severity of biases agnostically, without access to any precompiled set. OpenBias has three stages. In the first phase, we leverage a Large Language Model (LLM) to propose biases given a set of captions. Secondly, the target generative model produces images using the same set of captions. Lastly, a Vision Question Answering model recognizes the presence and extent of the previously proposed biases. We study the behavior of Stable Diffusion 1.5, 2, and XL emphasizing new biases, never investigated before. Via quantitative experiments, we demonstrate that OpenBias agrees with current closed-set bias detection methods and human judgement.
Abstract（参考訳）: テキスト・ツー・イメージ・ジェネレーティブ・モデルが一般大衆に普及し、アクセスしやすくなっている。これらのモデルは大規模な展開を見込んでいるため、あらゆる種類のバイアスを分散させ、永続させないように、彼らの安全性と公正性を深く調査する必要がある。しかし、既存の研究は偏見の閉集合の検出に重点を置いており、研究をよく知られた概念に限定している。本稿では,プリコンパイルされた集合にアクセスすることなく,バイアスの重大さを不可知的に識別し,定量化する新しいパイプラインであるOpenBiasを提示するテキスト・ツー・イメージ生成モデルにおいて,オープン・セットバイアス検出の課題に取り組む。 OpenBiasには3つのステージがある。第1フェーズでは,大言語モデル(LLM)を用いて,一組のキャプションが与えられた場合のバイアスを提案する。第二に、ターゲット生成モデルは、同じキャプションセットを使用して画像を生成する。最後に、視覚質問回答モデルは、これまで提案されたバイアスの存在と範囲を認識する。本研究では, 安定拡散1.5, 2, XLの挙動について検討した。定量的実験により、OpenBiasは現在のクローズドセットバイアス検出法と人間の判断と一致することを示した。

関連論文リスト

AutoDebias: Automated Framework for Debiasing Text-to-Image Models [6.581606189725493]
テキスト・ツー・イメージ(T2I)モデルはテキスト・プロンプトから高品質な画像を生成するが、しばしば意図しない社会的偏見を示す。本稿では,T2Iモデルにおける有害バイアスを自動的に識別・緩和するフレームワークであるAutoDebiasを提案する。このフレームワークを25以上のバイアスシナリオをカバーするベンチマークで評価する。
論文参考訳（メタデータ） (2025-08-01T09:05:45Z)
Classifier-to-Bias: Toward Unsupervised Automatic Bias Detection for Visual Classifiers [25.909153114646692]
既存のバイアス識別のアプローチは、関心のあるタスクのラベルを含むデータセットに依存している。ラベル付きデータにアクセスせずに動作する最初のバイアス発見フレームワークである-to-Bias(C2B)を提示する。 C2Bはトレーニング不要で、アノテーションを一切必要とせず、バイアスのリストに制約がなく、任意の分類タスクで事前訓練されたモデルに適用できる。
論文参考訳（メタデータ） (2025-04-29T16:19:38Z)
Implicit Bias Injection Attacks against Text-to-Image Diffusion Models [17.131167390657243]
偏りのあるT2Iモデルは特定の傾向のあるコンテンツを生成し、人々の知覚に影響を与える可能性がある。本稿では,視覚的特徴に欠けるが,多様な方法で現れる新しい形態の暗黙バイアスを紹介する。本稿では,T2I拡散モデルに対する暗黙バイアス注入攻撃フレームワーク(IBI-Attacks)を提案する。
論文参考訳（メタデータ） (2025-04-02T15:24:12Z)
Exploring Bias in over 100 Text-to-Image Generative Models [49.60774626839712]
本稿では,Hugging Faceのようなオープンプラットフォームによるモデルの利用率向上に着目し,テキストから画像への生成モデルにおけるバイアスの傾向について検討する。我々は, (i) 分布バイアス, (ii) 生成幻覚, (iii) 生成ミスレートの3つの主要な次元にまたがるバイアスを評価する。以上の結果から, 芸術的モデルとスタイル変換モデルに有意なバイアスが生じる一方で, より広範なトレーニング分布の恩恵を受ける基礎モデルでは, 徐々にバイアスが減っていることが示唆された。
論文参考訳（メタデータ） (2025-03-11T03:40:44Z)
Unmasking Conversational Bias in AI Multiagent Systems [1.0705399532413618]
生成モデルを含むマルチエージェントシステムで生じる可能性のあるバイアスは、未研究のままである。本稿では,対話型大規模言語モデルのマルチエージェントシステムにおけるバイアスの定量化を目的としたフレームワークを提案する。エコーチャンバー実験で観測されたバイアスは、現在最先端のバイアス検出法で検出されていない。
論文参考訳（メタデータ） (2025-01-24T09:10:02Z)
GradBias: Unveiling Word Influence on Bias in Text-to-Image Generative Models [75.04426753720553]
開集合におけるバイアスを特定し,定量化し,説明するための枠組みを提案する。このパイプラインはLarge Language Model (LLM)を活用して、一連のキャプションから始まるバイアスを提案する。このフレームワークには、OpenBiasとGradBiasの2つのバリエーションがあります。
論文参考訳（メタデータ） (2024-08-29T16:51:07Z)
VersusDebias: Universal Zero-Shot Debiasing for Text-to-Image Models via SLM-Based Prompt Engineering and Generative Adversary [8.24274551090375]
本稿では,任意のテキスト・トゥ・イメージ(T2I)モデルにおけるバイアスに対する新奇で普遍的なデバイアスフレームワークであるVersusDebiasを紹介する。自己適応モジュールは、プロセス後の幻覚と複数の属性を同時にデバイアスする特別な属性配列を生成する。ゼロショットと少数ショットの両方のシナリオでは、VersusDebiasは既存のメソッドよりも優れており、例外的なユーティリティを示している。
論文参考訳（メタデータ） (2024-07-28T16:24:07Z)
MoESD: Mixture of Experts Stable Diffusion to Mitigate Gender Bias [23.10522891268232]
テキスト・ツー・イメージ・モデルにおいて、ジェンダーバイアスを軽減するためのMixture-of-Expertsアプローチを導入する。画像品質を維持しながら, 性別偏見の軽減に成功していることを示す。
論文参考訳（メタデータ） (2024-06-25T14:59:31Z)
VLBiasBench: A Comprehensive Benchmark for Evaluating Bias in Large Vision-Language Model [72.13121434085116]
VLBiasBenchは、LVLM(Large Vision-Language Models)におけるバイアスの評価を目的としたベンチマークである。我々は、年齢、障害状態、性別、国籍、身体的外観、人種、宗教、職業、社会的経済状態、および2つの交叉バイアスカテゴリー(人種x性、人種x社会経済状態)を含む9つの異なる社会バイアスカテゴリーを含むデータセットを構築した。 15のオープンソースモデルと1つの高度なクローズドソースモデルに対して広範な評価を行い、これらのモデルから明らかになったバイアスに関する新たな洞察を提供する。
論文参考訳（メタデータ） (2024-06-20T10:56:59Z)
MIST: Mitigating Intersectional Bias with Disentangled Cross-Attention Editing in Text-to-Image Diffusion Models [3.3454373538792552]
本稿では,拡散型テキスト・画像モデルにおける交叉バイアスに対処する手法を提案する。提案手法では,事前学習した安定拡散モデルを用いて,参照画像の追加の必要性を排除し,未修正概念の本来の品質を維持する。
論文参考訳（メタデータ） (2024-03-28T17:54:38Z)
Quantifying Bias in Text-to-Image Generative Models [49.60774626839712]
テキスト・トゥ・イメージ(T2I)モデルにおけるバイアスは不公平な社会的表現を伝播させ、アイデアを積極的にマーケティングしたり、議論の的となっている議題を推進したりするのに用いられる。既存のT2Iモデルバイアス評価手法は、社会的バイアスのみに焦点を当てる。本稿では,T2I生成モデルにおける一般バイアスの定量化手法を提案する。
論文参考訳（メタデータ） (2023-12-20T14:26:54Z)
Debiasing Vision-Language Models via Biased Prompts [79.04467131711775]
本稿では,テキスト埋め込みにおけるバイアスのある方向を投影することで,視覚言語基盤モデルを疎外する一般的な手法を提案する。偏平投影行列を組み込んだテキストのみをデバイアスすることで、ロバストな分類器と公正な生成モデルが得られることを示す。
論文参考訳（メタデータ） (2023-01-31T20:09:33Z)
Discovering and Mitigating Visual Biases through Keyword Explanation [66.71792624377069]
視覚バイアスをキーワードとして解釈するBias-to-Text(B2T)フレームワークを提案する。 B2Tは、CelebAの性別バイアス、ウォーターバードの背景バイアス、ImageNet-R/Cの分布シフトなど、既知のバイアスを特定することができる。 B2Tは、Dollar StreetやImageNetのような大きなデータセットで、新しいバイアスを明らかにする。
論文参考訳（メタデータ） (2023-01-26T13:58:46Z)
Don't Discard All the Biased Instances: Investigating a Core Assumption in Dataset Bias Mitigation Techniques [19.252319300590656]
データセットバイアスを緩和する既存のテクニックは、バイアス付きモデルを利用してバイアス付きインスタンスを識別することが多い。これらの偏りのあるインスタンスの役割は、メインモデルのトレーニング中に減少し、アウト・オブ・ディストリビューションデータに対するロバスト性を高める。本稿では,この仮定が一般には成り立たないことを示す。
論文参考訳（メタデータ） (2021-09-01T10:25:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。