論文の概要: Seeing the Unseen: How EMoE Unveils Bias in Text-to-Image Diffusion Models
- arxiv url: http://arxiv.org/abs/2505.13273v1
- Date: Mon, 19 May 2025 15:53:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.71437
- Title: Seeing the Unseen: How EMoE Unveils Bias in Text-to-Image Diffusion Models
- Title(参考訳): EMoEがテキストと画像の拡散モデルでバイアスを解き明かす
- Authors: Lucas Berry, Axel Brando, Wei-Di Chang, Juan Camilo Gamboa Higuera, David Meger,
- Abstract要約: テキストと画像の拡散モデルにおける不確実性を推定することは、その大きなパラメータ数と複雑な高次元空間での操作のために困難である。
本研究では, 拡散モデルにおける疫学的不確実性を効率的に推定する新しいフレームワークであるEpistemic Mixture of Experts (EMoE)を提案する。
- 参考スコア(独自算出の注目度): 13.841466720774838
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating uncertainty in text-to-image diffusion models is challenging because of their large parameter counts (often exceeding 100 million) and operation in complex, high-dimensional spaces with virtually infinite input possibilities. In this paper, we propose Epistemic Mixture of Experts (EMoE), a novel framework for efficiently estimating epistemic uncertainty in diffusion models. EMoE leverages pre-trained networks without requiring additional training, enabling direct uncertainty estimation from a prompt. We leverage a latent space within the diffusion process that captures epistemic uncertainty better than existing methods. Experimental results on the COCO dataset demonstrate EMoE's effectiveness, showing a strong correlation between uncertainty and image quality. Additionally, EMoE identifies under-sampled languages and regions with higher uncertainty, revealing hidden biases in the training set. This capability demonstrates the relevance of EMoE as a tool for addressing fairness and accountability in AI-generated content.
- Abstract(参考訳): テキストと画像の拡散モデルにおける不確実性の推定は、その大きなパラメータ数(しばしば1億を超える)と、事実上無限の入力可能性を持つ複素高次元空間での演算のために困難である。
本稿では,拡散モデルにおける疫学的不確実性を効率的に推定する新しいフレームワークである疫学混合専門家(EMoE)を提案する。
EMoEは、追加のトレーニングを必要とせずに事前訓練されたネットワークを活用し、プロンプトからの直接の不確実性推定を可能にする。
拡散過程における潜伏空間を利用して、既存の方法よりも疫学的な不確実性を捉える。
COCOデータセットの実験結果は、EMoEの有効性を示し、不確実性と画像品質の間に強い相関関係を示す。
さらに、EMoEはアンダーサンプル言語と、より高い不確実性を持つ領域を特定し、トレーニングセットに隠れたバイアスを明らかにする。
この能力は、AI生成コンテンツの公平性と説明責任に対処するツールとしてのEMoEの関連性を示す。
関連論文リスト
- Generalized Interpolating Discrete Diffusion [65.74168524007484]
仮面拡散はその単純さと有効性のために一般的な選択である。
離散拡散過程を補間する一般族の理論的バックボーンを導出する。
GIDDのフレキシビリティをエクスプロイトし、マスクと均一ノイズを組み合わせたハイブリッドアプローチを探索する。
論文 参考訳(メタデータ) (2025-03-06T14:30:55Z) - Latent Distribution Decoupling: A Probabilistic Framework for Uncertainty-Aware Multimodal Emotion Recognition [7.25361375272096]
マルチモーダル・マルチラベル感情認識は,マルチモーダルデータにおける複数の感情の存在を同時に認識することを目的としている。
既存の研究では、マルチモーダルデータに固有のノイズであるテクスブファレラティック不確実性の影響を見落としている。
本稿では,不確かさ認識フレームワークを用いた潜在感情分布分解法を提案する。
論文 参考訳(メタデータ) (2025-02-19T18:53:23Z) - Detecting Discrepancies Between AI-Generated and Natural Images Using Uncertainty [91.64626435585643]
本稿では,誤用と関連するリスクを軽減するために,予測不確実性を利用してAI生成画像を検出する新しい手法を提案する。
この動機は、自然画像とAI生成画像の分布差に関する基本的な仮定から生じる。
本稿では,AI生成画像の検出スコアとして,大規模事前学習モデルを用いて不確実性を計算することを提案する。
論文 参考訳(メタデータ) (2024-12-08T11:32:25Z) - Shedding Light on Large Generative Networks: Estimating Epistemic Uncertainty in Diffusion Models [15.352556466952477]
生成拡散モデルは、その大きなパラメータ数(1億を超える)と高次元画像空間での操作で顕著である。
本研究では,拡散モデルに対する疫学的不確実性を推定するための新しいフレームワークであるDiffusion Ensembles for Capturing Uncertainty (DECU)を導入する。
論文 参考訳(メタデータ) (2024-06-05T14:03:21Z) - Estimating Epistemic and Aleatoric Uncertainty with a Single Model [5.871583927216653]
我々は,ハイパー拡散モデル(HyperDM)の新しいアプローチを提案する。
HyperDMは、予測精度を、場合によってはマルチモデルアンサンブルに匹敵する。
我々は,X線CTと気象温度予測の2つの異なる実世界の課題に対して,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-02-05T19:39:52Z) - Adv-Diffusion: Imperceptible Adversarial Face Identity Attack via Latent
Diffusion Model [61.53213964333474]
本稿では,生の画素空間ではなく,潜在空間における非知覚的対角的アイデンティティ摂動を生成できる統一的なフレームワークAdv-Diffusionを提案する。
具体的には,周囲のセマンティックな摂動を生成するために,個人性に敏感な条件付き拡散生成モデルを提案する。
設計された適応強度に基づく対向摂動アルゴリズムは、攻撃の伝達性とステルス性の両方を確保することができる。
論文 参考訳(メタデータ) (2023-12-18T15:25:23Z) - Measuring and Modeling Uncertainty Degree for Monocular Depth Estimation [50.920911532133154]
単分子深度推定モデル(MDE)の本質的な不適切さと順序感性は、不確かさの程度を推定する上で大きな課題となる。
本稿では,MDEモデルの不確かさを固有確率分布の観点からモデル化する。
新たなトレーニング正規化用語を導入することで、驚くほど単純な構成で、余分なモジュールや複数の推論を必要とせずに、最先端の信頼性で不確実性を推定できる。
論文 参考訳(メタデータ) (2023-07-19T12:11:15Z) - CamoDiffusion: Camouflaged Object Detection via Conditional Diffusion
Models [72.93652777646233]
カモフラーゲ型物体検出(COD)は、カモフラーゲ型物体とその周囲の類似性が高いため、コンピュータビジョンにおいて難しい課題である。
本研究では,CODを拡散モデルを利用した条件付きマスク生成タスクとして扱う新しいパラダイムを提案する。
カモ拡散(CamoDiffusion)と呼ばれる本手法では,拡散モデルのデノナイズプロセスを用いてマスクの雑音を反復的に低減する。
論文 参考訳(メタデータ) (2023-05-29T07:49:44Z) - The role of MRI physics in brain segmentation CNNs: achieving
acquisition invariance and instructive uncertainties [3.46329153611365]
本稿では,物理インフォームド・不確実性を考慮したセグメンテーションネットワークの有効性を示す。
提案手法は, 分布外配列サンプルに対して精度良く外挿することを示す。
本研究では,不確実性に基づくボリューム検証による変動係数の大幅な改善を示す。
論文 参考訳(メタデータ) (2021-11-04T11:52:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。