論文の概要: Dissecting and Mitigating Diffusion Bias via Mechanistic Interpretability
- arxiv url: http://arxiv.org/abs/2503.20483v1
- Date: Wed, 26 Mar 2025 12:13:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-27 13:21:31.644104
- Title: Dissecting and Mitigating Diffusion Bias via Mechanistic Interpretability
- Title(参考訳): 機械的解釈可能性による拡散バイアスの分離と緩和
- Authors: Yingdong Shi, Changming Li, Yifan Wang, Yongxiang Zhao, Anqi Pang, Sibei Yang, Jingyi Yu, Kan Ren,
- Abstract要約: 拡散モデルは多様なコンテンツにおいて印象的な能力を示している。
これらのモデルは、性別や人種など、しばしば社会的偏見を持続させる。
本研究では,拡散モデルの内部プロセスについて検討し,特定の意思決定機構を同定する。
- 参考スコア(独自算出の注目度): 42.286648800681846
- License:
- Abstract: Diffusion models have demonstrated impressive capabilities in synthesizing diverse content. However, despite their high-quality outputs, these models often perpetuate social biases, including those related to gender and race. These biases can potentially contribute to harmful real-world consequences, reinforcing stereotypes and exacerbating inequalities in various social contexts. While existing research on diffusion bias mitigation has predominantly focused on guiding content generation, it often neglects the intrinsic mechanisms within diffusion models that causally drive biased outputs. In this paper, we investigate the internal processes of diffusion models, identifying specific decision-making mechanisms, termed bias features, embedded within the model architecture. By directly manipulating these features, our method precisely isolates and adjusts the elements responsible for bias generation, permitting granular control over the bias levels in the generated content. Through experiments on both unconditional and conditional diffusion models across various social bias attributes, we demonstrate our method's efficacy in managing generation distribution while preserving image quality. We also dissect the discovered model mechanism, revealing different intrinsic features controlling fine-grained aspects of generation, boosting further research on mechanistic interpretability of diffusion models.
- Abstract(参考訳): 拡散モデルは多様なコンテンツを合成する素晴らしい能力を示している。
しかしながら、高品質なアウトプットにもかかわらず、これらのモデルはしばしば、性別や人種に関連するものを含む社会的偏見を持続させる。
これらのバイアスは、ステレオタイプを強化し、様々な社会的文脈における不平等を悪化させる、有害な現実世界の結果に寄与する可能性がある。
拡散バイアス緩和に関する既存の研究は、主にコンテンツ生成を導くことに焦点が当てられているが、バイアス出力を因果的に駆動する拡散モデルにおける本質的なメカニズムを無視することが多い。
本稿では,拡散モデルの内部プロセスについて検討し,モデルアーキテクチャに埋め込まれた特定の決定機構,すなわちバイアス特徴を同定する。
これらの特徴を直接操作することにより、本手法は、バイアス発生に関与する要素を正確に分離し、調整し、生成されたコンテンツのバイアスレベルをきめ細かい制御を可能にする。
様々な社会的バイアス特性の非条件拡散モデルと条件拡散モデルの実験を通じて,画像品質を保ちながら生成分布を管理する方法の有効性を実証した。
また, モデル機構を解明し, 生成のきめ細かい面を制御し, 拡散モデルの機械論的解釈可能性の向上を図った。
関連論文リスト
- Simple Guidance Mechanisms for Discrete Diffusion Models [44.377206440698586]
我々は、均一ノイズを利用した新しい拡散モデルを開発し、その出力を連続的に編集できるため、より誘導可能である。
我々はこれらのモデルの品質を、最先端の性能をもたらす新しい連続時間変動下界で改善する。
論文 参考訳(メタデータ) (2024-12-13T15:08:30Z) - Generative Intervention Models for Causal Perturbation Modeling [80.72074987374141]
多くの応用において、システムのメカニズムが外部の摂動によって変更されるかは未定である。
本稿では、これらの摂動特徴を原子間干渉による分布にマッピングする方法を学習する生成的介入モデル(GIM)を提案する。
論文 参考訳(メタデータ) (2024-11-21T10:37:57Z) - Predicting Cascading Failures with a Hyperparametric Diffusion Model [66.89499978864741]
拡散モデルのレンズによる電力グリッドのカスケード故障について検討する。
我々のモデルは、バイラル拡散原理と物理に基づく概念を統合する。
この拡散モデルはカスケード故障の痕跡から学習可能であることを示す。
論文 参考訳(メタデータ) (2024-06-12T02:34:24Z) - Theoretical Insights for Diffusion Guidance: A Case Study for Gaussian
Mixture Models [59.331993845831946]
拡散モデルは、所望の特性に向けてサンプル生成を操るために、スコア関数にタスク固有の情報を注入することの恩恵を受ける。
本稿では,ガウス混合モデルの文脈における拡散モデルに対する誘導の影響を理解するための最初の理論的研究を提供する。
論文 参考訳(メタデータ) (2024-03-03T23:15:48Z) - The Emergence of Reproducibility and Generalizability in Diffusion Models [10.188731323681575]
同じスタートノイズ入力と決定論的サンプリングが与えられた場合、異なる拡散モデルはしばしば驚くほど類似した出力が得られる。
拡散モデルはトレーニングデータサイズの影響を受けやすい分布を学習していることを示す。
この価値ある性質は、条件付き使用、逆問題解決、モデル微調整など、拡散モデルの多くの変種に一般化される。
論文 参考訳(メタデータ) (2023-10-08T19:02:46Z) - Mask, Stitch, and Re-Sample: Enhancing Robustness and Generalizability
in Anomaly Detection through Automatic Diffusion Models [8.540959938042352]
本稿では,拡散モデルのロバスト性を高める新しい手法であるAutoDDPMを提案する。
結合ノイズ分布再サンプリングにより、AutoDDPMは調和効果と塗装効果を達成する。
これはまた、現在の拡散モデルの限界に関する貴重な洞察と分析にも貢献する。
論文 参考訳(メタデータ) (2023-05-31T08:21:17Z) - Analyzing Bias in Diffusion-based Face Generation Models [75.80072686374564]
拡散モデルは、合成データ生成と画像編集アプリケーションでますます人気がある。
本研究では, 性別, 人種, 年齢などの属性に関して, 拡散型顔生成モデルにおけるバイアスの存在について検討する。
本研究は,GAN(Generative Adversarial Network)とGAN(Generative Adversarial Network)をベースとした顔生成モデルにおいて,データセットサイズが属性組成および知覚品質に与える影響について検討する。
論文 参考訳(メタデータ) (2023-05-10T18:22:31Z) - Diffusion Models in Vision: A Survey [73.10116197883303]
拡散モデルは、前方拡散段階と逆拡散段階の2つの段階に基づく深層生成モデルである。
拡散モデルは、既知の計算負荷にもかかわらず、生成したサンプルの品質と多様性に対して広く評価されている。
論文 参考訳(メタデータ) (2022-09-10T22:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。