論文の概要: Bias Redistribution in Visual Machine Unlearning: Does Forgetting One Group Harm Another?
- arxiv url: http://arxiv.org/abs/2604.08111v1
- Date: Thu, 09 Apr 2026 11:29:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.883904
- Title: Bias Redistribution in Visual Machine Unlearning: Does Forgetting One Group Harm Another?
- Title(参考訳): Visual Machine Unlearningにおけるバイアスの再分配: 1つのグループを忘れることは別の問題か?
- Authors: Yunusa Haruna, Adamu Lawan, Ibrahim Haruna Abdulhamid, Hamza Mohammed Dauda, Jiaquan Zhang, Chaoning Zhang, Shamsuddeen Hassan Muhammad,
- Abstract要約: 未学習は偏見を排除しないが、主に年齢境界ではなく性別に沿って再分類することを示す。
Refusal Vectorメソッドは再配布を減らすが、完全に忘れることができず、性能が著しく低下する。
- 参考スコア(独自算出の注目度): 11.010272355391223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine unlearning enables models to selectively forget training data, driven by privacy regulations such as GDPR and CCPA. However, its fairness implications remain underexplored: when a model forgets a demographic group, does it neutralize that concept or redistribute it to correlated groups, potentially amplifying bias? We investigate this bias redistribution phenomenon on CelebA using CLIP models (ViT/B-32, ViT-L/14, ViT-B/16) under a zero-shot classification setting across intersectional groups defined by age and gender. We evaluate three unlearning methods, Prompt Erasure, Prompt Reweighting, and Refusal Vector using per-group accuracy shifts, demographic parity gaps, and a redistribution score. Our results show that unlearning does not eliminate bias but redistributes it primarily along gender rather than age boundaries. In particular, removing the dominant Young Female group consistently transfers performance to Old Female across all model scales, revealing a gender-dominant structure in CLIP's embedding space. While the Refusal Vector method reduces redistribution, it fails to achieve complete forgetting and significantly degrades retained performance. These findings highlight a fundamental limitation of current unlearning methods: without accounting for embedding geometry, they risk amplifying bias in retained groups.
- Abstract(参考訳): マシンアンラーニングにより、GDPRやCCPAといったプライバシ規制によって駆動されるトレーニングデータを選択的に忘れることが可能になる。
モデルが人口統計学的グループを忘れたとき、その概念を中和するか、あるいは関連したグループに再分割し、バイアスを増幅する可能性があるか?
CLIPモデル (ViT/B-32, ViT-L-14, ViT-B/16) を用いてCelebA上のこのバイアス再分配現象を, 年齢と性別によって定義された交叉群にまたがるゼロショット分類の下で検討した。
本研究では,グループごとの精度変化,人口パーティギャップ,再分配スコアの3つの非学習手法,Prompt Erasure,Prompt Reweighting,Refusal Vectorを評価した。
その結果、未学習は偏見を排除せず、主に年齢境界ではなく性別に沿って再分類することがわかった。
特に、支配的な若年女性グループを取り除くことは、すべてのモデルスケールで一貫してオールドウーマンにパフォーマンスを伝達し、CLIPの埋め込み空間におけるジェンダーに支配的な構造を明らかにしている。
Refusal Vectorメソッドは再配布を減らすが、完全に忘れることができず、性能が著しく低下する。
これらの知見は, 組込み幾何学を考慮せずに, 保持群においてバイアスを増幅するリスクを負うという, 現行の未学習手法の基本的な限界を浮き彫りにしている。
関連論文リスト
- GUDA: Counterfactual Group-wise Training Data Attribution for Diffusion Models via Unlearning [83.56510119503267]
モデルがトレーニングを欠席した場合、モデルが生成したサンプルの変化に対してどのように振る舞うか?
拡散モデルに対してGUDA(Group Unlearning-based Data Attribution)を提案する。
論文 参考訳(メタデータ) (2026-01-30T07:10:59Z) - Evaluating Bias and Fairness in Gender-Neutral Pretrained
Vision-and-Language Models [23.65626682262062]
我々は,3種類の視覚・言語モデルを用いた事前学習および微調整後のバイアス増幅の定量化を行う。
全体として、事前学習および微調整後のバイアス増幅は独立である。
論文 参考訳(メタデータ) (2023-10-26T16:19:19Z) - Correcting Underrepresentation and Intersectional Bias for Classification [49.1574468325115]
我々は、表現不足のバイアスによって破損したデータから学習する問題を考察する。
偏りのないデータの少ない場合、グループワイドのドロップアウト率を効率的に推定できることが示される。
本アルゴリズムは,有限VC次元のモデルクラスに対して,効率的な学習を可能にする。
論文 参考訳(メタデータ) (2023-06-19T18:25:44Z) - Counter-GAP: Counterfactual Bias Evaluation through Gendered Ambiguous
Pronouns [53.62845317039185]
バイアス測定データセットは、言語モデルのバイアスされた振る舞いを検出する上で重要な役割を果たす。
本稿では, 多様な, 自然な, 最小限のテキストペアを, 対物生成によって収集する新しい手法を提案する。
事前学習された4つの言語モデルは、各グループ内よりも、異なる性別グループ間でかなり不整合であることを示す。
論文 参考訳(メタデータ) (2023-02-11T12:11:03Z) - Mitigating Gender Bias in Face Recognition Using the von Mises-Fisher
Mixture Model [7.049738935364298]
本研究では,ディープ顔認識ネットワークの性別バイアスについて検討する。
幾何学的考察により、新しいポストプロセッシング手法により性別バイアスを緩和する。
実際、様々なデータセットに関する広範な数値実験は、慎重に選択することで性バイアスが大幅に減少することを示している。
論文 参考訳(メタデータ) (2022-10-24T23:53:56Z) - Fair Group-Shared Representations with Normalizing Flows [68.29997072804537]
本研究では,異なるグループに属する個人を1つのグループにマッピングできる公正表現学習アルゴリズムを開発した。
提案手法は,他の公正表現学習アルゴリズムと競合することを示す。
論文 参考訳(メタデータ) (2022-01-17T10:49:49Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z) - Recovering from Biased Data: Can Fairness Constraints Improve Accuracy? [11.435833538081557]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、バイアスがあるだけでなく、真のデータ分布に最適な精度を持つ分類器を生成する。
公平性に制約されたERMによるこの問題の是正能力について検討する。
また、トレーニングデータの再重み付け、等化オッド、復号化パリティなど、他のリカバリ手法についても検討する。
論文 参考訳(メタデータ) (2019-12-02T22:00:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。