論文の概要: Zero-shot racially balanced dataset generation using an existing biased
StyleGAN2
- arxiv url: http://arxiv.org/abs/2305.07710v1
- Date: Fri, 12 May 2023 18:07:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 20:17:02.318888
- Title: Zero-shot racially balanced dataset generation using an existing biased
StyleGAN2
- Title(参考訳): 既存バイアス付きStyleGAN2を用いたゼロショット人種バランスデータセット生成
- Authors: Anubhav Jain, Nasir Memon, Julian Togelius
- Abstract要約: 本稿では, 偏りのある生成モデルであるStyleGAN2を用いて, 人口統計学的に多様な合成個体の画像を作成する手法を提案する。
1レースあたり50,000のIDを含むバランスの取れたデータセットで顔認識モデルをトレーニングすることで、パフォーマンスを改善し、実際のデータセットでトレーニングされたモデルに存在した可能性のあるバイアスを最小限にすることができる。
- 参考スコア(独自算出の注目度): 5.73382615946951
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Facial recognition systems have made significant strides thanks to data-heavy
deep learning models, but these models rely on large privacy-sensitive
datasets. Unfortunately, many of these datasets lack diversity in terms of
ethnicity and demographics, which can lead to biased models that can have
serious societal and security implications. To address these issues, we propose
a methodology that leverages the biased generative model StyleGAN2 to create
demographically diverse images of synthetic individuals. The synthetic dataset
is created using a novel evolutionary search algorithm that targets specific
demographic groups. By training face recognition models with the resulting
balanced dataset containing 50,000 identities per race (13.5 million images in
total), we can improve their performance and minimize biases that might have
been present in a model trained on a real dataset.
- Abstract(参考訳): 顔認識システムは、データの多いディープラーニングモデルのおかげで大きな進歩を遂げてきたが、これらのモデルは大きなプライバシーに敏感なデータセットに依存している。
残念なことに、これらのデータセットの多くは民族や人口統計の多様性を欠いているため、深刻な社会的・セキュリティ上の意味を持つモデルに偏りが生じる可能性がある。
これらの問題に対処するために, バイアス付き生成モデルstylegan2を用いて, 合成個体の人口分布に富む画像を作成する手法を提案する。
合成データセットは、特定の人口集団を対象とする新しい進化的探索アルゴリズムを用いて作成される。
1レースあたり5万のid(合計1350万の画像)を含むバランスのとれたデータセットで顔認識モデルをトレーニングすることで、実際のデータセットでトレーニングされたモデルに存在したバイアスを最小限に抑えることができる。
関連論文リスト
- Enriching Datasets with Demographics through Large Language Models: What's in a Name? [5.871504332441324]
LLM(Large Language Models)は、特殊なデータに基づいてトレーニングされた振る舞いモデルだけでなく、パフォーマンスも向上する。
香港の認可された金融専門家の実際のデータセットを含む、さまざまなデータセットにこれらのLCMを適用します。
論文 参考訳(メタデータ) (2024-09-17T18:40:49Z) - Synthetic Data for the Mitigation of Demographic Biases in Face
Recognition [10.16490522214987]
本研究では, 顔認識技術に影響を及ぼす人口統計バイアスを, 合成データを用いて緩和する可能性について検討した。
GANDiffFaceによって生成された合成データセットは、制御可能な人口分布と現実的なクラス内変動を用いて、顔認識のためのデータセットを合成できる新しいフレームワークである。
本研究は、顔認識における人口統計バイアスを軽減するために、提案手法と合成データの利用を支持する。
論文 参考訳(メタデータ) (2024-02-02T14:57:42Z) - Fast Model Debias with Machine Unlearning [54.32026474971696]
ディープニューラルネットワークは多くの現実世界のシナリオでバイアスのある振る舞いをする。
既存のデバイアス法は、バイアスラベルやモデル再トレーニングのコストが高い。
バイアスを特定し,評価し,除去するための効率的なアプローチを提供する高速モデル脱バイアスフレームワーク(FMD)を提案する。
論文 参考訳(メタデータ) (2023-10-19T08:10:57Z) - Toward responsible face datasets: modeling the distribution of a
disentangled latent space for sampling face images from demographic groups [0.0]
近年、一部の現代の顔認識システムが特定の人口集団を識別できることが明らかにされている。
そこで我々は,StyleGANラテント空間の非交叉射影をモデル化し,サンプリングするための簡単な手法を提案する。
実験の結果、人口集団の組み合わせを効果的に合成できることが示され、同一性は元のトレーニングデータセットと異なることがわかった。
論文 参考訳(メタデータ) (2023-09-15T14:42:04Z) - TIDE: Textual Identity Detection for Evaluating and Augmenting
Classification and Language Models [0.0]
機械学習モデルは、不公平で不均衡なデータセットから意図しないバイアスを永続することができる。
分類器と言語モデルにおけるテキストの公平性を改善するためのアプローチと組み合わせたデータセットを提案する。
我々は、IDコンテキストの可用性向上に使用できるIDアノテーションと拡張ツールを開発するために、TIDALを活用している。
論文 参考訳(メタデータ) (2023-09-07T21:44:42Z) - Balanced Face Dataset: Guiding StyleGAN to Generate Labeled Synthetic
Face Image Dataset for Underrepresented Group [0.0]
現実世界のデータセットは、しばしば過剰に表現され、表現されていないグループである。
機械学習におけるバイアスを軽減する一つの解決策は、多様で代表的なデータセットを活用することである。
本研究の目的は、StyleGANモデルを用いて、堅牢な顔画像データセットを作成することである。
論文 参考訳(メタデータ) (2023-08-07T11:42:50Z) - Debiasing Vision-Language Models via Biased Prompts [79.04467131711775]
本稿では,テキスト埋め込みにおけるバイアスのある方向を投影することで,視覚言語基盤モデルを疎外する一般的な手法を提案する。
偏平投影行列を組み込んだテキストのみをデバイアスすることで、ロバストな分類器と公正な生成モデルが得られることを示す。
論文 参考訳(メタデータ) (2023-01-31T20:09:33Z) - Synthetic Model Combination: An Instance-wise Approach to Unsupervised
Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。
専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文 参考訳(メタデータ) (2022-10-11T10:20:31Z) - SF-PATE: Scalable, Fair, and Private Aggregation of Teacher Ensembles [50.90773979394264]
本稿では、個人の機密情報のプライバシーを保護しつつ、差別的でない予測者の学習を可能にするモデルについて検討する。
提案モデルの主な特徴は、プライバシ保護とフェアモデルを作成するために、オフ・ザ・セルフと非プライベートフェアモデルの採用を可能にすることである。
論文 参考訳(メタデータ) (2022-04-11T14:42:54Z) - Enhancing Facial Data Diversity with Style-based Face Aging [59.984134070735934]
特に、顔データセットは、通常、性別、年齢、人種などの属性の観点からバイアスされる。
本稿では, 細粒度の老化パターンをキャプチャするデータ拡張のための, 生成スタイルに基づく新しいアーキテクチャを提案する。
提案手法は, 年齢移動のための最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-06T21:53:44Z) - Investigating Bias in Deep Face Analysis: The KANFace Dataset and
Empirical Study [67.3961439193994]
現在までに最も包括的で大規模な顔画像とビデオのデータセットを導入している。
データは、アイデンティティ、正確な年齢、性別、親族関係の点で手動で注釈付けされる。
提案したベンチマークでネットワーク埋め込みをデバイアス化する手法を導入し,テストした。
論文 参考訳(メタデータ) (2020-05-15T00:14:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。