論文の概要: Investigation of Accuracy and Bias in Face Recognition Trained with Synthetic Data
- arxiv url: http://arxiv.org/abs/2507.20782v1
- Date: Mon, 28 Jul 2025 12:52:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:58.119242
- Title: Investigation of Accuracy and Bias in Face Recognition Trained with Synthetic Data
- Title(参考訳): 合成データを用いた顔認識における精度とバイアスの検討
- Authors: Pavel Korshunov, Ketan Kotwal, Christophe Ecabert, Vidit Vidit, Amir Mohammadi, Sebastien Marcel,
- Abstract要約: 顔認識システムのバイアスと性能に及ぼす合成データの影響を評価する。
合成データセットと実データセットの同一性数を維持することにより、公正な比較が保証される。
以上の結果から,IJB-B/Cの一般化において,合成データは実際のデータセットよりも遅れているものの,人口統計学的にバランスのとれた合成データセット,特にSD35で生成された合成データセットは,バイアス軽減の可能性を示している。
- 参考スコア(独自算出の注目度): 10.241047069730058
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Synthetic data has emerged as a promising alternative for training face recognition (FR) models, offering advantages in scalability, privacy compliance, and potential for bias mitigation. However, critical questions remain on whether both high accuracy and fairness can be achieved with synthetic data. In this work, we evaluate the impact of synthetic data on bias and performance of FR systems. We generate balanced face dataset, FairFaceGen, using two state of the art text-to-image generators, Flux.1-dev and Stable Diffusion v3.5 (SD35), and combine them with several identity augmentation methods, including Arc2Face and four IP-Adapters. By maintaining equal identity count across synthetic and real datasets, we ensure fair comparisons when evaluating FR performance on standard (LFW, AgeDB-30, etc.) and challenging IJB-B/C benchmarks and FR bias on Racial Faces in-the-Wild (RFW) dataset. Our results demonstrate that although synthetic data still lags behind the real datasets in the generalization on IJB-B/C, demographically balanced synthetic datasets, especially those generated with SD35, show potential for bias mitigation. We also observe that the number and quality of intra-class augmentations significantly affect FR accuracy and fairness. These findings provide practical guidelines for constructing fairer FR systems using synthetic data.
- Abstract(参考訳): 合成データは、顔認識(FR)モデルをトレーニングするための有望な代替手段として登場し、スケーラビリティ、プライバシコンプライアンス、バイアス軽減の可能性を提供する。
しかし、高い精度と公平性を合成データで達成できるかどうかについては、重要な疑問が残る。
本研究では, FRシステムのバイアスと性能に及ぼす合成データの影響を評価する。
バランスの取れた顔データセットであるFairFaceGenを生成し、Flux.1-devとStable Diffusion v3.5(SD35)という2つの最先端のテキスト・トゥ・イメージジェネレータを使用して、Arc2Faceと4つのIPアダプタを含むいくつかのID拡張メソッドを組み合わせる。
合成データセットと実データセットの同一性数を維持することにより、標準(LFW, AgeDB-30など)でのFR性能の評価と、Racial Faces in-the-Wild(RFW)データセットでのIJB-B/CベンチマークとFRバイアスへの挑戦において、公正な比較を確保する。
以上の結果から,IJB-B/Cの一般化において,合成データは実際のデータセットよりも遅れているものの,人口統計学的にバランスのとれた合成データセット,特にSD35で生成された合成データセットは,バイアス軽減の可能性を示している。
また,クラス内増強の回数と品質がFRの精度と公平性に有意な影響を及ぼすことも確認した。
これらの結果は,合成データを用いたより公正なFRシステム構築のための実践的ガイドラインを提供する。
関連論文リスト
- FairCauseSyn: Towards Causally Fair LLM-Augmented Synthetic Data Generation [4.392938909804638]
合成データ生成は、生成モデルを用いて実世界のデータに基づいてデータを生成する。
実世界の健康データを用いて因果フェアネスを高めるために,初めてLLMを付加した合成データ生成法を開発した。
因果的公正予測器で訓練すると、合成データは実際のデータと比較して感度属性のバイアスを70%削減する。
論文 参考訳(メタデータ) (2025-06-23T19:59:26Z) - Can Synthetic Data be Fair and Private? A Comparative Study of Synthetic Data Generation and Fairness Algorithms [2.144088660722956]
Debiasing CAusal Fairness (DECAF)アルゴリズムは、プライバシとフェアネスの最良のバランスを実現する。
合成データに事前処理の公正性アルゴリズムを適用することで、実際のデータに適用した場合よりも公平性が向上する。
論文 参考訳(メタデータ) (2025-01-03T12:35:58Z) - Second FRCSyn-onGoing: Winning Solutions and Post-Challenge Analysis to Improve Face Recognition with Synthetic Data [104.30479583607918]
第2回FRCSyn-onGoingチャレンジは、CVPR 2024で開始された第2回顔認識チャレンジ(FRCSyn)に基づいている。
我々は、顔認識における現在の課題を解決するために、個々のデータと実際のデータの組み合わせの両方で合成データの利用を検討することに重点を置いている。
論文 参考訳(メタデータ) (2024-12-02T11:12:01Z) - The Impact of Balancing Real and Synthetic Data on Accuracy and Fairness in Face Recognition [10.849598219674132]
人口統計学的にバランスのとれた認証データと合成データとが、顔認識モデルの精度と公正性に与える影響について検討した。
本研究は,<i>I</i> と<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>E</i>,<i>,</i>,<i>,<i>,<i>I</i>,</i>,<i>,<i>,<i>,<i>,
論文 参考訳(メタデータ) (2024-09-04T16:50:48Z) - Reliability in Semantic Segmentation: Can We Use Synthetic Data? [69.28268603137546]
セマンティックセグメンテーションモデルの現実的信頼性を総合的に評価するために、合成データを具体的に生成する方法を初めて示す。
この合成データは、事前訓練されたセグメンタの堅牢性を評価するために使用される。
セグメンタのキャリブレーションとOOD検出能力を向上するために,我々のアプローチをどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2023-12-14T18:56:07Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - DECAF: Generating Fair Synthetic Data Using Causally-Aware Generative
Networks [71.6879432974126]
本稿では,GANに基づく表型データのための公正な合成データ生成装置であるDECAFを紹介する。
DeCAFは望ましくないバイアスを除去し,高品質な合成データを生成可能であることを示す。
下流モデルの収束と公平性に関する理論的保証を提供する。
論文 参考訳(メタデータ) (2021-10-25T12:39:56Z) - On the use of automatically generated synthetic image datasets for
benchmarking face recognition [2.0196229393131726]
GAN(Generative Adversarial Networks)の最近の進歩は、実際のデータセットを合成データセットで置き換える経路を提供する。
現実的な顔画像を合成するためのGAN(Generative Adversarial Networks)の最近の進歩は、実際のデータセットを合成データセットで置き換える経路を提供する。
合成データセットのベンチマーク結果は、良い置換であり、多くの場合、実際のデータセットのベンチマークと同様のエラー率とシステムランキングを提供する。
論文 参考訳(メタデータ) (2021-06-08T09:54:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。