論文の概要: Beyond Real Faces: Synthetic Datasets Can Achieve Reliable Recognition Performance without Privacy Compromise
- arxiv url: http://arxiv.org/abs/2510.17372v1
- Date: Mon, 20 Oct 2025 10:08:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.396117
- Title: Beyond Real Faces: Synthetic Datasets Can Achieve Reliable Recognition Performance without Privacy Compromise
- Title(参考訳): 現実の顔を超えた: 合成データセットは、プライバシの妥協なしに信頼性の高い認識性能を得ることができる
- Authors: Paweł Borsukiewicz, Fadi Boutros, Iyiola E. Olatunji, Charles Beumier, Wendkûuni C. Ouedraogo, Jacques Klein, Tegawendé F. Bissyandé,
- Abstract要約: 本稿では,25の合成顔認識データセットを同定する体系的な文献レビューを行う。
本手法では,プライバシ保護のための7つの重要な要件について検討する。
最高のパフォーマンスの合成データセット(Face, VIGFace)は、それぞれ95.67%と94.91%の認識精度を達成する。
- 参考スコア(独自算出の注目度): 14.844999047343464
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The deployment of facial recognition systems has created an ethical dilemma: achieving high accuracy requires massive datasets of real faces collected without consent, leading to dataset retractions and potential legal liabilities under regulations like GDPR. While synthetic facial data presents a promising privacy-preserving alternative, the field lacks comprehensive empirical evidence of its viability. This study addresses this critical gap through extensive evaluation of synthetic facial recognition datasets. We present a systematic literature review identifying 25 synthetic facial recognition datasets (2018-2025), combined with rigorous experimental validation. Our methodology examines seven key requirements for privacy-preserving synthetic data: identity leakage prevention, intra-class variability, identity separability, dataset scale, ethical data sourcing, bias mitigation, and benchmark reliability. Through experiments involving over 10 million synthetic samples, extended by a comparison of results reported on five standard benchmarks, we provide the first comprehensive empirical assessment of synthetic data's capability to replace real datasets. Best-performing synthetic datasets (VariFace, VIGFace) achieve recognition accuracies of 95.67% and 94.91% respectively, surpassing established real datasets including CASIA-WebFace (94.70%). While those images remain private, publicly available alternatives Vec2Face (93.52%) and CemiFace (93.22%) come close behind. Our findings reveal that they ensure proper intra-class variability while maintaining identity separability. Demographic bias analysis shows that, even though synthetic data inherits limited biases, it offers unprecedented control for bias mitigation through generation parameters. These results establish synthetic facial data as a scientifically viable and ethically imperative alternative for facial recognition research.
- Abstract(参考訳): 高い精度を達成するには、同意なしに収集された実際の顔の大量のデータセットが必要である。
合成顔データには、プライバシー保護の選択肢として有望なものがあるが、この分野には、その生存可能性に関する包括的な実証的な証拠がない。
本研究は、合成顔認識データセットの広範囲な評価を通じて、この重要なギャップに対処する。
本稿では,25の合成顔認識データセット(2018-2025)と厳密な実験的検証を併用した系統的な文献レビューを行う。
本手法では,プライバシ保護のための7つの重要な要件として,アイデンティティリーク防止,クラス内変動性,アイデンティティ分離性,データセットスケール,倫理的データソーシング,バイアス緩和,ベンチマーク信頼性について検討する。
5つの標準ベンチマークで報告された結果の比較によって拡張された1000万以上の合成サンプルを含む実験を通じて、我々は、実際のデータセットを置き換える合成データの能力を、初めて包括的に評価した。
最高のパフォーマンスの合成データセット(VariFace、VIGFace)は、それぞれ95.67%と94.91%の認識精度を達成し、CASIA-WebFace (94.70%)を含む既存の実際のデータセットを上回っている。
これらの画像は非公開のままだが、Vec2Face (93.52%) や CemiFace (93.22%) が遅れている。
本研究により,アイデンティティ分離性を維持しつつ,クラス内変動を適切に確保できることが判明した。
デモグラフィックバイアス分析は、合成データは限られたバイアスを継承するが、生成パラメータによるバイアス緩和に対する前例のない制御を提供することを示している。
これらの結果は、顔認識研究の科学的に有効で倫理的に必須な代替手段として、合成顔データを確立している。
関連論文リスト
- Second FRCSyn-onGoing: Winning Solutions and Post-Challenge Analysis to Improve Face Recognition with Synthetic Data [104.30479583607918]
第2回FRCSyn-onGoingチャレンジは、CVPR 2024で開始された第2回顔認識チャレンジ(FRCSyn)に基づいている。
我々は、顔認識における現在の課題を解決するために、個々のデータと実際のデータの組み合わせの両方で合成データの利用を検討することに重点を置いている。
論文 参考訳(メタデータ) (2024-12-02T11:12:01Z) - SynFER: Towards Boosting Facial Expression Recognition with Synthetic Data [78.70620682374624]
ハイレベルなテキスト記述に基づく表情画像データの合成のための新しいフレームワークであるSynFERを紹介する。
合成データの質と信頼性を確保するため,セマンティックガイダンス手法と擬似ラベル生成手法を提案する。
その結果, 提案手法の有効性と合成データの有効性が検証された。
論文 参考訳(メタデータ) (2024-10-13T14:58:21Z) - SDFR: Synthetic Data for Face Recognition Competition [51.9134406629509]
大規模な顔認識データセットは、インターネットをクロールして個人の同意なしに収集し、法的、倫理的、プライバシー上の懸念を提起する。
近年、ウェブクローリングされた顔認識データセットにおける懸念を軽減するために、合成顔認識データセットの生成が提案されている。
本稿では,第18回IEEE International Conference on Automatic Face and Gesture Recognition (FG 2024)と共同で開催されているSynthetic Data for Face Recognition (SDFR)コンペティションの概要を紹介する。
SDFRコンペティションは2つのタスクに分けられ、参加者は新しい合成データセットまたは/または既存のデータセットを使用して顔認識システムを訓練することができる。
論文 参考訳(メタデータ) (2024-04-06T10:30:31Z) - If It's Not Enough, Make It So: Reducing Authentic Data Demand in Face Recognition through Synthetic Faces [16.977459035497162]
大規模な顔データセットは、主にWebベースのイメージから作成され、明示的なユーザの同意が欠如している。
本稿では,合成顔データを用いて効果的な顔認識モデルの訓練を行う方法について検討する。
論文 参考訳(メタデータ) (2024-04-04T15:45:25Z) - IDiff-Face: Synthetic-based Face Recognition through Fizzy
Identity-Conditioned Diffusion Models [15.217324893166579]
合成データセットは、顔認識開発のためのプライバシーに敏感な認証データに代わる有望な選択肢として登場した。
IDiff-Faceは、顔認識訓練のための現実的なアイデンティティ変動を伴う合成ID生成のための条件付き潜時拡散モデルに基づく、新しいアプローチである。
論文 参考訳(メタデータ) (2023-08-09T14:48:31Z) - SynFace: Face Recognition with Synthetic Data [83.15838126703719]
我々は、ID混在(IM)とドメイン混在(DM)を併用したSynFaceを考案し、パフォーマンスギャップを緩和する。
また、合成顔画像の系統的実験分析を行い、合成データを顔認識に効果的に活用する方法についての知見を提供する。
論文 参考訳(メタデータ) (2021-08-18T03:41:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。