論文の概要: Enhancing Domain Diversity in Synthetic Data Face Recognition with Dataset Fusion
- arxiv url: http://arxiv.org/abs/2507.16790v1
- Date: Tue, 22 Jul 2025 17:36:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:14.232261
- Title: Enhancing Domain Diversity in Synthetic Data Face Recognition with Dataset Fusion
- Title(参考訳): データセット融合による合成データ顔認識における領域の多様性向上
- Authors: Anjith George, Sebastien Marcel,
- Abstract要約: アーキテクチャ的に異なるバックボーンを用いて生成した2つの最先端合成顔データセットを組み合わせることで,その解を提案する。
この融合は、モデル固有のアーティファクトを減らし、ポーズ、照明、人口動態の多様性を高め、アイデンティティ関連の特徴を強調することで、顔認識モデルを暗黙的に規則化する。
- 参考スコア(独自算出の注目度): 4.910937238451485
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: While the accuracy of face recognition systems has improved significantly in recent years, the datasets used to train these models are often collected through web crawling without the explicit consent of users, raising ethical and privacy concerns. To address this, many recent approaches have explored the use of synthetic data for training face recognition models. However, these models typically underperform compared to those trained on real-world data. A common limitation is that a single generator model is often used to create the entire synthetic dataset, leading to model-specific artifacts that may cause overfitting to the generator's inherent biases and artifacts. In this work, we propose a solution by combining two state-of-the-art synthetic face datasets generated using architecturally distinct backbones. This fusion reduces model-specific artifacts, enhances diversity in pose, lighting, and demographics, and implicitly regularizes the face recognition model by emphasizing identity-relevant features. We evaluate the performance of models trained on this combined dataset using standard face recognition benchmarks and demonstrate that our approach achieves superior performance across many of these benchmarks.
- Abstract(参考訳): 近年、顔認識システムの精度は大幅に改善されているが、これらのモデルのトレーニングに使われるデータセットは、ユーザの明示的な同意なしにWebクローリングを通じて収集され、倫理的およびプライバシー上の懸念が提起されることが多い。
これを解決するために、近年、顔認識モデルのトレーニングに合成データを使用する方法が数多く検討されている。
しかし、これらのモデルは通常、現実世界のデータで訓練されたモデルと比べて性能が劣る。
一般的な制限は、単一のジェネレータモデルを使用して合成データセット全体を生成し、モデル固有のアーティファクトがジェネレータ固有のバイアスやアーティファクトに過度に適合する可能性があることである。
本研究では,アーキテクチャ的に異なるバックボーンを用いて生成した2つの最先端合成顔データセットを組み合わせることで,その解を提案する。
この融合は、モデル固有のアーティファクトを減らし、ポーズ、照明、人口動態の多様性を高め、アイデンティティ関連の特徴を強調することで、顔認識モデルを暗黙的に規則化する。
我々は,この組み合わせデータセット上で訓練されたモデルの性能を,標準的な顔認識ベンチマークを用いて評価し,これらのベンチマークにおいて,我々のアプローチが優れた性能を達成できることを実証した。
関連論文リスト
- Second FRCSyn-onGoing: Winning Solutions and Post-Challenge Analysis to Improve Face Recognition with Synthetic Data [104.30479583607918]
第2回FRCSyn-onGoingチャレンジは、CVPR 2024で開始された第2回顔認識チャレンジ(FRCSyn)に基づいている。
我々は、顔認識における現在の課題を解決するために、個々のデータと実際のデータの組み合わせの両方で合成データの利用を検討することに重点を置いている。
論文 参考訳(メタデータ) (2024-12-02T11:12:01Z) - HyperFace: Generating Synthetic Face Recognition Datasets by Exploring Face Embedding Hypersphere [22.8742248559748]
顔認識データセットは、インターネットをクロールし、個人の同意なしに収集されることが多く、倫理的およびプライバシー上の懸念を提起する。
顔認識モデルをトレーニングするための合成データセットの生成は、有望な代替手段として浮上している。
我々はHyperFaceと呼ばれる新しい合成データセット生成手法を提案する。
論文 参考訳(メタデータ) (2024-11-13T09:42:12Z) - Digi2Real: Bridging the Realism Gap in Synthetic Data Face Recognition via Foundation Models [4.910937238451485]
本稿では,合成顔画像のリアリズム向上を目的とした,リアリズム伝達のための新しいフレームワークを提案する。
グラフィクスパイプラインの制御可能な側面とリアリズム強化技術を統合することで、我々は大量のリアルなバリエーションを生成する。
論文 参考訳(メタデータ) (2024-11-04T15:42:22Z) - Unveiling Synthetic Faces: How Synthetic Datasets Can Expose Real Identities [22.8742248559748]
6つの最先端の合成顔認識データセットにおいて、元の実データからのサンプルが漏洩していることを示す。
本論文は,ジェネレータモデルのトレーニングデータから生成した合成顔認証データセットへの漏洩を示す最初の研究である。
論文 参考訳(メタデータ) (2024-10-31T15:17:14Z) - Synthetic Face Datasets Generation via Latent Space Exploration from Brownian Identity Diffusion [20.352548473293993]
我々は,大規模な合成顔データセットを生成することを目的とした,Langevin,Dispersion,DisCoという3つの補完アルゴリズムを導入する。
これを使って、顔データセットを複数生成し、顔認識モデルをトレーニングすることでそれらをベンチマークし、我々の方法で生成されたデータが、以前のGANベースデータセットのパフォーマンスを上回ることを示す。
拡散モデルはトレーニングデータを記憶するために示されるが、新しい合成データセットの漏洩を防止し、より責任のある合成データセットへの道を開く。
論文 参考訳(メタデータ) (2024-04-30T22:32:02Z) - SDFR: Synthetic Data for Face Recognition Competition [51.9134406629509]
大規模な顔認識データセットは、インターネットをクロールして個人の同意なしに収集し、法的、倫理的、プライバシー上の懸念を提起する。
近年、ウェブクローリングされた顔認識データセットにおける懸念を軽減するために、合成顔認識データセットの生成が提案されている。
本稿では,第18回IEEE International Conference on Automatic Face and Gesture Recognition (FG 2024)と共同で開催されているSynthetic Data for Face Recognition (SDFR)コンペティションの概要を紹介する。
SDFRコンペティションは2つのタスクに分けられ、参加者は新しい合成データセットまたは/または既存のデータセットを使用して顔認識システムを訓練することができる。
論文 参考訳(メタデータ) (2024-04-06T10:30:31Z) - If It's Not Enough, Make It So: Reducing Authentic Data Demand in Face Recognition through Synthetic Faces [16.977459035497162]
大規模な顔データセットは、主にWebベースのイメージから作成され、明示的なユーザの同意が欠如している。
本稿では,合成顔データを用いて効果的な顔認識モデルの訓練を行う方法について検討する。
論文 参考訳(メタデータ) (2024-04-04T15:45:25Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - On the Stability of Iterative Retraining of Generative Models on their own Data [56.153542044045224]
混合データセットに対する生成モデルの訓練が与える影響について検討する。
まず、初期生成モデルがデータ分布を十分に近似する条件下で反復学習の安定性を実証する。
我々は、正規化フローと最先端拡散モデルを繰り返し訓練することにより、合成画像と自然画像の両方に関する我々の理論を実証的に検証する。
論文 参考訳(メタデータ) (2023-09-30T16:41:04Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - SynFace: Face Recognition with Synthetic Data [83.15838126703719]
我々は、ID混在(IM)とドメイン混在(DM)を併用したSynFaceを考案し、パフォーマンスギャップを緩和する。
また、合成顔画像の系統的実験分析を行い、合成データを顔認識に効果的に活用する方法についての知見を提供する。
論文 参考訳(メタデータ) (2021-08-18T03:41:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。