論文の概要: Hybrid Generative Fusion for Efficient and Privacy-Preserving Face Recognition Dataset Generation
- arxiv url: http://arxiv.org/abs/2508.10672v2
- Date: Mon, 18 Aug 2025 09:15:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 12:43:44.914146
- Title: Hybrid Generative Fusion for Efficient and Privacy-Preserving Face Recognition Dataset Generation
- Title(参考訳): 効率的かつプライバシ保護された顔認識データセット生成のためのハイブリッド生成融合
- Authors: Feiran Li, Qianqian Xu, Shilong Bao, Boyu Han, Zhiyong Yang, Qingming Huang,
- Abstract要約: 我々は,顔認識モデルをトレーニングするための高品質な顔データセットの構築に焦点を当てたDataCV ICCV Challengeへのアプローチを提案する。
構築されたデータセットには、既存の公開顔データセットと重複するIDが含まれてはならない。
提案手法は,競技において第1位となる textbf1 を達成し,実験結果から10K,20K,100K 単位のモデル性能の向上が得られた。
- 参考スコア(独自算出の注目度): 87.48785461212556
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present our approach to the DataCV ICCV Challenge, which centers on building a high-quality face dataset to train a face recognition model. The constructed dataset must not contain identities overlapping with any existing public face datasets. To handle this challenge, we begin with a thorough cleaning of the baseline HSFace dataset, identifying and removing mislabeled or inconsistent identities through a Mixture-of-Experts (MoE) strategy combining face embedding clustering and GPT-4o-assisted verification. We retain the largest consistent identity cluster and apply data augmentation up to a fixed number of images per identity. To further diversify the dataset, we generate synthetic identities using Stable Diffusion with prompt engineering. As diffusion models are computationally intensive, we generate only one reference image per identity and efficiently expand it using Vec2Face, which rapidly produces 49 identity-consistent variants. This hybrid approach fuses GAN-based and diffusion-based samples, enabling efficient construction of a diverse and high-quality dataset. To address the high visual similarity among synthetic identities, we adopt a curriculum learning strategy by placing them early in the training schedule, allowing the model to progress from easier to harder samples. Our final dataset contains 50 images per identity, and all newly generated identities are checked with mainstream face datasets to ensure no identity leakage. Our method achieves \textbf{1st place} in the competition, and experimental results show that our dataset improves model performance across 10K, 20K, and 100K identity scales. Code is available at https://github.com/Ferry-Li/datacv_fr.
- Abstract(参考訳): 本稿では,顔認識モデルをトレーニングするための高品質な顔データセットの構築に焦点を当てた,DataCV ICCV Challengeへのアプローチを提案する。
構築されたデータセットには、既存の公開顔データセットと重複するIDが含まれてはならない。
この課題に対処するために、ベースラインHSFaceデータセットの徹底的なクリーニングから始め、顔埋め込みクラスタリングとGPT-4o支援検証を組み合わせたMixture-of-Experts(MoE)戦略により、ラベルミスや一貫性のないIDを特定し、削除する。
我々は、最大の一貫したアイデンティティクラスタを保持し、アイデンティティ毎に一定の数のイメージにデータ拡張を適用します。
データセットをさらに多様化させるために, 安定拡散法と即時工学を用いて, 合成IDを生成する。
拡散モデルは計算集約的であるため、同一性ごとに1つの参照画像のみを生成し、Vec2Faceを用いて効率的に拡張し、49個の同一性を持つ変種を高速に生成する。
このハイブリッドアプローチは、GANベースと拡散ベースのサンプルを融合させ、多種多様な高品質なデータセットを効率的に構築することを可能にする。
合成同一性間の高い視覚的類似性に対処するため,学習スケジュールの早期設定によりカリキュラム学習戦略を採用し,より簡単なサンプルからより難しいサンプルまでモデルを前進させる。
最終データセットには、アイデンティティ毎に50の画像が含まれており、新たに生成されたすべてのIDがメインストリームの顔データセットでチェックされ、IDの漏洩がないようにしています。
提案手法は,競技における「textbf{1st place}」を実現し,実験結果から10K,20K,100K単位のモデル性能が向上したことを示す。
コードはhttps://github.com/Ferry-Li/datacv_fr.comから入手できる。
関連論文リスト
- From Large Angles to Consistent Faces: Identity-Preserving Video Generation via Mixture of Facial Experts [69.44297222099175]
顔の特徴の異なるが相互に強化された側面を捉えた顔専門家の混合(MoFE)を導入する。
データセットの制限を軽減するため、私たちは、Face ConstraintsとIdentity Consistencyという2つの重要な側面を中心としたデータ処理パイプラインを調整しました。
我々は、既存のオープンソースヒューマンビデオデータセットからLFA(Large Face Angles)データセットをキュレートし、洗練しました。
論文 参考訳(メタデータ) (2025-08-13T04:10:16Z) - Vec2Face+ for Face Dataset Generation [19.02273216268032]
Vec2Face+は画像特徴から直接画像を生成する生成モデルである。
VFace10Kは10KのIDを持つ合成顔データセットである。
対応するVFace100KデータセットとVFace300Kデータセットは、実世界のトレーニングデータセットであるCASIA-WebFaceよりも精度が高い。
論文 参考訳(メタデータ) (2025-07-23T04:34:56Z) - FLUXSynID: A Framework for Identity-Controlled Synthetic Face Generation with Document and Live Images [0.0]
FLUXSynIDは高分解能な合成顔データセットを生成するためのフレームワークである。
ユーザ定義のID属性分布を持つ合成顔を生成し、文書スタイルと信頼されたライブキャプチャ画像の両方を提供する。
私たちの研究は、顔認識やモルヒネ攻撃検出を含む生体計測研究を支援するために公開されています。
論文 参考訳(メタデータ) (2025-05-12T13:12:33Z) - ID$^3$: Identity-Preserving-yet-Diversified Diffusion Models for Synthetic Face Recognition [60.15830516741776]
合成顔認識(SFR)は、実際の顔データの分布を模倣するデータセットを生成することを目的としている。
拡散燃料SFRモデルであるtextID3$を紹介します。
textID3$はID保存損失を利用して、多様だがアイデンティティに一貫性のある顔の外観を生成する。
論文 参考訳(メタデータ) (2024-09-26T06:46:40Z) - Synthesizing Efficient Data with Diffusion Models for Person Re-Identification Pre-Training [51.87027943520492]
本稿では,既知の同一性に基づく多様な画像の効率向上と生成を行う新しいパラダイムDiffusion-ReIDを提案する。
提案したパラダイムに適合して,まず,5,183個のIDから777K以上の画像で構成された,大規模なRe-IDデータセットDiff-Personを新たに作成する。
論文 参考訳(メタデータ) (2024-06-10T06:26:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。