論文の概要: IDperturb: Enhancing Variation in Synthetic Face Generation via Angular Perturbation
- arxiv url: http://arxiv.org/abs/2602.18831v1
- Date: Sat, 21 Feb 2026 13:23:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.339441
- Title: IDperturb: Enhancing Variation in Synthetic Face Generation via Angular Perturbation
- Title(参考訳): IDperturb:角摂動による合成顔生成の変動の促進
- Authors: Fadi Boutros, Eduarda Caldeira, Tahar Chettaoui, Naser Damer,
- Abstract要約: 合成データは、顔認識(FR)システムのトレーニングのための認証顔データセットの実用的な代替として登場した。
アイデンティティ条件拡散モデルの最近の進歩は、フォトリアリスティックおよびアイデンティティ一貫性のある顔画像の生成を可能にしている。
我々は,合成顔生成の多様性を高めるため,簡易かつ効果的な幾何駆動型サンプリング戦略であるIDPERTURBを提案する。
- 参考スコア(独自算出の注目度): 17.433921935288577
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Synthetic data has emerged as a practical alternative to authentic face datasets for training face recognition (FR) systems, especially as privacy and legal concerns increasingly restrict the use of real biometric data. Recent advances in identity-conditional diffusion models have enabled the generation of photorealistic and identity-consistent face images. However, many of these models suffer from limited intra-class variation, an essential property for training robust and generalizable FR models. In this work, we propose IDPERTURB, a simple yet effective geometric-driven sampling strategy to enhance diversity in synthetic face generation. IDPERTURB perturbs identity embeddings within a constrained angular region of the unit hyper-sphere, producing a diverse set of embeddings without modifying the underlying generative model. Each perturbed embedding serves as a conditioning vector for a pre-trained diffusion model, enabling the synthesis of visually varied yet identity-coherent face images suitable for training generalizable FR systems. Empirical results demonstrate that training FR on datasets generated using IDPERTURB yields improved performance across multiple FR benchmarks, compared to existing synthetic data generation approaches.
- Abstract(参考訳): 合成データは、顔認識(FR)システムのトレーニングのための認証顔データセットの実用的な代替として現れており、特にプライバシーや法的懸念により、実際の生体データの使用が制限されるようになっている。
アイデンティティ条件拡散モデルの最近の進歩は、フォトリアリスティックおよびアイデンティティ一貫性のある顔画像の生成を可能にしている。
しかし、これらのモデルの多くはクラス内変動に限られており、堅牢で一般化可能なFRモデルの訓練に欠かせない性質である。
本研究では,合成顔生成の多様性を高めるため,簡易かつ効果的な幾何駆動型サンプリング戦略であるIDPERTURBを提案する。
IDPERTURBは、単位超球面の制限された角領域にアイデンティティの埋め込みを組み込み、基礎となる生成モデルを変更することなく、多様な埋め込みセットを生成する。
それぞれの摂動埋め込みは、事前訓練された拡散モデルの条件ベクトルとして機能し、一般化可能なFRシステムのトレーニングに適した、視覚的に変化しているがアイデンティティに整合した顔画像の合成を可能にする。
実験により、IDPERTURBを用いて生成されたデータセット上でFRをトレーニングすると、既存の合成データ生成手法と比較して、複数のFRベンチマークのパフォーマンスが向上することが示された。
関連論文リスト
- High-Fidelity Scientific Simulation Surrogates via Adaptive Implicit Neural Representations [51.90920900332569]
入射神経表現(INR)は空間的に構造化されたデータをモデリングするためのコンパクトで連続的なフレームワークを提供する。
近年のアプローチでは、剛性幾何学的構造に沿った付加的な特徴を導入することでこの問題に対処している。
機能適応型INR(FA-INR)を提案する。
論文 参考訳(メタデータ) (2025-06-07T16:45:17Z) - ID-Booth: Identity-consistent Face Generation with Diffusion Models [27.46650231581887]
我々はID-Boothと呼ばれる新しい生成拡散に基づくフレームワークを提案する。
このフレームワークは、事前訓練された拡散モデルの合成能力を保ちながら、アイデンティティ一貫性のある画像生成を可能にする。
本手法は、画像の多様性を向上しつつ、競合する手法よりもアイデンティティ間の一貫性とアイデンティティ間の分離性を向上する。
論文 参考訳(メタデータ) (2025-04-10T02:20:18Z) - Multi-focal Conditioned Latent Diffusion for Person Image Synthesis [59.113899155476005]
遅延拡散モデル(LDM)は高解像度画像生成において強力な機能を示した。
これらの制約に対処する多焦点条件付き潜時拡散法(MCLD)を提案する。
本手法では,顔の同一性やテクスチャ固有の情報を効果的に統合する多焦点条件アグリゲーションモジュールを利用する。
論文 参考訳(メタデータ) (2025-03-19T20:50:10Z) - UIFace: Unleashing Inherent Model Capabilities to Enhance Intra-Class Diversity in Synthetic Face Recognition [42.86969216015855]
顔認識(FR)はコンピュータビジョンにおいて最も重要な応用の1つである。
UIFaceとして短縮された合成顔認識のためのクラス内多様性を高めるフレームワークを提案する。
実験結果から,本手法は従来の手法に比べてトレーニングデータが少なく,合成データセットの約半分の規模で大幅に上回っていることがわかった。
論文 参考訳(メタデータ) (2025-02-27T06:22:18Z) - Exploring Representation-Aligned Latent Space for Better Generation [86.45670422239317]
生成性能を改善するために,セマンティックな事前情報を統合するReaLSを導入する。
本研究では、ReaLSでトレーニングされたDETとSiTが、FID測定値の15%改善を実現することを示す。
拡張されたセマンティック潜在空間は、セグメンテーションや深さ推定のようなより知覚的な下流タスクを可能にする。
論文 参考訳(メタデータ) (2025-02-01T07:42:12Z) - ID$^3$: Identity-Preserving-yet-Diversified Diffusion Models for Synthetic Face Recognition [60.15830516741776]
合成顔認識(SFR)は、実際の顔データの分布を模倣するデータセットを生成することを目的としている。
拡散燃料SFRモデルであるtextID3$を紹介します。
textID3$はID保存損失を利用して、多様だがアイデンティティに一貫性のある顔の外観を生成する。
論文 参考訳(メタデータ) (2024-09-26T06:46:40Z) - GANDiffFace: Controllable Generation of Synthetic Datasets for Face
Recognition with Realistic Variations [2.7467281625529134]
本研究は,顔認識のための合成データセット生成のための新しいフレームワークであるGANDiffFaceを紹介する。
GANDiffFaceは、GAN(Generative Adversarial Networks)とDiffusionモデルのパワーを組み合わせて、既存の合成データセットの制限を克服する。
論文 参考訳(メタデータ) (2023-05-31T15:49:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。