論文の概要: Towards Large-Scale Pose-Invariant Face Recognition Using Face Defrontalization
- arxiv url: http://arxiv.org/abs/2506.04496v1
- Date: Wed, 04 Jun 2025 22:28:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-06 21:53:49.449534
- Title: Towards Large-Scale Pose-Invariant Face Recognition Using Face Defrontalization
- Title(参考訳): 顔のデフロント化を用いた大規模ポーズ不変顔認識に向けて
- Authors: Patrik Mesec, Alan Jović,
- Abstract要約: 本稿では,顔特徴抽出モデルの訓練データセットを増大させるために,顔デフロンダリゼーション(face defrontalization)と呼ばれる顔のフロンダリゼーション(face frontalization)の逆手法を提案する。
Defrontalizationは、defrontalizationのないモデルと比較して改善された結果を示している。
結果は、現在の手法の少なくともいくつかは、小さなデータセットに過度に適合している可能性があることを示唆している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Face recognition under extreme head poses is a challenging task. Ideally, a face recognition system should perform well across different head poses, which is known as pose-invariant face recognition. To achieve pose invariance, current approaches rely on sophisticated methods, such as face frontalization and various facial feature extraction model architectures. However, these methods are somewhat impractical in real-life settings and are typically evaluated on small scientific datasets, such as Multi-PIE. In this work, we propose the inverse method of face frontalization, called face defrontalization, to augment the training dataset of facial feature extraction model. The method does not introduce any time overhead during the inference step. The method is composed of: 1) training an adapted face defrontalization FFWM model on a frontal-profile pairs dataset, which has been preprocessed using our proposed face alignment method; 2) training a ResNet-50 facial feature extraction model based on ArcFace loss on a raw and randomly defrontalized large-scale dataset, where defrontalization was performed with our previously trained face defrontalization model. Our method was compared with the existing approaches on four open-access datasets: LFW, AgeDB, CFP, and Multi-PIE. Defrontalization shows improved results compared to models without defrontalization, while the proposed adjustments show clear superiority over the state-of-the-art face frontalization FFWM method on three larger open-access datasets, but not on the small Multi-PIE dataset for extreme poses (75 and 90 degrees). The results suggest that at least some of the current methods may be overfitted to small datasets.
- Abstract(参考訳): 極端な頭ポーズの下での顔認識は難しい課題だ。
理想的には、顔認識システムは、ポーズ不変顔認識として知られる、異なる頭部のポーズでうまく機能すべきである。
ポーズ不変性を達成するために、現在のアプローチは顔のフロンダリゼーションや様々な顔の特徴抽出モデルアーキテクチャといった高度な手法に依存している。
しかし、これらの手法は現実の環境ではやや実用的ではなく、一般的にはMulti-PIEのような小さな科学的データセットで評価される。
本研究では,顔特徴抽出モデルのトレーニングデータセットを増大させるために,顔デフロンダリゼーション(face defrontalization)と呼ばれる顔のフロンダリゼーション(face frontalization)の逆手法を提案する。
このメソッドは、推論ステップ中にいかなる時間オーバーヘッドも導入しない。
方法は以下の通りである。
1) 提案した顔アライメント手法を用いて前処理を行った前頭対データセットを用いた適応顔デフロント化FFWMモデルの訓練を行った。
2) 顔の特徴抽出モデルであるResNet-50のトレーニングを行った。
提案手法は,LFW, AgeDB, CFP, Multi-PIEの4つのオープンアクセスデータセットに対する既存手法と比較した。
一方, 提案手法は, 3つの大きなオープンアクセスデータセットに対して, 極端なポーズ(75度と90度)のMulti-PIEデータセットでは, 最先端の顔フロンダリゼーションFFWM法よりも明確な優位性を示した。
結果は、現在の手法の少なくともいくつかは、小さなデータセットに過度に適合している可能性があることを示唆している。
関連論文リスト
- Pose-invariant face recognition via feature-space pose frontalization [9.105950041800225]
ポーズ不変の顔認識は、現代のAIベースの顔認識システムにとって難しい問題である。
本稿では,特徴空間内で顔のフロンダリゼーションと認識を行う新しい手法を提案する。
FSPFMの可能性を最大化し、性能を高めるため、新しい訓練パラダイムが提案されている。
論文 参考訳(メタデータ) (2025-05-22T09:01:01Z) - OSDFace: One-Step Diffusion Model for Face Restoration [72.5045389847792]
拡散モデルは、顔の修復において顕著な性能を示した。
顔復元のための新しいワンステップ拡散モデルOSDFaceを提案する。
その結果,OSDFaceは現状のSOTA(State-of-the-art)手法を視覚的品質と定量的指標の両方で上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-26T07:07:48Z) - DiffusionFace: Towards a Comprehensive Dataset for Diffusion-Based Face Forgery Analysis [71.40724659748787]
DiffusionFaceは、最初の拡散ベースのフェイスフォージェリーデータセットである。
非条件およびテキストガイドの顔画像生成、Img2Img、Inpaint、Diffusionベースの顔交換アルゴリズムなど、さまざまなフォージェリーカテゴリをカバーする。
重要なメタデータと、評価のための実世界のインターネットソースの偽顔画像データセットを提供する。
論文 参考訳(メタデータ) (2024-03-27T11:32:44Z) - Optimal-Landmark-Guided Image Blending for Face Morphing Attacks [8.024953195407502]
本稿では,最適なランドマーク誘導画像ブレンディングを用いた顔形態形成攻撃を行うための新しい手法を提案する。
提案手法は, ランドマークの最適化とグラフ畳み込みネットワーク(GCN)によるランドマークと外観特徴の組み合わせにより, 従来のアプローチの限界を克服する。
論文 参考訳(メタデータ) (2024-01-30T03:45:06Z) - Generalized Face Liveness Detection via De-fake Face Generator [52.23271636362843]
以前の顔アンチスプーフィング(FAS)手法は、目に見えない領域に一般化するという課題に直面している。
本稿では,大規模に付加的な現実面を効果的に活用できるAnomalous cue Guided FAS (AG-FAS)法を提案する。
提案手法は,未知のシナリオと未知のプレゼンテーションアタックを用いたクロスドメイン評価において,最先端の結果を実現する。
論文 参考訳(メタデータ) (2024-01-17T06:59:32Z) - Thinking the Fusion Strategy of Multi-reference Face Reenactment [4.1509697008011175]
複数の参照画像を用いた単純な拡張は生成品質を著しく向上させることを示す。
本研究は,1)公開データセットの再構成作業,2)複数人の頭部運動映像シーケンスからなる元のデータセットの顔の動き伝達,3)新たに提案した評価指標を用いて,提案手法がより定量的な結果が得られることを検証した。
論文 参考訳(メタデータ) (2022-02-22T09:17:26Z) - FaceOcc: A Diverse, High-quality Face Occlusion Dataset for Human Face
Extraction [3.8502825594372703]
隠蔽は野生の顔画像にしばしば発生し、ランドマーク検出や3D再構成、顔認識といった顔関連の課題に悩まされる。
本稿では,CelebA本社とインターネットから手動で顔の隠蔽をラベル付けした新しい顔のセグメンテーションデータセットを提案する。
簡単な顔分割モデルの訓練を行ったが,SOTA性能が得られ,提案したデータセットの有効性を実証した。
論文 参考訳(メタデータ) (2022-01-20T19:44:18Z) - End2End Occluded Face Recognition by Masking Corrupted Features [82.27588990277192]
最先端の一般的な顔認識モデルは、隠蔽された顔画像に対してうまく一般化しない。
本稿では,1つのエンドツーエンドのディープニューラルネットワークに基づいて,オクルージョンに頑健な新しい顔認識手法を提案する。
我々のアプローチは、深い畳み込みニューラルネットワークから破損した特徴を発見し、動的に学習されたマスクによってそれらをきれいにする。
論文 参考訳(メタデータ) (2021-08-21T09:08:41Z) - Learning to Aggregate and Personalize 3D Face from In-the-Wild Photo
Collection [65.92058628082322]
非パラメトリックフェースモデリングは形状仮定なしで画像からのみ3次元フェースを再構成することを目的としている。
本稿では,教師なしのロバストな3次元顔モデリングのための学習・アグリゲート・パーソナライズ・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T03:10:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。