論文の概要: Enhancing Face Recognition with Latent Space Data Augmentation and
Facial Posture Reconstruction
- arxiv url: http://arxiv.org/abs/2301.11986v2
- Date: Wed, 11 Oct 2023 08:25:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 15:08:19.491671
- Title: Enhancing Face Recognition with Latent Space Data Augmentation and
Facial Posture Reconstruction
- Title(参考訳): 空間データ拡張と顔面姿勢再構成による顔認識の強化
- Authors: Soroush Hashemifar, Abdolreza Marefat, Javad Hassannataj Joloudari and
Hamid Hassanpour
- Abstract要約: 顔データセットを拡張するためのFRA(Face Representation Augmentation)というアプローチを提案する。
FRAは、顔表現学習アルゴリズムによって生成された顔埋め込みの操作に焦点を移す最初の方法である。
提案手法は,MagFace,ArcFace,CosFaceの基本モデルと比較して,識別精度を9.52 %,10.04 %,16.60 %改善する。
- 参考スコア(独自算出の注目度): 8.493314424950599
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The small amount of training data for many state-of-the-art deep
learning-based Face Recognition (FR) systems causes a marked deterioration in
their performance. Although a considerable amount of research has addressed
this issue by inventing new data augmentation techniques, using either input
space transformations or Generative Adversarial Networks (GAN) for feature
space augmentations, these techniques have yet to satisfy expectations. In this
paper, we propose an approach named the Face Representation Augmentation (FRA)
for augmenting face datasets. To the best of our knowledge, FRA is the first
method that shifts its focus towards manipulating the face embeddings generated
by any face representation learning algorithm to create new embeddings
representing the same identity and facial emotion but with an altered posture.
Extensive experiments conducted in this study convince of the efficacy of our
methodology and its power to provide noiseless, completely new facial
representations to improve the training procedure of any FR algorithm.
Therefore, FRA can help the recent state-of-the-art FR methods by providing
more data for training FR systems. The proposed method, using experiments
conducted on the Karolinska Directed Emotional Faces (KDEF) dataset, improves
the identity classification accuracies by 9.52 %, 10.04 %, and 16.60 %, in
comparison with the base models of MagFace, ArcFace, and CosFace, respectively.
- Abstract(参考訳): 多くの最先端のディープラーニングベース顔認識(FR)システムに対する少量のトレーニングデータにより、その性能が著しく低下する。
入力空間変換やGAN(Generative Adversarial Networks)を特徴空間拡張に用いながら、新たなデータ拡張手法を考案することで、この問題にかなり多くの研究が取り組んできたが、これらの技術はまだ期待を満たさない。
本稿では,顔データセットの拡張のためのFRA(Face Representation Augmentation)というアプローチを提案する。
我々の知る限り、FRAは、顔表現学習アルゴリズムによって生成された顔埋め込みを操作することに焦点を移し、同じアイデンティティと顔の感情を表す新しい埋め込みを作るが、姿勢を変える。
本研究は,本手法の有効性と,frアルゴリズムの学習手順を改善するために,無音で全く新しい表情表現を提供する能力について,広範な実験を行った。
したがって、FRAはFRシステムのトレーニングにより多くのデータを提供することで、最近の最先端FR手法を支援することができる。
提案手法は,Karolinska Directed Emotional Faces (KDEF)データセットを用いて,MagFace,ArcFace,CosFaceのベースモデルと比較して,識別分類精度を9.52 %,10.04 %,16.60 %改善する。
関連論文リスト
- Bridging the Gaps: Utilizing Unlabeled Face Recognition Datasets to Boost Semi-Supervised Facial Expression Recognition [5.750927184237346]
我々は、半教師付きFERを高めるために、大きな未ラベルの顔認識(FR)データセットを活用することに重点を置いている。
具体的には,アノテーションを使わずに大規模な顔画像の事前訓練を行う。
ラベル付き画像や多彩な画像の不足を緩和するために、Mixupベースのデータ拡張戦略を提案する。
論文 参考訳(メタデータ) (2024-10-23T07:26:19Z) - A visualization method for data domain changes in CNN networks and the optimization method for selecting thresholds in classification tasks [1.1118946307353794]
Face Anti-Spoofing (FAS) は、顔認識技術のセキュリティを維持する上で重要な役割を担っている。
偽造顔生成技術の台頭に伴い、デジタル編集された顔が反偽造に直面する課題がエスカレートしている。
本稿では,データセット上での予測結果を可視化することにより,モデルのトレーニング結果を直感的に反映する可視化手法を提案する。
論文 参考訳(メタデータ) (2024-04-19T03:12:17Z) - E2F-Net: Eyes-to-Face Inpainting via StyleGAN Latent Space [4.110419543591102]
我々は、E2F-Net(Eyes-to-Face Network)と呼ばれるGANベースのモデルを提案する。
提案手法は,2つの専用エンコーダを用いて眼周囲領域から同一性および非同一性の特徴を抽出する。
提案手法は,現在の手法を超越して,高品質な顔全体の再構築に成功していることを示す。
論文 参考訳(メタデータ) (2024-03-18T19:11:34Z) - Survey on Deep Face Restoration: From Non-blind to Blind and Beyond [79.1398990834247]
顔復元(FR)は、低品質 (LQ) の顔画像を高品質 (HQ) の顔画像に復元することを目的とした、画像復元の専門分野である。
近年のディープラーニング技術の進歩はFR法に大きな進歩をもたらした。
論文 参考訳(メタデータ) (2023-09-27T08:39:03Z) - A Survey of Deep Face Restoration: Denoise, Super-Resolution, Deblur,
Artifact Removal [177.21001709272144]
顔復元(FR)は、低品質(LQ)入力画像から高品質(HQ)顔を復元することを目的としている。
本稿では,顔修復のための深層学習技術の最近の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2022-11-05T07:08:15Z) - Escaping Data Scarcity for High-Resolution Heterogeneous Face
Hallucination [68.78903256687697]
Heterogeneous Face Recognition (HFR) では、視覚や熱といった2つの異なる領域にまたがる顔のマッチングが目的である。
合成によるギャップを埋めようとする最近の手法は有望な結果を得たが、ペアトレーニングデータの不足により、その性能は依然として制限されている。
本稿では,HFRのための新しい顔幻覚パラダイムを提案する。これはデータ効率のよい合成を可能にするだけでなく,プライバシポリシーを破ることなくモデルトレーニングのスケールアップを可能にする。
論文 参考訳(メタデータ) (2022-03-30T20:44:33Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z) - Boosting Deep Face Recognition via Disentangling Appearance and Geometry [33.196270681809395]
顔認識タスクにおける外観と幾何学的表現を両立させる枠組みを提案する。
空間変換を取り入れた幾何学的に同一の顔を生成する。
提案手法は深層顔認識モデルの性能を向上させる。
論文 参考訳(メタデータ) (2020-01-13T23:19:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。