論文の概要: Facial Recognition Leveraging Generative Adversarial Networks
- arxiv url: http://arxiv.org/abs/2505.11884v1
- Date: Sat, 17 May 2025 07:26:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:10.916215
- Title: Facial Recognition Leveraging Generative Adversarial Networks
- Title(参考訳): 生成的対立ネットワークを利用した顔認識
- Authors: Zhongwen Li, Zongwei Li, Xiaoqi Li,
- Abstract要約: ディープラーニングに基づく顔認識性能は、大規模なトレーニングデータに大きく依存している。
本稿では,3つの重要なコントリビューションを持つGANに基づくデータ拡張手法を提案する。
実験により,本手法は安定なトレーニングダイナミックスを実現し,認識精度をLFWベンチマークで12.7%向上することを確認した。
- 参考スコア(独自算出の注目度): 1.8876605885609514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face recognition performance based on deep learning heavily relies on large-scale training data, which is often difficult to acquire in practical applications. To address this challenge, this paper proposes a GAN-based data augmentation method with three key contributions: (1) a residual-embedded generator to alleviate gradient vanishing/exploding problems, (2) an Inception ResNet-V1 based FaceNet discriminator for improved adversarial training, and (3) an end-to-end framework that jointly optimizes data generation and recognition performance. Experimental results demonstrate that our approach achieves stable training dynamics and significantly improves face recognition accuracy by 12.7% on the LFW benchmark compared to baseline methods, while maintaining good generalization capability with limited training samples.
- Abstract(参考訳): ディープラーニングに基づく顔認識性能は大規模なトレーニングデータに大きく依存している。
この課題に対処するために,(1)勾配の消失/露光を緩和する残差組込みジェネレータ,(2)対角訓練を改善するためのインセプションResNet-V1ベースのFaceNet識別器,(3)データ生成と認識性能を協調的に最適化するエンドツーエンドフレームワークの3つの重要な貢献点を持つGANベースのデータ拡張手法を提案する。
実験結果から,本手法は安定なトレーニングダイナミクスを実現し,ベースライン法に比べて認識精度を12.7%向上し,限られたトレーニングサンプルで良好な一般化能力を維持した。
関連論文リスト
- E2ED^2:Direct Mapping from Noise to Data for Enhanced Diffusion Models [15.270657838960114]
拡散モデルは、視覚的生成モデリングにおけるデファクト・プライマリ・パラダイムとして確立されてきた。
最終生成サンプルから初期雑音への直接最適化を実現する新しいエンドツーエンド学習パラダイムを提案する。
Fr'eche't Inception Distance (FID) と CLIP のスコアは,サンプリングステップが少なくても大幅に向上する。
論文 参考訳(メタデータ) (2024-12-30T16:06:31Z) - Sustainable techniques to improve Data Quality for training image-based explanatory models for Recommender Systems [2.9748898344267785]
我々は、Responsible AIの原則に沿って、Recommender Systems(RS)により良い視覚的説明を提供することを目指している。
データ品質のトレーニングに重点を置く3つの新しい戦略を開発します。
これらの戦略を最先端の3つの説明可能性モデルに統合することで、これらの視覚ベースのRS説明可能性モデルの関連指標の5%のパフォーマンスが、実用的長期持続可能性のペナルティを伴わずに向上する。
論文 参考訳(メタデータ) (2024-07-09T10:40:31Z) - AdaFedFR: Federated Face Recognition with Adaptive Inter-Class Representation Learning [14.139432393751298]
本稿では,AdaFedFRというシンプルなフェデレーション顔認識フレームワークを提案する。
本研究では,公共アイデンティティの特徴表現を学習可能な負の知識として微妙に活用し,局所的な目的を最適化する。
実験により,本手法は,3ラウンド未満の通信ラウンドにおいて,複数の顔認識ベンチマークにおいて,従来の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-05-22T09:19:25Z) - Confidence-Aware RGB-D Face Recognition via Virtual Depth Synthesis [48.59382455101753]
2D顔認証は、照明、閉塞、ポーズの変化により、制約のない環境において課題に遭遇する。
近年の研究では、深度情報を組み込んだRGB-D顔認証に焦点が当てられている。
本研究では,まず,深度モデル事前学習のための3次元Morphable Modelsによって生成された多様な深度データセットを構築する。
そこで本研究では,手軽に利用できるRGBと深度モデルを利用したドメイン非依存の事前学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:12:24Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Federated Learning for Face Recognition with Gradient Correction [52.896286647898386]
本稿では,顔認識のためのフェデレーション学習に取り組むためのフレームワークであるFedGCを紹介する。
我々は,FedGCが標準ソフトマックスと同様の損失関数を構成することを示す。
論文 参考訳(メタデータ) (2021-12-14T09:19:29Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - Sample and Computation Redistribution for Efficient Face Detection [137.19388513633484]
トレーニングデータサンプリングと計算分布戦略は、効率的で正確な顔検出の鍵です。
scrfdf34は、最高の競合製品であるTinaFaceを3.86%(ハードセットでのAP)で上回り、GPU上でVGA解像度画像でmph3$times$より高速です。
論文 参考訳(メタデータ) (2021-05-10T23:51:14Z) - Deep Optimized Priors for 3D Shape Modeling and Reconstruction [38.79018852887249]
3Dモデリングと再構築のための新しい学習フレームワークを紹介します。
提案手法は,事前訓練によって制約された障壁を効果的に破壊することを示す。
論文 参考訳(メタデータ) (2020-12-14T03:56:31Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z) - Efficient Facial Feature Learning with Wide Ensemble-based Convolutional
Neural Networks [20.09586211332088]
畳み込みネットワークに基づく共有表現を用いたアンサンブル実験について述べる。
本研究では,ESRの分岐レベルを変化させることで,冗長性と計算負荷を劇的に低減できることを示す。
大規模なデータセットの実験では、ESRは残余の一般化誤差を減らすことが示唆されている。
論文 参考訳(メタデータ) (2020-01-17T14:32:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。