論文の概要: LAFS: Landmark-based Facial Self-supervised Learning for Face
Recognition
- arxiv url: http://arxiv.org/abs/2403.08161v1
- Date: Wed, 13 Mar 2024 01:07:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 16:22:53.917809
- Title: LAFS: Landmark-based Facial Self-supervised Learning for Face
Recognition
- Title(参考訳): LAFS:ランドマークに基づく顔の自己教師型学習
認識
- Authors: Zhonglin Sun, Chen Feng, Ioannis Patras, Georgios Tzimiropoulos
- Abstract要約: 我々は、効果的な顔認識モデルの訓練に適応できる顔表現の学習に焦点をあてる。
本研究では,自己教師付き事前学習による未ラベル顔画像の学習戦略について検討する。
提案手法は,複数の顔認識ベンチマークにおける最先端技術よりも大幅に向上する。
- 参考スコア(独自算出の注目度): 37.4550614524874
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work we focus on learning facial representations that can be adapted
to train effective face recognition models, particularly in the absence of
labels. Firstly, compared with existing labelled face datasets, a vastly larger
magnitude of unlabeled faces exists in the real world. We explore the learning
strategy of these unlabeled facial images through self-supervised pretraining
to transfer generalized face recognition performance. Moreover, motivated by
one recent finding, that is, the face saliency area is critical for face
recognition, in contrast to utilizing random cropped blocks of images for
constructing augmentations in pretraining, we utilize patches localized by
extracted facial landmarks. This enables our method - namely LAndmark-based
Facial Self-supervised learning LAFS), to learn key representation that is more
critical for face recognition. We also incorporate two landmark-specific
augmentations which introduce more diversity of landmark information to further
regularize the learning. With learned landmark-based facial representations, we
further adapt the representation for face recognition with regularization
mitigating variations in landmark positions. Our method achieves significant
improvement over the state-of-the-art on multiple face recognition benchmarks,
especially on more challenging few-shot scenarios.
- Abstract(参考訳): 本研究では,効果的な顔認識モデル,特にラベルの欠如に適応できる顔表現の学習に焦点をあてる。
第一に、既存のラベル付き顔データセットと比較すると、実際の世界では、ラベル付けされていない顔の規模が非常に大きい。
我々は、自己教師付き事前学習を通じて、これらのラベルのない顔画像の学習戦略を探求し、一般化された顔認識性能を伝達する。
さらに, 顔のサリエンシ領域は, 顔の認識に重要であり, 事前トレーニングにおいて, 画像のランダムなトリミングブロックを利用して, 顔のランドマークを抽出して局所化したパッチを利用する。
これにより、LAndmarkをベースとした顔自己教師学習(LAFS)が、顔認識においてより重要となるキー表現を学習することが可能になる。
また,2つの目印に特化して,より多様な目印情報を導入し,学習の規則化を図っている。
学習したランドマークに基づく顔表現により、ランドマーク位置の変動を緩和する正規化による顔認識のための表現をさらに適応する。
提案手法は,複数の顔認証ベンチマーク,特に難易度の高い撮影シナリオにおいて,最先端技術よりも大幅に向上する。
関連論文リスト
- Face Anonymization Made Simple [44.24233169815565]
現在の顔の匿名化技術は、しばしば、不正確で信頼性の低い顔認識モデルによって計算されたアイデンティティ損失に依存する。
対照的に,本手法では再建損失のみを伴う拡散モデルを用いて,顔のランドマークやマスクの必要性を排除している。
本モデルは,アイデンティティの匿名化,顔の保存,画質の3つの重要な領域において,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-11-01T17:45:21Z) - Self-Supervised Facial Representation Learning with Facial Region
Awareness [13.06996608324306]
自己教師付き事前学習は、様々な視覚的タスクに役立つ伝達可能な表現を学習するのに有効であることが証明されている。
この目標に向けての最近の取り組みは、各顔画像を全体として扱うことに限定されている。
本研究では,一貫したグローバルおよびローカルな顔表現を学習するための,自己教師型顔表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-04T15:48:56Z) - SimFLE: Simple Facial Landmark Encoding for Self-Supervised Facial
Expression Recognition in the Wild [3.4798852684389963]
顔のランドマークの効果的な符号化を学習できる自己教師型簡易顔ランドマーク符号化法(SimFLE)を提案する。
この目的のために、新しいFaceMAEモジュールを紹介します。
いくつかのFER-Wベンチマークの実験結果から、提案したSimFLEは顔のランドマークのローカライゼーションに優れていることが証明された。
論文 参考訳(メタデータ) (2023-03-14T06:30:55Z) - A Comparative Analysis of the Face Recognition Methods in Video
Surveillance Scenarios [0.0]
本研究では,最先端の顔認識手法に対する比較ベンチマーク表を提案する。
本研究では, 年齢差, クラス内差(顔のメイクアップ, ひげなど)のある顔IDの映像監視データセットを構築し, ネイティブな顔画像データを用いて評価を行った。
一方、この研究は、マスクのない顔、マスクされた顔、眼鏡をかけた顔など、さまざまな状況下で最高の認識方法を発見する。
論文 参考訳(メタデータ) (2022-11-05T17:59:18Z) - MorDeephy: Face Morphing Detection Via Fused Classification [0.0]
単一画像顔形態検出のための新しい深層学習手法を提案する。
深層顔の特徴を学習し、これらの特徴の真正性に関する情報を伝達する。
提案手法はMorDeephyと呼ばれ,その技術性能を達成し,未知のシナリオに変形検出を行うタスクを一般化する顕著な能力を示した。
論文 参考訳(メタデータ) (2022-08-05T11:39:22Z) - Emotion Separation and Recognition from a Facial Expression by Generating the Poker Face with Vision Transformers [57.1091606948826]
我々はこれらの課題に対処するため,ポーカー・フェイス・ビジョン・トランスフォーマー (PF-ViT) と呼ばれる新しいFERモデルを提案する。
PF-ViTは、対応するポーカーフェースを生成して、乱れを認識できない感情を静的な顔画像から分離し、認識することを目的としている。
PF-ViTはバニラビジョントランスフォーマーを使用し、そのコンポーネントは大規模な表情データセット上でMasked Autoencodeerとして事前トレーニングされている。
論文 参考訳(メタデータ) (2022-07-22T13:39:06Z) - Facial Expressions as a Vulnerability in Face Recognition [73.85525896663371]
本研究では,顔認識システムのセキュリティ脆弱性としての表情バイアスについて検討する。
本稿では,表情バイアスが顔認識技術の性能に与える影響を包括的に分析する。
論文 参考訳(メタデータ) (2020-11-17T18:12:41Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z) - Dual-Attention GAN for Large-Pose Face Frontalization [59.689836951934694]
本稿では,フォトリアリスティック顔フロンダル化のためのDA-GAN(Dual-Attention Generative Adversarial Network)を提案する。
具体的には、ローカル機能と長距離依存関係を統合するために、自己アテンションベースのジェネレータが導入された。
顔領域の局所的特徴を強調するために,新しい顔認識に基づく識別器を適用した。
論文 参考訳(メタデータ) (2020-02-17T20:00:56Z) - Investigating the Impact of Inclusion in Face Recognition Training Data
on Individual Face Identification [93.5538147928669]
最新のオープンソースの顔認識システムであるArcFaceを、100万枚以上の散らばった画像を用いた大規模な顔識別実験で監査する。
モデルのトレーニングデータには79.71%、存在しない人には75.73%のランク1顔認証精度がある。
論文 参考訳(メタデータ) (2020-01-09T15:50:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。