論文の概要: PAM: Pose Attention Module for Pose-Invariant Face Recognition
- arxiv url: http://arxiv.org/abs/2111.11940v1
- Date: Tue, 23 Nov 2021 15:18:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-24 15:23:28.458993
- Title: PAM: Pose Attention Module for Pose-Invariant Face Recognition
- Title(参考訳): PAM: Pose-invariant Face Recognition のための Pose Attention Module
- Authors: En-Jung Tsai, Wei-Chang Yeh
- Abstract要約: ポーズ不変顔認識のための軽量で実装が容易な注目ブロックである Pose Attention Module (PAM) を提案する。
特に、PAMは、ポーズのバリエーション間の残差をソフトゲート機構で学習することにより、階層的特徴空間における正面特徴変換を行う。
- 参考スコア(独自算出の注目度): 3.0839245814393723
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pose variation is one of the key challenges in face recognition. Conventional
techniques mainly focus on face frontalization or face augmentation in image
space. However, transforming face images in image space is not guaranteed to
preserve the lossless identity features of the original image. Moreover, these
methods suffer from more computational costs and memory requirements due to the
additional models. We argue that it is more desirable to perform feature
transformation in hierarchical feature space rather than image space, which can
take advantage of different feature levels and benefit from joint learning with
representation learning. To this end, we propose a lightweight and
easy-to-implement attention block, named Pose Attention Module (PAM), for
pose-invariant face recognition. Specifically, PAM performs frontal-profile
feature transformation in hierarchical feature space by learning residuals
between pose variations with a soft gate mechanism. We validated the
effectiveness of PAM block design through extensive ablation studies and
verified the performance on several popular benchmarks, including LFW, CFP-FP,
AgeDB-30, CPLFW, and CALFW. Experimental results show that our method not only
outperforms state-of-the-art methods but also effectively reduces memory
requirements by more than 75 times. It is noteworthy that our method is not
limited to face recognition with large pose variations. By adjusting the soft
gate mechanism of PAM to a specific coefficient, such semantic attention block
can easily extend to address other intra-class imbalance problems in face
recognition, including large variations in age, illumination, expression, etc.
- Abstract(参考訳): ポーズの変化は、顔認識における重要な課題の1つだ。
従来の技術は主に、画像空間における顔のフロンダリゼーションや顔の増強に焦点を当てている。
しかし、画像空間における顔画像の変換は、元の画像の無意味な同一性を保存することが保証されない。
さらに、これらの手法は追加モデルにより計算コストとメモリ要求が増大する。
我々は、異なる特徴レベルを活用し、表現学習を伴う共同学習の利点を享受できる画像空間よりも、階層的な特徴空間で機能変換を行うことがより望ましいと主張する。
そこで,本稿では,ポーズ不変な顔認識のための軽量で実装が容易なposing attention module (pam)を提案する。
特に、PAMは、ポーズのバリエーション間の残差をソフトゲート機構で学習することにより、階層的特徴空間における正面特徴変換を行う。
PAMブロック設計の有効性を広範囲にわたるアブレーション研究により検証し,LFW,CFP-FP, AgeDB-30,CPLFW,CALFWなどのベンチマークで評価した。
実験の結果,本手法は最先端の手法に勝るだけでなく,メモリ要求量を75倍以上に削減できることがわかった。
提案手法は大きなポーズ変化を伴う顔認識に限らない点が注目に値する。
PAMのソフトゲート機構を特定の係数に調整することにより、このようなセマンティックアテンションブロックは、年齢、照明、表現など、顔認識における他のクラス内不均衡問題に対処するために容易に拡張することができる。
関連論文リスト
- DiffFAE: Advancing High-fidelity One-shot Facial Appearance Editing with Space-sensitive Customization and Semantic Preservation [84.0586749616249]
本稿では,高忠実度顔画像編集に適した1段階かつ高効率な拡散ベースフレームワークDiffFAEを提案する。
高忠実度クエリ属性転送には、空間感性物理カスタマイズ(SPC)を採用し、忠実度と一般化能力を保証している。
ソース属性を保存するために、Regional-responsive Semantic Composition (RSC)を導入する。
このモジュールは、切り離されたソースを無視する特徴を学習するためにガイドされ、髪、服、背景などの非顔的属性からアーティファクトを保存し緩和する。
論文 参考訳(メタデータ) (2024-03-26T12:53:10Z) - Fiducial Focus Augmentation for Facial Landmark Detection [4.433764381081446]
本稿では,モデルによる顔構造理解を高めるために,新しい画像強調手法を提案する。
我々は,Deep Canonical correlation Analysis (DCCA) に基づく損失を考慮した,シームズアーキテクチャに基づくトレーニング機構を採用している。
提案手法は,様々なベンチマークデータセットにおいて,最先端のアプローチよりも優れている。
論文 参考訳(メタデータ) (2024-02-23T01:34:00Z) - Effective Adapter for Face Recognition in the Wild [72.75516495170199]
私たちは、画像が低品質で現実世界の歪みに悩まされる、野生の顔認識の課題に取り組みます。
従来のアプローチでは、劣化した画像や、顔の復元技術を使って強化された画像を直接訓練するが、効果がないことが証明された。
高品質な顔データセットで訓練された既存の顔認識モデルを強化するための効果的なアダプタを提案する。
論文 参考訳(メタデータ) (2023-12-04T08:55:46Z) - MorphGANFormer: Transformer-based Face Morphing and De-Morphing [55.211984079735196]
顔変形に対するスタイルGANベースのアプローチが主要な技術である。
本稿では,顔の変形に対する変換器ベースの代替手段を提案し,その利点をStyleGANベースの方法と比較した。
論文 参考訳(メタデータ) (2023-02-18T19:09:11Z) - FaceDancer: Pose- and Occlusion-Aware High Fidelity Face Swapping [62.38898610210771]
そこで我々は,FaceDancerという顔のスワップとID転送のための新しい単一ステージ手法を提案する。
アダプティブ・フィーチャー・フュージョン・アテンション(AFFA)と解釈的特徴類似性規則化(IFSR)の2つの主要なコントリビューションがある。
論文 参考訳(メタデータ) (2022-10-19T11:31:38Z) - PoseFace: Pose-Invariant Features and Pose-Adaptive Loss for Face
Recognition [42.62320574369969]
本稿では,顔のランドマークを利用してポーズ不変の特徴を解消し,不均衡問題に適応的に対処するためにポーズ適応的損失を利用する,効率的なPoseFaceフレームワークを提案する。
論文 参考訳(メタデータ) (2021-07-25T03:50:47Z) - Attention-guided Progressive Mapping for Profile Face Recognition [12.792576041526289]
顔認証のクロスポーズは依然として重要な課題である。
正面の顔の特徴空間にトラバースすることで、ポーズ・ロバストな特徴を学習することは、この問題を緩和するための効果的で安価な方法を提供する。
論文 参考訳(メタデータ) (2021-06-27T02:21:41Z) - Learning to Aggregate and Personalize 3D Face from In-the-Wild Photo
Collection [65.92058628082322]
非パラメトリックフェースモデリングは形状仮定なしで画像からのみ3次元フェースを再構成することを目的としている。
本稿では,教師なしのロバストな3次元顔モデリングのための学習・アグリゲート・パーソナライズ・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T03:10:17Z) - A NIR-to-VIS face recognition via part adaptive and relation attention
module [4.822208985805956]
顔認識アプリケーションでは、夜間に近赤外線(NIR)監視カメラで撮影するなど、様々な状況下で撮影された顔画像を処理する必要がある。
NIRと可視光(VIS)の照度の違いは、顔画像の領域差を引き起こし、ポーズや感情の変化も顔のマッチングを難しくする。
本稿では,セマンティックマスクを用いて得られた顔の部位を抽出し,それぞれの特徴を用いた関係モデリングを行う部分関係アテンションモジュールを提案する。
論文 参考訳(メタデータ) (2021-02-01T08:13:39Z) - Multi-Margin based Decorrelation Learning for Heterogeneous Face
Recognition [90.26023388850771]
本稿では,超球面空間におけるデコリレーション表現を抽出するディープニューラルネットワーク手法を提案する。
提案するフレームワークは,不均一表現ネットワークとデコリレーション表現学習の2つのコンポーネントに分けることができる。
2つの難解な異種顔データベースに対する実験結果から,本手法は検証タスクと認識タスクの両方において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-05-25T07:01:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。