論文の概要: LARNet: Lie Algebra Residual Network for Profile Face Recognition
- arxiv url: http://arxiv.org/abs/2103.08147v1
- Date: Mon, 15 Mar 2021 05:44:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 14:07:45.773712
- Title: LARNet: Lie Algebra Residual Network for Profile Face Recognition
- Title(参考訳): LARNet:プロフィール顔認識のためのLie Algebra残存ネットワーク
- Authors: Xiaolong Yang
- Abstract要約: 畳み込みニューラルネットワーク(CNN)の深部特徴生成過程に3次元空間における顔の回転がどう影響するかを,リー代数理論を用いた新しい手法を提案する。
画像空間における顔の回転は、回転によってのみ決定されるCNNの特徴空間における付加残留成分と等価であることが証明される。
LARNetの設計は、入力された顔画像から回転情報を復号するための残差と、特徴学習プロセスに寄与する残差成分数を制御するための学習回転度とから構成される。
- 参考スコア(独自算出の注目度): 5.968418413932049
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to large variations between profile and frontal faces, profile-based face
recognition remains as a tremendous challenge in many practical vision
scenarios. Traditional techniques address this challenge either by synthesizing
frontal faces or by pose-invariants learning. In this paper, we propose a novel
method with Lie algebra theory to explore how face rotation in the 3D space
affects the deep feature generation process of convolutional neural networks
(CNNs). We prove that face rotation in the image space is equivalent to an
additive residual component in the feature space of CNNs, which is determined
solely by the rotation. Based on this theoretical finding, we further design a
Lie algebraic residual network (LARNet) for tackling profile-based face
recognition. Our LARNet consists of a residual subnet for decoding rotation
information from input face images, and a gating subnet to learn rotation
magnitude for controlling the number of residual components contributing to the
feature learning process. Comprehensive experimental evaluations on
frontal-profile face datasets and general face recognition datasets demonstrate
that our method consistently outperforms the state-of-the-arts.
- Abstract(参考訳): プロファイルと前面の顔に大きな変化があるため、プロファイルベースの顔認識は、多くの実用的なビジョンシナリオで大きな課題として残っています。
従来の手法では、正面顔の合成やポーズ不変学習によってこの問題に対処している。
本稿では,3次元空間における顔の回転が畳み込みニューラルネットワーク(CNN)の深い特徴生成過程にどのように影響するかを,リー代数理論を用いた新しい手法を提案する。
画像空間における顔の回転は、回転によってのみ決定されるCNNの特徴空間における付加残留成分と等価であることが証明される。
この理論的発見に基づいて、プロファイルに基づく顔認識に対処するためのLie代数残差ネットワーク(LARNet)をさらに設計する。
ラーネットは、入力された顔画像から回転情報を復号する残差サブネットと、特徴学習プロセスに寄与する残差成分の数を制御する回転大きさを学習するゲーティングサブネットとからなる。
正面顔データセットと一般顔認識データセットに関する総合的な実験的評価は、我々の手法が常に最先端の手法より優れていることを示す。
関連論文リスト
- Appearance Debiased Gaze Estimation via Stochastic Subject-Wise
Adversarial Learning [33.55397868171977]
外観に基づく視線推定はコンピュータビジョンにおいて注目されており、様々な深層学習技術を用いて顕著な改善が達成されている。
本稿では,被験者の外観を一般化するネットワークを訓練する,SAZE学習という新しい枠組みを提案する。
実験の結果,MPIIGazeデータセットとEyeDiapデータセットの3.89と4.42をそれぞれ達成した。
論文 参考訳(メタデータ) (2024-01-25T00:23:21Z) - Implicit Neural Deformation for Multi-View Face Reconstruction [43.88676778013593]
マルチビューRGB画像から新しい3次元顔再構成法を提案する。
従来の3次元形態素モデルに基づく手法とは異なり,本手法は暗黙の表現を利用してリッチな幾何学的特徴を符号化する。
いくつかのベンチマークデータセットに対する実験結果から,提案手法は代替ベースラインよりも優れ,最先端の手法に比べて優れた顔再構成結果が得られることが示された。
論文 参考訳(メタデータ) (2021-12-05T07:02:53Z) - FaceTuneGAN: Face Autoencoder for Convolutional Expression Transfer
Using Neural Generative Adversarial Networks [0.7043489166804575]
顔の識別と表情を分離して符号化する新しい3次元顔モデル表現であるFaceTuneGANを提案する。
本稿では,2次元領域で使用されている画像と画像の変換ネットワークを3次元顔形状に適応させる手法を提案する。
論文 参考訳(メタデータ) (2021-12-01T14:42:03Z) - TANet: A new Paradigm for Global Face Super-resolution via
Transformer-CNN Aggregation Network [72.41798177302175]
本稿では, 顔構造特徴の表現能力を完全に探求する自己認識機構(すなわち Transformer のコア)に基づく新しいパラダイムを提案する。
具体的には、2つの経路からなるTransformer-CNNアグリゲーションネットワーク(TANet)を設計する。
上記の2つの経路から特徴を集約することにより、グローバルな顔の構造の整合性と局所的な顔のディテール復元の忠実度を同時に強化する。
論文 参考訳(メタデータ) (2021-09-16T18:15:07Z) - Learning to Aggregate and Personalize 3D Face from In-the-Wild Photo
Collection [65.92058628082322]
非パラメトリックフェースモデリングは形状仮定なしで画像からのみ3次元フェースを再構成することを目的としている。
本稿では,教師なしのロバストな3次元顔モデリングのための学習・アグリゲート・パーソナライズ・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T03:10:17Z) - Progressive Spatio-Temporal Bilinear Network with Monte Carlo Dropout
for Landmark-based Facial Expression Recognition with Uncertainty Estimation [93.73198973454944]
提案手法の性能は, 広く使用されている3つのデータセットで評価される。
ビデオベースの最先端の手法に匹敵するが、複雑さははるかに少ない。
論文 参考訳(メタデータ) (2021-06-08T13:40:30Z) - InterFaceGAN: Interpreting the Disentangled Face Representation Learned
by GANs [73.27299786083424]
我々は、最先端のGANモデルによって学習された不整合顔表現を解釈するInterFaceGANというフレームワークを提案する。
まず、GANは潜在空間の線型部分空間で様々な意味学を学ぶ。
次に、異なる意味論間の相関関係について詳細な研究を行い、部分空間射影を通してそれらをよりよく解離させる。
論文 参考訳(メタデータ) (2020-05-18T18:01:22Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z) - Exploiting Semantics for Face Image Deblurring [121.44928934662063]
本稿では,深層畳み込みニューラルネットワークによる意味的手がかりを利用して,効果的かつ効率的な顔分解アルゴリズムを提案する。
顔のセマンティックラベルを入力先として組み込んで,顔の局所構造を正規化するための適応的構造損失を提案する。
提案手法は、より正確な顔の特徴と細部を持つシャープ画像を復元する。
論文 参考訳(メタデータ) (2020-01-19T13:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。