論文の概要: Face Recognition Using $Sf_{3}CNN$ With Higher Feature Discrimination
- arxiv url: http://arxiv.org/abs/2102.01404v1
- Date: Tue, 2 Feb 2021 09:47:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-03 16:44:56.927169
- Title: Face Recognition Using $Sf_{3}CNN$ With Higher Feature Discrimination
- Title(参考訳): Sf_{3}CNN$を用いた高次特徴識別による顔認識
- Authors: Nayaneesh Kumar Mishra, Satish Kumar Singh
- Abstract要約: 本稿では,ビデオの顔認識に$Sf_3CNN$というフレームワークを提案する。
このフレームワークは3次元Residual Network(3D Resnet)とA-Softmaxの損失を利用してビデオの顔認識を行う。
CVBLビデオデータベースでは、以前の97%の3D ResNetsに比べて99.10%の精度が向上している。
- 参考スコア(独自算出の注目度): 14.26473757011463
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the advent of 2-dimensional Convolution Neural Networks (2D CNNs), the
face recognition accuracy has reached above 99%. However, face recognition is
still a challenge in real world conditions. A video, instead of an image, as an
input can be more useful to solve the challenges of face recognition in real
world conditions. This is because a video provides more features than an image.
However, 2D CNNs cannot take advantage of the temporal features present in the
video. We therefore, propose a framework called $Sf_{3}CNN$ for face
recognition in videos. The $Sf_{3}CNN$ framework uses 3-dimensional Residual
Network (3D Resnet) and A-Softmax loss for face recognition in videos. The use
of 3D ResNet helps to capture both spatial and temporal features into one
compact feature map. However, the 3D CNN features must be highly discriminative
for efficient face recognition. The use of A-Softmax loss helps to extract
highly discriminative features from the video for face recognition. $Sf_{3}CNN$
framework gives an increased accuracy of 99.10% on CVBL video database in
comparison to the previous 97% on the same database using 3D ResNets.
- Abstract(参考訳): 2次元畳み込みニューラルネットワーク(2d cnn)の出現により、顔認識精度は99%を超えている。
しかし、顔認識は現実世界の状況では依然として課題です。
画像の代わりにビデオは、実際の状況における顔認識の課題を解決するのに、入力としてより有用である。
これは、ビデオが画像よりも多くの機能を提供するためです。
しかし、2D CNNはビデオの時間的特徴を生かすことはできない。
そこで我々は,ビデオの顔認識に$Sf_{3}CNN$というフレームワークを提案する。
The $Sf_{3}CNN$ framework using 3-dimensional Residual Network (3D Resnet) and A-Softmax loss for face recognition in video。
3D ResNetの使用は、空間的特徴と時間的特徴の両方を1つのコンパクトな特徴マップにキャプチャするのに役立つ。
しかし、3D CNN機能は、効率的な顔認識のために非常に差別的である必要があります。
A-Softmaxの損失は、顔認識のためにビデオから高い差別的特徴を抽出するのに役立ちます。
Sf_{3}CNN$ frameworkは、CVBLビデオデータベースの99.10%の精度を、3D ResNetsを使用して同じデータベースの97%と比較する。
関連論文リスト
- Generating 2D and 3D Master Faces for Dictionary Attacks with a
Network-Assisted Latent Space Evolution [68.8204255655161]
マスターフェイス(英: master face)とは、人口の比率の高い顔認証をパスする顔画像である。
2次元および3次元の顔認証モデルに対して,これらの顔の最適化を行う。
3Dでは,2次元スタイルGAN2ジェネレータを用いて顔を生成し,深部3次元顔再構成ネットワークを用いて3次元構造を予測する。
論文 参考訳(メタデータ) (2022-11-25T09:15:38Z) - Video2StyleGAN: Encoding Video in Latent Space for Manipulation [63.03250800510085]
本稿では,顔映像のセマンティックな操作のために,顔映像をStyleGANの潜在空間に符号化する新しいネットワークを提案する。
提案手法は,リアルタイム(66fps)の高速化を実現しつつ,既存の単一画像手法よりも大幅に優れる。
論文 参考訳(メタデータ) (2022-06-27T06:48:15Z) - Image-to-Video Generation via 3D Facial Dynamics [78.01476554323179]
静止画像から様々な映像を生成するために多目的モデルであるFaceAnimeを提案する。
私たちのモデルは、顔ビデオや顔ビデオの予測など、さまざまなAR/VRやエンターテイメントアプリケーションに汎用的です。
論文 参考訳(メタデータ) (2021-05-31T02:30:11Z) - MoViNets: Mobile Video Networks for Efficient Video Recognition [52.49314494202433]
3D畳み込みニューラルネットワーク(CNN)は、ビデオ認識では正確だが、大きな計算とメモリ予算を必要とする。
本稿では,3次元CNNのピークメモリ使用量を大幅に削減しつつ,計算効率を向上させる3段階の手法を提案する。
論文 参考訳(メタデータ) (2021-03-21T23:06:38Z) - Face Recognition using 3D CNNs [14.26473757011463]
我々はCVBLビデオデータセットという独自のビデオデータセットを開発した。
ビデオにおける顔認識に3D CNNを使用すると、CVBLデータセット上で97%の精度で有望な結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T11:31:40Z) - Reconstructing A Large Scale 3D Face Dataset for Deep 3D Face
Identification [9.159921061636695]
本稿では,2次元支援型深部3次元顔認証の枠組みを提案する。
特に,大規模な2次元顔データベースから数百万の3次元顔スキャンを再構築することを提案する。
提案手法はFRGC v2.0, Bosphorus, BU-3DFEの3次元顔データベース上で, 最先端のランク1スコアを実現する。
論文 参考訳(メタデータ) (2020-10-16T13:48:38Z) - Multi-channel Deep 3D Face Recognition [4.726009758066045]
2次元顔認証の精度は、ポーズ、照明、メイクアップ、表情の変化によって依然として疑問視されている。
本稿では,3次元顔データに基づく顔認識のためのマルチチャネルディープ3次元顔ネットワークを提案する。
マルチチャネル深部3次元顔ネットワークの顔認識精度は98.6。
論文 参考訳(メタデータ) (2020-09-30T15:29:05Z) - Face Super-Resolution Guided by 3D Facial Priors [92.23902886737832]
シャープな顔構造を把握した3次元顔先行情報を明示的に組み込んだ新しい顔超解像法を提案する。
我々の研究は、顔属性のパラメトリック記述の融合に基づく3次元形態的知識を初めて探求したものである。
提案した3D先行画像は、最先端技術よりも優れた顔超解像結果が得られる。
論文 参考訳(メタデータ) (2020-07-18T15:26:07Z) - Unique Faces Recognition in Videos [0.0]
本稿では,距離学習法と類似度ランキングモデルを用いたビデオの顔認識に取り組む。
使用されるデータセットは、ビデオにおける顔認識の問題を調べるために設計されたYouTube Face Databaseである。
論文 参考訳(メタデータ) (2020-06-10T08:08:26Z) - DeepFaceFlow: In-the-wild Dense 3D Facial Motion Estimation [56.56575063461169]
DeepFaceFlowは、3D非剛体顔の流れを推定するための堅牢で高速で高精度なフレームワークである。
私たちのフレームワークは、2つの非常に大規模な顔ビデオデータセットでトレーニングされ、テストされました。
登録された画像に対して,60fpsで3次元フローマップを生成する。
論文 参考訳(メタデータ) (2020-05-14T23:56:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。