論文の概要: Learning Continuous Face Representation with Explicit Functions
- arxiv url: http://arxiv.org/abs/2110.15268v1
- Date: Mon, 25 Oct 2021 03:49:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-29 14:53:37.425777
- Title: Learning Continuous Face Representation with Explicit Functions
- Title(参考訳): 明示的関数による連続顔表現の学習
- Authors: Liping Zhang, Weijun Li, Linjun Sun, Lina Yu, Xin Ning, Xiaoli Dong,
Jian Xu, Hong Qin
- Abstract要約: 数学用語の有限和の形で人間の顔表現のための明示的モデル(EmFace)を提案する。
EmFaceは、顔画像の復元、デノイング、変換など、複数の顔画像処理タスクで合理的なパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 20.5159277443333
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: How to represent a face pattern? While it is presented in a continuous way in
our visual system, computers often store and process the face image in a
discrete manner with 2D arrays of pixels. In this study, we attempt to learn a
continuous representation for face images with explicit functions. First, we
propose an explicit model (EmFace) for human face representation in the form of
a finite sum of mathematical terms, where each term is an analytic function
element. Further, to estimate the unknown parameters of EmFace, a novel neural
network, EmNet, is designed with an encoder-decoder structure and trained using
the backpropagation algorithm, where the encoder is defined by a deep
convolutional neural network and the decoder is an explicit mathematical
expression of EmFace. Experimental results show that EmFace has a higher
representation performance on faces with various expressions, postures, and
other factors, compared to that of other methods. Furthermore, EmFace achieves
reasonable performance on several face image processing tasks, including face
image restoration, denoising, and transformation.
- Abstract(参考訳): 顔のパターンをどのように表現するか?
私たちの視覚システムでは連続的に表示されますが、コンピュータはしばしば2次元のピクセル配列で顔画像を個別に保存し処理します。
本研究では,明示的な機能を持つ顔画像の連続表現を学習しようと試みる。
まず,各項が解析関数要素となる数学用語の有限和の形で,人間の顔表現のための明示的モデル(EmFace)を提案する。
さらに、新しいニューラルネットワークであるEmFaceの未知のパラメータを推定するために、EmNetはエンコーダ・デコーダ構造を用いて設計され、バックプロパゲーションアルゴリズムを用いて訓練される。
実験の結果,emfaceは表情,姿勢,その他の要素の異なる顔に対して,他の手法と比較して高い表現性能を示すことがわかった。
さらに、EmFaceは、顔画像の復元、復調、変換など、複数の顔画像処理タスクにおいて合理的なパフォーマンスを達成する。
関連論文リスト
- OSDFace: One-Step Diffusion Model for Face Restoration [72.5045389847792]
拡散モデルは、顔の修復において顕著な性能を示した。
顔復元のための新しいワンステップ拡散モデルOSDFaceを提案する。
その結果,OSDFaceは現状のSOTA(State-of-the-art)手法を視覚的品質と定量的指標の両方で上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-26T07:07:48Z) - GaussianHeads: End-to-End Learning of Drivable Gaussian Head Avatars from Coarse-to-fine Representations [54.94362657501809]
マルチビュー画像から高ダイナミックで変形可能な人間の頭部アバターをリアルタイムで生成する手法を提案する。
本手法のコアとなるのは,顔表情と頭部運動の複雑なダイナミクスを捉えることができる頭部モデルの階層的表現である。
我々は、この粗い顔アバターモデルを、エンドツーエンドのフレームワークで学習可能なパラメータとして頭部ポーズとともに訓練する。
論文 参考訳(メタデータ) (2024-09-18T13:05:43Z) - 3D Facial Expressions through Analysis-by-Neural-Synthesis [30.2749903946587]
SMIRK(Spatial Modeling for Image-based Reconstruction of Kinesics)は、画像から表現力のある3次元顔を忠実に再構築する。
既存の手法では,自己指導型トレーニングの定式化における欠点と,訓練画像における表現の多様性の欠如の2つの重要な限界を識別する。
我々の質的,定量的,特に知覚的評価は、SMIRKが正確な表現再構成における新しい最先端技術を実現することを証明している。
論文 参考訳(メタデータ) (2024-04-05T14:00:07Z) - GaFET: Learning Geometry-aware Facial Expression Translation from
In-The-Wild Images [55.431697263581626]
本稿では,パラメトリックな3次元顔表現をベースとした新しい顔表情翻訳フレームワークを提案する。
我々は、最先端の手法と比較して、高品質で正確な表情伝達結果を実現し、様々なポーズや複雑なテクスチャの適用性を実証する。
論文 参考訳(メタデータ) (2023-08-07T09:03:35Z) - Emotion Separation and Recognition from a Facial Expression by Generating the Poker Face with Vision Transformers [57.1091606948826]
我々はこれらの課題に対処するため,ポーカー・フェイス・ビジョン・トランスフォーマー (PF-ViT) と呼ばれる新しいFERモデルを提案する。
PF-ViTは、対応するポーカーフェースを生成して、乱れを認識できない感情を静的な顔画像から分離し、認識することを目的としている。
PF-ViTはバニラビジョントランスフォーマーを使用し、そのコンポーネントは大規模な表情データセット上でMasked Autoencodeerとして事前トレーニングされている。
論文 参考訳(メタデータ) (2022-07-22T13:39:06Z) - Human Face Recognition from Part of a Facial Image based on Image
Stitching [0.0]
現在の顔認識技術のほとんどは、認識される人物の完全な顔の存在を必要とする。
そこで本研究では,欠損部を画像に示す部分のフリップで縫合する工程を採用した。
ここで適用された顔認識アルゴリズムは固有顔と幾何学的手法である。
論文 参考訳(メタデータ) (2022-03-10T19:31:57Z) - Image-to-Video Generation via 3D Facial Dynamics [78.01476554323179]
静止画像から様々な映像を生成するために多目的モデルであるFaceAnimeを提案する。
私たちのモデルは、顔ビデオや顔ビデオの予測など、さまざまなAR/VRやエンターテイメントアプリケーションに汎用的です。
論文 参考訳(メタデータ) (2021-05-31T02:30:11Z) - Real-Time Facial Expression Emoji Masking with Convolutional Neural
Networks and Homography [0.0]
画像処理では、Convolutional Neural Networks(CNN)は人間の顔の画像の表情を分類するために訓練することができます。
本研究では,学生の顔に感情の絵文字を付けてマスクするシステムを構築する。
結果から,このパイプラインはリアルタイムでデプロイ可能であり,教育現場で使用することができることがわかった。
論文 参考訳(メタデータ) (2020-12-24T21:25:48Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。