論文の概要: DrFER: Learning Disentangled Representations for 3D Facial Expression
Recognition
- arxiv url: http://arxiv.org/abs/2403.08318v1
- Date: Wed, 13 Mar 2024 08:00:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 15:16:10.201187
- Title: DrFER: Learning Disentangled Representations for 3D Facial Expression
Recognition
- Title(参考訳): DrFER:3次元顔表情における遠交表現の学習
認識
- Authors: Hebeizi Li, Hongyu Yang, Di Huang
- Abstract要約: 本稿では,3D FERの分野に非交叉表現学習の概念を取り入れた,革新的なDrFER法を提案する。
DrFERは、表現情報をID情報から効果的に切り離すために、デュアルブランチフレームワークを使用している。
この適応は、顔の表情を認識する際の枠組みの能力を高める。
- 参考スコア(独自算出の注目度): 28.318304721838096
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Facial Expression Recognition (FER) has consistently been a focal point in
the field of facial analysis. In the context of existing methodologies for 3D
FER or 2D+3D FER, the extraction of expression features often gets entangled
with identity information, compromising the distinctiveness of these features.
To tackle this challenge, we introduce the innovative DrFER method, which
brings the concept of disentangled representation learning to the field of 3D
FER. DrFER employs a dual-branch framework to effectively disentangle
expression information from identity information. Diverging from prior
disentanglement endeavors in the 3D facial domain, we have carefully
reconfigured both the loss functions and network structure to make the overall
framework adaptable to point cloud data. This adaptation enhances the
capability of the framework in recognizing facial expressions, even in cases
involving varying head poses. Extensive evaluations conducted on the BU-3DFE
and Bosphorus datasets substantiate that DrFER surpasses the performance of
other 3D FER methods.
- Abstract(参考訳): 表情認識(FER)は、顔分析の分野において常に焦点となっている。
3D FER や 2D+3D FER の既存の手法の文脈では、表現特徴の抽出はしばしばアイデンティティ情報と絡み合い、これらの特徴の特異性を妥協する。
この課題に対処するために,3D FER の分野に不整合表現学習の概念をもたらす,革新的な DrFER 手法を提案する。
DrFERは、表現情報をID情報から効果的に切り離すために、デュアルブランチフレームワークを使用している。
3次元顔領域における事前のアンタングル化作業から切り離され、損失関数とネットワーク構造の両方を慎重に再構成し、全体的なフレームワークをクラウドデータに適応させる。
この適応は、顔の表情を認識する際の枠組みの能力を高める。
BU-3DFE と Bosphorus のデータセットに対する広範囲な評価は、DrFER が他の3D FER 法よりも優れていることを裏付けている。
関連論文リスト
- RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering
Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。
本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文 参考訳(メタデータ) (2023-12-19T03:39:56Z) - FitDiff: Robust monocular 3D facial shape and reflectance estimation
using Diffusion Models [85.45528952520468]
拡散型3次元顔アバター生成モデルFitDiffを提案する。
この装置は、"in-the-the-wild" 2D顔画像から抽出されたアイデンティティ埋め込みを利用して、再生可能な顔アバターを生成する。
顔認識の埋め込みを前提とした最初のLCMであるFitDiffは、一般的なレンダリングエンジンで使用可能な、ライティング可能な人間のアバターを再構築する。
論文 参考訳(メタデータ) (2023-12-07T17:35:49Z) - IT3D: Improved Text-to-3D Generation with Explicit View Synthesis [71.68595192524843]
本研究では、これらの問題に対処するために、明示的に合成されたマルチビュー画像を活用する新しい戦略を提案する。
我々のアプローチは、高画質画像を生成するために、LCDによって強化されたイメージ・ツー・イメージ・パイプラインを活用することである。
組込み判別器では、合成したマルチビュー画像は実データと見なされ、最適化された3Dモデルのレンダリングは偽データとして機能する。
論文 参考訳(メタデータ) (2023-08-22T14:39:17Z) - Semantic-aware One-shot Face Re-enactment with Dense Correspondence
Estimation [100.60938767993088]
ワンショットの顔の再現は、ソースと駆動する顔の同一性ミスマッチのため、難しい作業である。
本稿では,3次元形態素モデル(3DMM)を明示的な顔のセマンティックな分解とアイデンティティの絡み合いに利用することを提案する。
論文 参考訳(メタデータ) (2022-11-23T03:02:34Z) - ImFace: A Nonlinear 3D Morphable Face Model with Implicit Neural
Representations [21.389170615787368]
本稿では,暗黙のニューラル表現を持つ非線形かつ連続的な空間を学習するために,新しい3次元顔モデルImFaceを提案する。
2つの明示的に非交叉な変形場を構築し、それぞれアイデンティティと表現に関連する複雑な形状をモデル化し、表現の埋め込みを拡張するための改良された学習戦略を設計する。
ImFaceに加えて、暗黙の表現における水密入力要求の問題に対処するために、効果的な前処理パイプラインが提案されている。
論文 参考訳(メタデータ) (2022-03-28T05:37:59Z) - 3D Shape Variational Autoencoder Latent Disentanglement via Mini-Batch
Feature Swapping for Bodies and Faces [12.114711258010367]
本稿では,3次元形状変化型オートエンコーダを訓練する自己教師型アプローチを提案する。
3Dメッシュで行った実験結果から,潜伏不整合に対する最先端の手法では顔と身体の同一性を取り除けないことが明らかとなった。
論文 参考訳(メタデータ) (2021-11-24T11:53:33Z) - Disentangled Face Identity Representations for joint 3D Face Recognition
and Expression Neutralisation [20.854071758664297]
提案手法は,3次元顔が与えられた場合,不整合性表現を抽出するだけでなく,その同一性を予測しながら中性表現を伴う現実的な3次元顔を生成する。
提案するネットワークは,(1)3次元顔から潜在表現を符号化するグラフ畳み込みオートエンコーダ(gca),(2)潜在表現を中性顔の表現に変換する生成逆ネットワーク(gan)、(3)3次元顔認識のための中性潜在表現を利用した識別サブネットワークの3つの構成要素から構成されている。
論文 参考訳(メタデータ) (2021-04-20T22:33:10Z) - Independent Sign Language Recognition with 3D Body, Hands, and Face
Reconstruction [46.70761714133466]
独立手話認識(Independent Sign Language Recognition)は、コンピュータビジョンのいくつかの課題を組み合わせた複雑な視覚認識問題である。
3つの情報チャネルを適切に組み合わせて手話の認識を効果的に行う作業は行われていない。
SMPL-Xは,1枚の画像から3次元の身体形状,顔,手の情報を同時抽出できる,現代のパラメトリックモデルである。
論文 参考訳(メタデータ) (2020-11-24T23:50:26Z) - 3D Dense Geometry-Guided Facial Expression Synthesis by Adversarial
Learning [54.24887282693925]
本稿では,3次元密度(深度,表面正規度)情報を表現操作に用いる新しいフレームワークを提案する。
既製の最先端3D再構成モデルを用いて深度を推定し,大規模RGB-Depthデータセットを作成する。
実験により,提案手法は競争ベースラインと既存の芸術を大きなマージンで上回ることを示した。
論文 参考訳(メタデータ) (2020-09-30T17:12:35Z) - 3D Face Anti-spoofing with Factorized Bilinear Coding [35.30886962572515]
本稿では, きめ細かい分類の観点から, 新規なアンチ・スプーフィング法を提案する。
RGB と YCbCr 空間から識別的かつ相補的情報を抽出することにより、3次元顔スプーフィング検出の原理的解法を開発した。
論文 参考訳(メタデータ) (2020-05-12T03:09:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。