論文の概要: DrFER: Learning Disentangled Representations for 3D Facial Expression
Recognition
- arxiv url: http://arxiv.org/abs/2403.08318v1
- Date: Wed, 13 Mar 2024 08:00:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 15:16:10.201187
- Title: DrFER: Learning Disentangled Representations for 3D Facial Expression
Recognition
- Title(参考訳): DrFER:3次元顔表情における遠交表現の学習
認識
- Authors: Hebeizi Li, Hongyu Yang, Di Huang
- Abstract要約: 本稿では,3D FERの分野に非交叉表現学習の概念を取り入れた,革新的なDrFER法を提案する。
DrFERは、表現情報をID情報から効果的に切り離すために、デュアルブランチフレームワークを使用している。
この適応は、顔の表情を認識する際の枠組みの能力を高める。
- 参考スコア(独自算出の注目度): 28.318304721838096
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Facial Expression Recognition (FER) has consistently been a focal point in
the field of facial analysis. In the context of existing methodologies for 3D
FER or 2D+3D FER, the extraction of expression features often gets entangled
with identity information, compromising the distinctiveness of these features.
To tackle this challenge, we introduce the innovative DrFER method, which
brings the concept of disentangled representation learning to the field of 3D
FER. DrFER employs a dual-branch framework to effectively disentangle
expression information from identity information. Diverging from prior
disentanglement endeavors in the 3D facial domain, we have carefully
reconfigured both the loss functions and network structure to make the overall
framework adaptable to point cloud data. This adaptation enhances the
capability of the framework in recognizing facial expressions, even in cases
involving varying head poses. Extensive evaluations conducted on the BU-3DFE
and Bosphorus datasets substantiate that DrFER surpasses the performance of
other 3D FER methods.
- Abstract(参考訳): 表情認識(FER)は、顔分析の分野において常に焦点となっている。
3D FER や 2D+3D FER の既存の手法の文脈では、表現特徴の抽出はしばしばアイデンティティ情報と絡み合い、これらの特徴の特異性を妥協する。
この課題に対処するために,3D FER の分野に不整合表現学習の概念をもたらす,革新的な DrFER 手法を提案する。
DrFERは、表現情報をID情報から効果的に切り離すために、デュアルブランチフレームワークを使用している。
3次元顔領域における事前のアンタングル化作業から切り離され、損失関数とネットワーク構造の両方を慎重に再構成し、全体的なフレームワークをクラウドデータに適応させる。
この適応は、顔の表情を認識する際の枠組みの能力を高める。
BU-3DFE と Bosphorus のデータセットに対する広範囲な評価は、DrFER が他の3D FER 法よりも優れていることを裏付けている。
関連論文リスト
- Ig3D: Integrating 3D Face Representations in Facial Expression Inference [12.975434103690812]
本研究の目的は,表情推論タスクに3次元表現を統合することの影響を検討することである。
まず、FEIタスクにおける2つの3次元顔表現(どちらも3次元形態素モデル、FLAMEに基づく)の性能を評価する。
次に、既存の2D推論フレームワークと3D顔表現を統合するために、中間融合と後期融合という2つの融合アーキテクチャについて検討する。
提案手法は,最先端のAffectNet VA推定とRAF-DB分類タスクより優れている。
論文 参考訳(メタデータ) (2024-08-29T21:08:07Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - 3D Face Modeling via Weakly-supervised Disentanglement Network joint Identity-consistency Prior [62.80458034704989]
切り離された制御因子を特徴とする3次元顔モデルの生成は、コンピュータビジョンやコンピュータグラフィックスの多様な応用において大きな可能性を秘めている。
従来の3D顔モデリング手法は、これらの要因を効果的に解消するために特定のラベルを要求するため、課題に直面している。
本稿では,WSDF(Wakly Supervised Disentanglement Framework)を導入し,過度に拘束的なラベル付けを必要とせず,制御可能な3次元顔モデルのトレーニングを容易にする。
論文 参考訳(メタデータ) (2024-04-25T11:50:47Z) - RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering
Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。
本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文 参考訳(メタデータ) (2023-12-19T03:39:56Z) - FitDiff: Robust monocular 3D facial shape and reflectance estimation using Diffusion Models [79.65289816077629]
拡散型3次元顔アバター生成モデルFitDiffを提案する。
本モデルでは,「近距離」2次元顔画像から抽出したアイデンティティ埋め込みを利用して,再現性のある顔アバターを高精度に生成する。
FitDiffは、顔認識の埋め込みを前提とした最初の3D LDMであり、一般的なレンダリングエンジンで使用可能な、ライティング可能な人間のアバターを再構築する。
論文 参考訳(メタデータ) (2023-12-07T17:35:49Z) - DEFN: Dual-Encoder Fourier Group Harmonics Network for Three-Dimensional Indistinct-Boundary Object Segmentation [6.0920148653974255]
本稿では,学習コーパス内の不明瞭な境界オブジェクトの表現多様性を高めるために,欠陥注入(SDi)を導入する。
そこで我々はDEFN(Dual-Encoder Fourier Group Harmonics Network)を提案する。
論文 参考訳(メタデータ) (2023-11-01T12:33:04Z) - 3D Shape Variational Autoencoder Latent Disentanglement via Mini-Batch
Feature Swapping for Bodies and Faces [12.114711258010367]
本稿では,3次元形状変化型オートエンコーダを訓練する自己教師型アプローチを提案する。
3Dメッシュで行った実験結果から,潜伏不整合に対する最先端の手法では顔と身体の同一性を取り除けないことが明らかとなった。
論文 参考訳(メタデータ) (2021-11-24T11:53:33Z) - Independent Sign Language Recognition with 3D Body, Hands, and Face
Reconstruction [46.70761714133466]
独立手話認識(Independent Sign Language Recognition)は、コンピュータビジョンのいくつかの課題を組み合わせた複雑な視覚認識問題である。
3つの情報チャネルを適切に組み合わせて手話の認識を効果的に行う作業は行われていない。
SMPL-Xは,1枚の画像から3次元の身体形状,顔,手の情報を同時抽出できる,現代のパラメトリックモデルである。
論文 参考訳(メタデータ) (2020-11-24T23:50:26Z) - 3D Dense Geometry-Guided Facial Expression Synthesis by Adversarial
Learning [54.24887282693925]
本稿では,3次元密度(深度,表面正規度)情報を表現操作に用いる新しいフレームワークを提案する。
既製の最先端3D再構成モデルを用いて深度を推定し,大規模RGB-Depthデータセットを作成する。
実験により,提案手法は競争ベースラインと既存の芸術を大きなマージンで上回ることを示した。
論文 参考訳(メタデータ) (2020-09-30T17:12:35Z) - 3D Face Anti-spoofing with Factorized Bilinear Coding [35.30886962572515]
本稿では, きめ細かい分類の観点から, 新規なアンチ・スプーフィング法を提案する。
RGB と YCbCr 空間から識別的かつ相補的情報を抽出することにより、3次元顔スプーフィング検出の原理的解法を開発した。
論文 参考訳(メタデータ) (2020-05-12T03:09:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。