Fugu-MT 論文翻訳(概要): DrFER: Learning Disentangled Representations for 3D Facial Expression Recognition

論文の概要: DrFER: Learning Disentangled Representations for 3D Facial Expression Recognition

arxiv url: http://arxiv.org/abs/2403.08318v1
Date: Wed, 13 Mar 2024 08:00:07 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-14 15:16:10.201187
Title: DrFER: Learning Disentangled Representations for 3D Facial Expression Recognition
Title（参考訳）: DrFER:3次元顔表情における遠交表現の学習認識
Authors: Hebeizi Li, Hongyu Yang, Di Huang
Abstract要約: 本稿では,3D FERの分野に非交叉表現学習の概念を取り入れた,革新的なDrFER法を提案する。 DrFERは、表現情報をID情報から効果的に切り離すために、デュアルブランチフレームワークを使用している。この適応は、顔の表情を認識する際の枠組みの能力を高める。
参考スコア（独自算出の注目度）: 28.318304721838096
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Facial Expression Recognition (FER) has consistently been a focal point in the field of facial analysis. In the context of existing methodologies for 3D FER or 2D+3D FER, the extraction of expression features often gets entangled with identity information, compromising the distinctiveness of these features. To tackle this challenge, we introduce the innovative DrFER method, which brings the concept of disentangled representation learning to the field of 3D FER. DrFER employs a dual-branch framework to effectively disentangle expression information from identity information. Diverging from prior disentanglement endeavors in the 3D facial domain, we have carefully reconfigured both the loss functions and network structure to make the overall framework adaptable to point cloud data. This adaptation enhances the capability of the framework in recognizing facial expressions, even in cases involving varying head poses. Extensive evaluations conducted on the BU-3DFE and Bosphorus datasets substantiate that DrFER surpasses the performance of other 3D FER methods.
Abstract（参考訳）: 表情認識(FER)は、顔分析の分野において常に焦点となっている。 3D FER や 2D+3D FER の既存の手法の文脈では、表現特徴の抽出はしばしばアイデンティティ情報と絡み合い、これらの特徴の特異性を妥協する。この課題に対処するために,3D FER の分野に不整合表現学習の概念をもたらす,革新的な DrFER 手法を提案する。 DrFERは、表現情報をID情報から効果的に切り離すために、デュアルブランチフレームワークを使用している。 3次元顔領域における事前のアンタングル化作業から切り離され、損失関数とネットワーク構造の両方を慎重に再構成し、全体的なフレームワークをクラウドデータに適応させる。この適応は、顔の表情を認識する際の枠組みの能力を高める。 BU-3DFE と Bosphorus のデータセットに対する広範囲な評価は、DrFER が他の3D FER 法よりも優れていることを裏付けている。

関連論文リスト

DiffSwap++: 3D Latent-Controlled Diffusion for Identity-Preserving Face Swapping [16.846179110602737]
そこで我々は,DiffSwap++を提案する。DiffSwap++は,トレーニング中に3D顔の潜伏機能を組み込んだ,拡散型フェイススワッピングパイプラインである。本手法は, 形状整合性を高め, 外観特性から顔の識別のゆがみを改善する。 CelebA、FFHQ、CelebV-Textの実験では、DiffSwap++はターゲットのポーズと表現を維持しながらソースのアイデンティティを保ちながら、以前のメソッドよりも優れていた。
論文参考訳（メタデータ） (2025-11-04T18:56:49Z)
Rethinking Occlusion in FER: A Semantic-Aware Perspective and Go Beyond [10.015531203047598]
顔の閉塞を曖昧にするための補助的マルチモーダル・セマンティックガイダンスを導入したORSANetを提案する。また,性差や性差などの内在性雑音を緩和するために,顔のランドマークをスパース幾何学として導入する。提案するORSANetは,SOTA認識性能を実現する。
論文参考訳（メタデータ） (2025-07-21T09:04:29Z)
3D-AffordanceLLM: Harnessing Large Language Models for Open-Vocabulary Affordance Detection in 3D Worlds [81.14476072159049]
3D Affordance Detectionは、様々なロボットタスクの幅広い応用において難しい問題である。我々は従来の割当検出パラダイムをテキスト推論改善(IRAS)タスクに再構成する。本研究では,3次元オープンシーンにおけるアベイランス検出のためのフレームワークである3D-ADLLMを提案する。
論文参考訳（メタデータ） (2025-02-27T12:29:44Z)
Ig3D: Integrating 3D Face Representations in Facial Expression Inference [12.975434103690812]
本研究の目的は,表情推論タスクに3次元表現を統合することの影響を検討することである。まず、FEIタスクにおける2つの3次元顔表現(どちらも3次元形態素モデル、FLAMEに基づく)の性能を評価する。次に、既存の2D推論フレームワークと3D顔表現を統合するために、中間融合と後期融合という2つの融合アーキテクチャについて検討する。提案手法は,最先端のAffectNet VA推定とRAF-DB分類タスクより優れている。
論文参考訳（メタデータ） (2024-08-29T21:08:07Z)
Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文参考訳（メタデータ） (2024-06-17T07:43:53Z)
3D Face Modeling via Weakly-supervised Disentanglement Network joint Identity-consistency Prior [62.80458034704989]
切り離された制御因子を特徴とする3次元顔モデルの生成は、コンピュータビジョンやコンピュータグラフィックスの多様な応用において大きな可能性を秘めている。従来の3D顔モデリング手法は、これらの要因を効果的に解消するために特定のラベルを要求するため、課題に直面している。本稿では,WSDF(Wakly Supervised Disentanglement Framework)を導入し,過度に拘束的なラベル付けを必要とせず,制御可能な3次元顔モデルのトレーニングを容易にする。
論文参考訳（メタデータ） (2024-04-25T11:50:47Z)
RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文参考訳（メタデータ） (2023-12-19T03:39:56Z)
FitDiff: Robust monocular 3D facial shape and reflectance estimation using Diffusion Models [79.65289816077629]
拡散型3次元顔アバター生成モデルFitDiffを提案する。本モデルでは,「近距離」2次元顔画像から抽出したアイデンティティ埋め込みを利用して,再現性のある顔アバターを高精度に生成する。 FitDiffは、顔認識の埋め込みを前提とした最初の3D LDMであり、一般的なレンダリングエンジンで使用可能な、ライティング可能な人間のアバターを再構築する。
論文参考訳（メタデータ） (2023-12-07T17:35:49Z)
DEFN: Dual-Encoder Fourier Group Harmonics Network for Three-Dimensional Indistinct-Boundary Object Segmentation [6.0920148653974255]
本稿では,学習コーパス内の不明瞭な境界オブジェクトの表現多様性を高めるために,欠陥注入(SDi)を導入する。そこで我々はDEFN(Dual-Encoder Fourier Group Harmonics Network)を提案する。
論文参考訳（メタデータ） (2023-11-01T12:33:04Z)
3D Shape Variational Autoencoder Latent Disentanglement via Mini-Batch Feature Swapping for Bodies and Faces [12.114711258010367]
本稿では,3次元形状変化型オートエンコーダを訓練する自己教師型アプローチを提案する。 3Dメッシュで行った実験結果から,潜伏不整合に対する最先端の手法では顔と身体の同一性を取り除けないことが明らかとなった。
論文参考訳（メタデータ） (2021-11-24T11:53:33Z)
Independent Sign Language Recognition with 3D Body, Hands, and Face Reconstruction [46.70761714133466]
独立手話認識(Independent Sign Language Recognition)は、コンピュータビジョンのいくつかの課題を組み合わせた複雑な視覚認識問題である。 3つの情報チャネルを適切に組み合わせて手話の認識を効果的に行う作業は行われていない。 SMPL-Xは,1枚の画像から3次元の身体形状,顔,手の情報を同時抽出できる,現代のパラメトリックモデルである。
論文参考訳（メタデータ） (2020-11-24T23:50:26Z)
3D Dense Geometry-Guided Facial Expression Synthesis by Adversarial Learning [54.24887282693925]
本稿では,3次元密度(深度,表面正規度)情報を表現操作に用いる新しいフレームワークを提案する。既製の最先端3D再構成モデルを用いて深度を推定し,大規模RGB-Depthデータセットを作成する。実験により,提案手法は競争ベースラインと既存の芸術を大きなマージンで上回ることを示した。
論文参考訳（メタデータ） (2020-09-30T17:12:35Z)
3D Face Anti-spoofing with Factorized Bilinear Coding [35.30886962572515]
本稿では, きめ細かい分類の観点から, 新規なアンチ・スプーフィング法を提案する。 RGB と YCbCr 空間から識別的かつ相補的情報を抽出することにより、3次元顔スプーフィング検出の原理的解法を開発した。
論文参考訳（メタデータ） (2020-05-12T03:09:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。