論文の概要: Face Trees for Expression Recognition
- arxiv url: http://arxiv.org/abs/2112.02487v1
- Date: Sun, 5 Dec 2021 06:35:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-07 15:01:32.455234
- Title: Face Trees for Expression Recognition
- Title(参考訳): 表情認識のための顔木
- Authors: Mojtaba Kolahdouzi, Alireza Sepas-Moghaddam, Ali Etemad
- Abstract要約: 表情認識のためのエンドツーエンドアーキテクチャを提案する。
提案アーキテクチャでは,顔の構造を学習するためのランドマーク位置と,テクスチャ情報を学ぶためのランドマーク周辺のパッチに焦点を当てた2つの主要なストリームが組み込まれている。
AffectNet と FER2013 の2つの大規模顔表情データセットについて広範囲に実験を行い,提案手法の有効性を検証した。
- 参考スコア(独自算出の注目度): 13.099925083569333
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We propose an end-to-end architecture for facial expression recognition. Our
model learns an optimal tree topology for facial landmarks, whose traversal
generates a sequence from which we obtain an embedding to feed a sequential
learner. The proposed architecture incorporates two main streams, one focusing
on landmark positions to learn the structure of the face, while the other
focuses on patches around the landmarks to learn texture information. Each
stream is followed by an attention mechanism and the outputs are fed to a
two-stream fusion component to perform the final classification. We conduct
extensive experiments on two large-scale publicly available facial expression
datasets, AffectNet and FER2013, to evaluate the efficacy of our approach. Our
method outperforms other solutions in the area and sets new state-of-the-art
expression recognition rates on these datasets.
- Abstract(参考訳): 表情認識のためのエンドツーエンドアーキテクチャを提案する。
モデルでは,顔のランドマークに最適なツリートポロジを学習し,そのトランバーサルがシーケンスを生成して,シーケンシャルな学習者にフィードバックを与える。
提案アーキテクチャでは,顔の構造を学習するためのランドマーク位置に焦点を当てた2つの主要なストリームと,テクスチャ情報を学ぶためのランドマーク周囲のパッチに焦点を当てている。
各ストリームには注意機構が続き、出力は2つのストリーム融合コンポーネントに供給され、最終的な分類を行う。
AffectNet と FER2013 の2つの大規模顔表情データセットについて広範囲に実験を行い,提案手法の有効性を検証した。
提案手法は,この領域における他の解よりも優れ,これらのデータセット上で新しい最先端表現認識率を設定する。
関連論文リスト
- UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。
我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文 参考訳(メタデータ) (2024-07-26T20:51:54Z) - Towards Multi-domain Face Landmark Detection with Synthetic Data from
Diffusion model [27.307563102526192]
深層学習に基づく眼球内顔の顔のランドマーク検出は、大幅な改善が達成された。
他の領域(漫画、似顔絵など)では、顔のランドマーク検出にはまだ課題がある。
限られたデータセットと事前学習拡散モデルを効果的に活用する2段階のトレーニング手法を設計する。
提案手法は,マルチドメイン顔ランドマーク検出における既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-01-24T02:35:32Z) - FaceTopoNet: Facial Expression Recognition using Face Topology Learning [23.139108533273777]
本稿では,顔の効果的なツリートポロジーを学習可能な,表情認識のためのエンドツーエンドの深層モデルを提案する。
我々のモデルは学習した木をトラバースしてシーケンスを生成し、次に埋め込みを形成してシーケンシャルな学習者に供給する。
提案手法を評価するために,大規模な4つの顔表情データセットについて広範囲に実験を行った。
論文 参考訳(メタデータ) (2022-09-13T22:02:54Z) - Learning Semantics for Visual Place Recognition through Multi-Scale
Attention [14.738954189759156]
本稿では,データの視覚的外観と意味的内容から,ロバストなグローバルな埋め込みを学習する最初のVPRアルゴリズムを提案する。
さまざまなシナリオの実験により、この新しいアプローチが検証され、最先端の手法に対するパフォーマンスが実証される。
論文 参考訳(メタデータ) (2022-01-24T14:13:12Z) - A Unified Architecture of Semantic Segmentation and Hierarchical
Generative Adversarial Networks for Expression Manipulation [52.911307452212256]
セマンティックセグメンテーションと階層的GANの統一アーキテクチャを開発する。
我々のフレームワークのユニークな利点は、将来的なセマンティックセグメンテーションネットワーク条件を生成モデルに渡すことである。
我々は,AffectNetとRaFDの2つの難解な表情翻訳ベンチマークとセマンティックセグメンテーションベンチマークであるCelebAMask-HQについて評価を行った。
論文 参考訳(メタデータ) (2021-12-08T22:06:31Z) - Progressive Spatio-Temporal Bilinear Network with Monte Carlo Dropout
for Landmark-based Facial Expression Recognition with Uncertainty Estimation [93.73198973454944]
提案手法の性能は, 広く使用されている3つのデータセットで評価される。
ビデオベースの最先端の手法に匹敵するが、複雑さははるかに少ない。
論文 参考訳(メタデータ) (2021-06-08T13:40:30Z) - Deep Structured Prediction for Facial Landmark Detection [59.60946775628646]
本稿では,深層畳み込みネットワークと条件付きランダムフィールドを組み合わせた深層構造顔のランドマーク検出手法を提案する。
顔のランドマーク検出における最先端技術よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-10-18T17:09:24Z) - Unsupervised Deep Cross-modality Spectral Hashing [65.3842441716661]
このフレームワークは、最適化をバイナリ最適化とハッシュ関数学習に分離する2段階のハッシュアプローチである。
本稿では,単一モダリティと二項相互モダリティを同時に学習するスペクトル埋め込みに基づく新しいアルゴリズムを提案する。
我々は、画像に強力なCNNを活用し、テキストモダリティを学ぶためのCNNベースのディープアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-08-01T09:20:11Z) - Structured Landmark Detection via Topology-Adapting Deep Graph Learning [75.20602712947016]
解剖学的顔と医学的ランドマーク検出のための新しいトポロジ適応深層グラフ学習手法を提案する。
提案手法は局所像特徴と大域形状特徴の両方を利用するグラフ信号を構成する。
3つの公開顔画像データセット(WFLW、300W、COFW-68)と3つの現実世界のX線医学データセット(ケパロメトリ、ハンド、ペルビス)で実験を行った。
論文 参考訳(メタデータ) (2020-04-17T11:55:03Z) - Deep Multi-Facial Patches Aggregation Network For Facial Expression
Recognition [5.735035463793008]
深層多面的パッチアグリゲーションネットワークに基づく顔表情認識(FER)のアプローチを提案する。
ディープ機能は、ディープサブネットワークを使用して顔のパッチから学習され、表現分類のために1つのディープアーキテクチャに集約される。
論文 参考訳(メタデータ) (2020-02-20T17:57:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。