論文の概要: Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition
- arxiv url: http://arxiv.org/abs/2109.03336v1
- Date: Tue, 7 Sep 2021 21:05:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-09 13:49:49.534558
- Title: Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition
- Title(参考訳): 顔表情認識のための多分岐深達度基底関数ネットワーク
- Authors: Fernanda Hern\'andez-Luquin and Hugo Jair Escalante
- Abstract要約: 放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
- 参考スコア(独自算出の注目度): 80.35852245488043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emotion recognition (ER) from facial images is one of the landmark tasks in
affective computing with major developments in the last decade. Initial efforts
on ER relied on handcrafted features that were used to characterize facial
images and then feed to standard predictive models. Recent methodologies
comprise end-to-end trainable deep learning methods that simultaneously learn
both, features and predictive model. Perhaps the most successful models are
based on convolutional neural networks (CNNs). While these models have excelled
at this task, they still fail at capturing local patterns that could emerge in
the learning process. We hypothesize these patterns could be captured by
variants based on locally weighted learning. Specifically, in this paper we
propose a CNN based architecture enhanced with multiple branches formed by
radial basis function (RBF) units that aims at exploiting local information at
the final stage of the learning process. Intuitively, these RBF units capture
local patterns shared by similar instances using an intermediate
representation, then the outputs of the RBFs are feed to a softmax layer that
exploits this information to improve the predictive performance of the model.
This feature could be particularly advantageous in ER as cultural / ethnicity
differences may be identified by the local units. We evaluate the proposed
method in several ER datasets and show the proposed methodology achieves
state-of-the-art in some of them, even when we adopt a pre-trained VGG-Face
model as backbone. We show it is the incorporation of local information what
makes the proposed model competitive.
- Abstract(参考訳): 顔画像からの感情認識(ER)は、過去10年間で大きな発展を遂げた情緒的コンピューティングにおける目覚ましい課題の1つである。
初期のERの取り組みは、顔画像の特徴付けと標準的な予測モデルへのフィードに使用される手作りの機能に依存していた。
最近の手法は、特徴と予測モデルの両方を同時に学習するエンドツーエンドの訓練可能なディープラーニング手法で構成されている。
おそらく最も成功したモデルは畳み込みニューラルネットワーク(CNN)に基づいている。
これらのモデルは、このタスクに優れていますが、学習プロセスに現れる可能性のあるローカルパターンを捉えることには失敗しています。
これらのパターンを局所的な重み付け学習に基づく変種によって捉えることができると仮定する。
具体的には,学習の最終段階におけるローカル情報を活用することを目的とした,放射基底関数(RBF)ユニットによって複数の分岐が形成されたCNNベースのアーキテクチャを提案する。
直感的には、これらのRBFユニットは、中間表現を使用して類似インスタンスが共有する局所パターンをキャプチャし、RBFの出力をソフトマックス層に供給し、この情報を利用してモデルの予測性能を向上させる。
この特徴は、文化と民族の違いが地域単位によって識別される可能性があるため、ERにおいて特に有利である。
提案手法を複数のERデータセットで評価し,事前学習したVGG-Faceモデルをバックボーンとして採用しても,提案手法が最先端を実現することを示す。
提案するモデルを競争力のあるものにするのは,地域情報の導入であることを示す。
関連論文リスト
- iNeMo: Incremental Neural Mesh Models for Robust Class-Incremental Learning [22.14627083675405]
我々は、時間とともに新しいメッシュで拡張できるインクリメンタルニューラルネットワークモデルを提案する。
本研究では,Pascal3DおよびObjectNet3Dデータセットの広範な実験を通して,本手法の有効性を実証する。
我々の研究は、ポーズ推定のための最初の漸進的な学習手法も提示している。
論文 参考訳(メタデータ) (2024-07-12T13:57:49Z) - Neural Clustering based Visual Representation Learning [61.72646814537163]
クラスタリングは、機械学習とデータ分析における最も古典的なアプローチの1つである。
本稿では,特徴抽出をデータから代表者を選択するプロセスとみなすクラスタリング(FEC)による特徴抽出を提案する。
FECは、個々のクラスタにピクセルをグループ化して抽象的な代表を配置し、現在の代表とピクセルの深い特徴を更新する。
論文 参考訳(メタデータ) (2024-03-26T06:04:50Z) - Inducing Gaussian Process Networks [80.40892394020797]
本稿では,特徴空間と誘導点を同時に学習するシンプルなフレームワークであるGaussian Process Network (IGN)を提案する。
特に誘導点は特徴空間で直接学習され、複雑な構造化領域のシームレスな表現を可能にする。
実世界のデータセットに対する実験結果から,IGNは最先端の手法よりも大幅に進歩していることを示す。
論文 参考訳(メタデータ) (2022-04-21T05:27:09Z) - Learning Meta Pattern for Face Anti-Spoofing [26.82129880310214]
顔認証システムにはFAS(Face Anti-Spoofing)が不可欠である。
近年,タスク対応手工芸品の特徴を抽出するためのハイブリッド手法が研究されている。
学習から学習までのフレームワークでメタパターン(MP)を抽出する学習可能なネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-13T14:34:20Z) - Exploiting Emotional Dependencies with Graph Convolutional Networks for
Facial Expression Recognition [31.40575057347465]
本稿では,視覚における表情認識のためのマルチタスク学習フレームワークを提案する。
MTL設定において、離散認識と連続認識の両方のために共有特徴表現が学習される。
実験の結果,本手法は離散FER上での最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-06-07T10:20:05Z) - BENDR: using transformers and a contrastive self-supervised learning
task to learn from massive amounts of EEG data [15.71234837305808]
言語モデリング(LM)の手法とアーキテクチャを脳波モデリング(EM)に適用する方法を検討する。
1つの事前学習モデルが、異なるハードウェアで記録された全く新しい生の脳波シーケンスをモデル化できることがわかった。
このモデルの内部表現とアーキテクチャ全体は、さまざまな下流のBCIおよびEEG分類タスクに微調整することができる。
論文 参考訳(メタデータ) (2021-01-28T14:54:01Z) - Video-based Facial Expression Recognition using Graph Convolutional
Networks [57.980827038988735]
我々は、ビデオベースの表情認識のための共通のCNN-RNNモデルに、GCN(Graph Convolutional Network)層を導入する。
我々は、CK+、Oulu-CASIA、MMIの3つの広く使われているデータセットと、AFEW8.0の挑戦的なワイルドデータセットについて、本手法の評価を行った。
論文 参考訳(メタデータ) (2020-10-26T07:31:51Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。