論文の概要: Neuromorphic Event-based Facial Expression Recognition
- arxiv url: http://arxiv.org/abs/2304.06351v1
- Date: Thu, 13 Apr 2023 09:02:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-14 15:13:18.765495
- Title: Neuromorphic Event-based Facial Expression Recognition
- Title(参考訳): ニューロモルフィック事象に基づく表情認識
- Authors: Lorenzo Berlincioni, Luca Cultrera, Chiara Albisani, Lisa Cresti,
Andrea Leonardo, Sara Picchioni, Federico Becattini, Alberto Del Bimbo
- Abstract要約: 本稿では,ニューロモルフィック事象に基づく表情認識のためのデータセットNEFERを提案する。
NEFERは、ペア化されたRGBと、それぞれの感情でラベル付けされた人間の顔を表すイベントビデオで構成されている。
イベントベースアプローチの認識精度を2倍にし, 高速かつ検出し難い表現を解析するためのニューロモルフィックアプローチの有効性を実証した。
- 参考スコア(独自算出の注目度): 17.72933597458857
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recently, event cameras have shown large applicability in several computer
vision fields especially concerning tasks that require high temporal
resolution. In this work, we investigate the usage of such kind of data for
emotion recognition by presenting NEFER, a dataset for Neuromorphic Event-based
Facial Expression Recognition. NEFER is composed of paired RGB and event videos
representing human faces labeled with the respective emotions and also
annotated with face bounding boxes and facial landmarks. We detail the data
acquisition process as well as providing a baseline method for RGB and event
data. The collected data captures subtle micro-expressions, which are hard to
spot with RGB data, yet emerge in the event domain. We report a double
recognition accuracy for the event-based approach, proving the effectiveness of
a neuromorphic approach for analyzing fast and hardly detectable expressions
and the emotions they conceal.
- Abstract(参考訳): 近年,いくつかのコンピュータビジョン分野において,特に高時間分解能を必要とするタスクに対して,イベントカメラが大きな適用性を示している。
本研究では,ニューロモーフィックなイベントベースの表情認識のためのデータセットであるneferを提示することで,感情認識のためのこの種のデータの利用について検討する。
neferは対のrgbとイベントビデオで構成され、それぞれの感情にラベルが付けられた人間の顔を表現し、顔のバウンディングボックスと顔のランドマークをアノテートする。
本稿では,RGBおよびイベントデータのベースライン方法を提供するとともに,データ取得プロセスについて詳述する。
収集されたデータは、RGBデータを見つけるのが難しい微妙なマイクロ表現をキャプチャするが、イベントドメインに現れる。
事象に基づくアプローチの二重認識精度を報告し、高速かつ検出し難い表現と隠れた感情を解析するためのニューロモルフィックアプローチの有効性を実証した。
関連論文リスト
- Spatio-temporal Transformers for Action Unit Classification with Event Cameras [28.98336123799572]
本稿では,RGBビデオとイベントストリームからなる時間同期型マルチモーダル顔データセットであるFACEMORPHICを提案する。
映像を手動でアノテートすることなく、時間同期が効果的なニューロモルフィック顔分析を可能にすることを示す。
論文 参考訳(メタデータ) (2024-10-29T11:23:09Z) - Neuromorphic Facial Analysis with Cross-Modal Supervision [27.35270713671012]
本稿では、RGBビデオとイベントストリームの両方からなるマルチモーダル時間同期顔データセットであるFACEMORPHICを提案する。
映像を手動でアノテートすることなく、時間同期が効果的なニューロモルフィック顔分析を可能にすることを示す。
論文 参考訳(メタデータ) (2024-09-16T12:04:26Z) - Neuromorphic Valence and Arousal Estimation [28.793519320598865]
我々は、顔から感情状態を予測するためにニューロモルフィックデータを使用します。
トレーニングされたモデルが依然として最先端の結果を得ることができることを実証します。
本稿では,フレームベースとビデオベースの両方において,この課題を解決するための代替モデルを提案する。
論文 参考訳(メタデータ) (2024-01-29T11:13:18Z) - EventTransAct: A video transformer-based framework for Event-camera
based action recognition [52.537021302246664]
イベントカメラは、RGBビデオの標準アクション認識と比較して、新しい機会を提供する。
本研究では,最初にイベントフレーム当たりの空間埋め込みを取得するビデオトランスフォーマーネットワーク(VTN)という,計算効率のよいモデルを用いる。
イベントデータのスパースできめ細かい性質にVTNをよりよく採用するために、イベントコントラストロス(mathcalL_EC$)とイベント固有の拡張を設計する。
論文 参考訳(メタデータ) (2023-08-25T23:51:07Z) - Multi-Domain Norm-referenced Encoding Enables Data Efficient Transfer
Learning of Facial Expression Recognition [62.997667081978825]
本稿では,表情認識における伝達学習のための生物学的メカニズムを提案する。
提案アーキテクチャでは,人間の脳が,頭部形状の異なる表情を自然に認識する方法について解説する。
本モデルでは, FERGデータセットの分類精度92.15%を極端に高いデータ効率で達成する。
論文 参考訳(メタデータ) (2023-04-05T09:06:30Z) - Emotion Separation and Recognition from a Facial Expression by Generating the Poker Face with Vision Transformers [57.1091606948826]
我々はこれらの課題に対処するため,ポーカー・フェイス・ビジョン・トランスフォーマー (PF-ViT) と呼ばれる新しいFERモデルを提案する。
PF-ViTは、対応するポーカーフェースを生成して、乱れを認識できない感情を静的な顔画像から分離し、認識することを目的としている。
PF-ViTはバニラビジョントランスフォーマーを使用し、そのコンポーネントは大規模な表情データセット上でMasked Autoencodeerとして事前トレーニングされている。
論文 参考訳(メタデータ) (2022-07-22T13:39:06Z) - Generating near-infrared facial expression datasets with dimensional
affect labels [2.367786892039871]
我々は,NIR画像データセットを次元的感情ラベルで作成するための2つの補完的データ拡張手法を提案する。
実験の結果,これらの生成したNIRデータセットは,データ品質とベースライン予測性能の点で,既存のデータセットに匹敵することがわかった。
論文 参考訳(メタデータ) (2022-06-28T11:06:32Z) - Continuous Emotion Recognition with Spatiotemporal Convolutional Neural
Networks [82.54695985117783]
In-theld でキャプチャした長いビデオシーケンスを用いて,持続的な感情認識のための最先端のディープラーニングアーキテクチャの適合性を検討する。
我々は,2D-CNNと長期記憶ユニットを組み合わせた畳み込みリカレントニューラルネットワークと,2D-CNNモデルの微調整時の重みを膨らませて構築した膨らませた3D-CNNモデルを開発した。
論文 参考訳(メタデータ) (2020-11-18T13:42:05Z) - Real-time Facial Expression Recognition "In The Wild'' by Disentangling
3D Expression from Identity [6.974241731162878]
本稿では,1枚のRGB画像から人間の感情認識を行う新しい手法を提案する。
顔のダイナミックス、アイデンティティ、表情、外観、3Dポーズのバリエーションに富んだ大規模な顔ビデオデータセットを構築した。
提案するフレームワークは毎秒50フレームで動作し、3次元表現変動のパラメータを頑健に推定することができる。
論文 参考訳(メタデータ) (2020-05-12T01:32:55Z) - Continuous Emotion Recognition via Deep Convolutional Autoencoder and
Support Vector Regressor [70.2226417364135]
マシンはユーザの感情状態を高い精度で認識できることが不可欠である。
ディープニューラルネットワークは感情を認識する上で大きな成功を収めている。
表情認識に基づく連続的感情認識のための新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-01-31T17:47:16Z) - Learning to Augment Expressions for Few-shot Fine-grained Facial
Expression Recognition [98.83578105374535]
顔表情データベースF2EDについて述べる。
顔の表情は119人から54人まで、200万枚以上の画像が含まれている。
実世界のシナリオでは,不均一なデータ分布やサンプルの欠如が一般的であるので,数発の表情学習の課題を評価する。
顔画像合成のための統合されたタスク駆動型フレームワークであるComposeal Generative Adversarial Network (Comp-GAN) 学習を提案する。
論文 参考訳(メタデータ) (2020-01-17T03:26:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。