論文の概要: Real-Time Facial Expression Emoji Masking with Convolutional Neural
Networks and Homography
- arxiv url: http://arxiv.org/abs/2012.13447v1
- Date: Thu, 24 Dec 2020 21:25:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-25 09:06:44.498302
- Title: Real-Time Facial Expression Emoji Masking with Convolutional Neural
Networks and Homography
- Title(参考訳): 畳み込みニューラルネットワークとホログラフィーを用いたリアルタイム表情絵文字マスキング
- Authors: Qinchen Wang and Sixuan Wu and Tingfeng Xia
- Abstract要約: 画像処理では、Convolutional Neural Networks(CNN)は人間の顔の画像の表情を分類するために訓練することができます。
本研究では,学生の顔に感情の絵文字を付けてマスクするシステムを構築する。
結果から,このパイプラインはリアルタイムでデプロイ可能であり,教育現場で使用することができることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural network based algorithms has shown success in many applications. In
image processing, Convolutional Neural Networks (CNN) can be trained to
categorize facial expressions of images of human faces. In this work, we create
a system that masks a student's face with a emoji of the respective emotion.
Our system consists of three building blocks: face detection using Histogram of
Gradients (HoG) and Support Vector Machine (SVM), facial expression
categorization using CNN trained on FER2013 dataset, and finally masking the
respective emoji back onto the student's face via homography estimation. (Demo:
https://youtu.be/GCjtXw1y8Pw) Our results show that this pipeline is
deploy-able in real-time, and is usable in educational settings.
- Abstract(参考訳): ニューラルネットワークに基づくアルゴリズムは多くのアプリケーションで成功している。
画像処理において、畳み込みニューラルネットワーク(CNN)は人間の顔の画像の表情を分類するために訓練することができる。
本研究では,学生の顔に感情の絵文字を付けてマスクするシステムを構築する。
本システムには3つのビルディングブロックがある: グラデーションのヒストグラムを用いた顔検出(hog)とサポートベクターマシン(svm)、fer2013データセットでトレーニングされたcnnによる表情分類、そして最後に、ホモグラフィ推定によって各絵文字を学生の顔に戻す。
(Demo: https://youtu.be/GCjtXw1y8Pw) このパイプラインはリアルタイムでデプロイ可能で、教育的な設定で使用できます。
関連論文リスト
- Alleviating Catastrophic Forgetting in Facial Expression Recognition with Emotion-Centered Models [49.3179290313959]
感情中心型生成的リプレイ (ECgr) は, 生成的対向ネットワークから合成画像を統合することで, この課題に対処する。
ECgrは、生成された画像の忠実性を保証するために品質保証アルゴリズムを組み込んでいる。
4つの多様な表情データセットに対する実験結果から,擬似リハーサル法により生成されたイメージを組み込むことで,ターゲットとするデータセットとソースデータセットのトレーニングが促進されることが示された。
論文 参考訳(メタデータ) (2024-04-18T15:28:34Z) - GiMeFive: Towards Interpretable Facial Emotion Classification [1.1468563069298348]
深層畳み込みニューラルネットワークは、顔の感情をうまく認識することが示されている。
本稿では,階層アクティベーションと勾配重み付きクラスマッピングを用いたGiMeFiveモデルを提案する。
実験結果から,本モデルでは従来の手法よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2024-02-24T00:37:37Z) - Graphics Capsule: Learning Hierarchical 3D Face Representations from 2D
Images [82.5266467869448]
Inverse Graphics Capsule Network (IGC-Net) を提案する。
IGC-Netはまずオブジェクトをセマンティック一貫性のある部分レベルの記述の集合に分解し、それらをオブジェクトレベルの記述に組み立てて階層を構築する。
論文 参考訳(メタデータ) (2023-03-20T06:32:55Z) - An Approach for Improving Automatic Mouth Emotion Recognition [1.5293427903448025]
この研究は、畳み込みニューラルネットワーク(CNN)を用いた口検出による自動感情認識技術の提案と試験である。
この技術は、コミュニケーションスキルの問題のある健康障害の人々を支援するために応用される。
論文 参考訳(メタデータ) (2022-12-12T16:17:21Z) - Emotion Separation and Recognition from a Facial Expression by Generating the Poker Face with Vision Transformers [57.1091606948826]
我々はこれらの課題に対処するため,ポーカー・フェイス・ビジョン・トランスフォーマー (PF-ViT) と呼ばれる新しいFERモデルを提案する。
PF-ViTは、対応するポーカーフェースを生成して、乱れを認識できない感情を静的な顔画像から分離し、認識することを目的としている。
PF-ViTはバニラビジョントランスフォーマーを使用し、そのコンポーネントは大規模な表情データセット上でMasked Autoencodeerとして事前トレーニングされている。
論文 参考訳(メタデータ) (2022-07-22T13:39:06Z) - Real-Time Facial Expression Recognition using Facial Landmarks and
Neural Networks [0.0]
本稿では,特徴抽出,7つの感情の分類,表情認識をリアルタイムに行うアルゴリズムを提案する。
前処理アルゴリズムに基づいてマルチ層パーセプトロンニューラルネットワークをトレーニングする。
3層はこれらの特徴ベクトルを使って訓練され、テストセットでは96%の精度が得られた。
論文 参考訳(メタデータ) (2022-01-31T21:38:30Z) - Learning Continuous Face Representation with Explicit Functions [20.5159277443333]
数学用語の有限和の形で人間の顔表現のための明示的モデル(EmFace)を提案する。
EmFaceは、顔画像の復元、デノイング、変換など、複数の顔画像処理タスクで合理的なパフォーマンスを実現している。
論文 参考訳(メタデータ) (2021-10-25T03:49:20Z) - Continuous Emotion Recognition with Spatiotemporal Convolutional Neural
Networks [82.54695985117783]
In-theld でキャプチャした長いビデオシーケンスを用いて,持続的な感情認識のための最先端のディープラーニングアーキテクチャの適合性を検討する。
我々は,2D-CNNと長期記憶ユニットを組み合わせた畳み込みリカレントニューラルネットワークと,2D-CNNモデルの微調整時の重みを膨らませて構築した膨らませた3D-CNNモデルを開発した。
論文 参考訳(メタデータ) (2020-11-18T13:42:05Z) - Synthetic Expressions are Better Than Real for Learning to Detect Facial
Actions [4.4532095214807965]
提案手法は,各映像フレームから顔の3次元形状を再構成し,その3次元メッシュを標準視に整列し,GANネットワークをトレーニングして,顔のアクションユニットによる新規画像の合成を行う。
このネットワークは、合成された表情を訓練し、実際の表情を訓練し、現在の最先端のアプローチを上回った。
論文 参考訳(メタデータ) (2020-10-21T13:11:45Z) - DeepFaceFlow: In-the-wild Dense 3D Facial Motion Estimation [56.56575063461169]
DeepFaceFlowは、3D非剛体顔の流れを推定するための堅牢で高速で高精度なフレームワークである。
私たちのフレームワークは、2つの非常に大規模な顔ビデオデータセットでトレーニングされ、テストされました。
登録された画像に対して,60fpsで3次元フローマップを生成する。
論文 参考訳(メタデータ) (2020-05-14T23:56:48Z) - Exploiting Semantics for Face Image Deblurring [121.44928934662063]
本稿では,深層畳み込みニューラルネットワークによる意味的手がかりを利用して,効果的かつ効率的な顔分解アルゴリズムを提案する。
顔のセマンティックラベルを入力先として組み込んで,顔の局所構造を正規化するための適応的構造損失を提案する。
提案手法は、より正確な顔の特徴と細部を持つシャープ画像を復元する。
論文 参考訳(メタデータ) (2020-01-19T13:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。