論文の概要: RealSmileNet: A Deep End-To-End Network for Spontaneous and Posed Smile
Recognition
- arxiv url: http://arxiv.org/abs/2010.03203v1
- Date: Wed, 7 Oct 2020 06:23:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 23:39:59.267813
- Title: RealSmileNet: A Deep End-To-End Network for Spontaneous and Posed Smile
Recognition
- Title(参考訳): realsmilenet - 自発的かつポーズ付き笑顔認識のためのディープエンド・ツー・エンドネットワーク
- Authors: Yan Yang, Md Zakir Hossain, Tom Gedeon, Shafin Rahman
- Abstract要約: これらの問題に対処するために,エンド・ツー・エンドのディープラーニングモデルについて検討する。
我々の完全自動化モデルは高速で、一連の畳み込み層とConvLSTM層をスクラッチからトレーニングすることで特徴抽出プロセスを学びます。
4つのデータセットに対する実験は,提案モデルの堅牢性と一般化を実証するものである。
- 参考スコア(独自算出の注目度): 12.649576554639445
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Smiles play a vital role in the understanding of social interactions within
different communities, and reveal the physical state of mind of people in both
real and deceptive ways. Several methods have been proposed to recognize
spontaneous and posed smiles. All follow a feature-engineering based pipeline
requiring costly pre-processing steps such as manual annotation of face
landmarks, tracking, segmentation of smile phases, and hand-crafted features.
The resulting computation is expensive, and strongly dependent on
pre-processing steps. We investigate an end-to-end deep learning model to
address these problems, the first end-to-end model for spontaneous and posed
smile recognition. Our fully automated model is fast and learns the feature
extraction processes by training a series of convolution and ConvLSTM layer
from scratch. Our experiments on four datasets demonstrate the robustness and
generalization of the proposed model by achieving state-of-the-art
performances.
- Abstract(参考訳): 異なるコミュニティ内の社会的相互作用を理解する上では、笑顔が重要な役割を果たす。
自然の笑顔を認識できるいくつかの方法が提案されている。
すべては、顔のランドマークのマニュアルアノテーション、トラッキング、笑顔フェーズのセグメンテーション、手作り機能など、高価な前処理ステップを必要とする機能エンジニアリングベースのパイプラインに従っている。
計算結果は高価であり、前処理ステップに強く依存する。
本研究では,これらの問題に対処するエンド・ツー・エンドのディープラーニングモデルについて検討する。
我々の完全自動化モデルは高速で、一連の畳み込み層とConvLSTM層をスクラッチからトレーニングすることで特徴抽出プロセスを学びます。
4つのデータセットを用いた実験により,提案モデルのロバスト性と一般化が実証された。
関連論文リスト
- Semantics-Oriented Multitask Learning for DeepFake Detection: A Joint Embedding Approach [77.65459419417533]
本稿ではセマンティクス指向のDeepFake検出タスクをサポートするための自動データセット拡張手法を提案する。
また,顔画像とそれに対応するラベルを併用して予測を行う。
提案手法は,DeepFake検出の一般化性を向上し,人間の理解可能な説明を提供することで,ある程度のモデル解釈を行う。
論文 参考訳(メタデータ) (2024-08-29T07:11:50Z) - Self-Explainable Affordance Learning with Embodied Caption [63.88435741872204]
具体的キャプションを具現化したSelf-Explainable Affordance Learning (SEA)を紹介する。
SEAは、ロボットが意図を明確に表現し、説明可能な視覚言語キャプションと視覚能力学習のギャップを埋めることを可能にする。
本稿では, 簡便かつ効率的な方法で, 空き地と自己説明を効果的に組み合わせた新しいモデルを提案する。
論文 参考訳(メタデータ) (2024-04-08T15:22:38Z) - Towards Open-World Gesture Recognition [19.019579924491847]
手首輪デバイスに基づくジェスチャー認識などのジェスチャー認識を含む実世界のアプリケーションでは、データ分布は時間とともに変化する可能性がある。
本稿では,機械学習モデルが新しいタスクに適応できるようにするために,継続学習の利用を提案する。
オープンワールドな手首のジェスチャー認識プロセスの開発を促進するための設計ガイドラインを提供する。
論文 参考訳(メタデータ) (2024-01-20T06:45:16Z) - Proving the Potential of Skeleton Based Action Recognition to Automate
the Analysis of Manual Processes [0.0]
本研究は、ビデオストリームに基づいて、手動組立プロセスにおける現在の動作クラスを検出する。
現在の動きに関する情報により、KPI(Key-Performance-Indicators)を容易に導出できる。
この分野では最近、機械ビジョンタスクで大きな成功を収めている。
MLパイプラインを開発し、異なる(事前)処理方法とニューラルネットの広範な研究を可能にする。
論文 参考訳(メタデータ) (2023-10-12T16:11:13Z) - Self-supervised Optimization of Hand Pose Estimation using Anatomical
Features and Iterative Learning [4.698846136465861]
本稿では,人的相互作用が最小限である特定のユースケースに手振り推定を適用するための自己教師付きパイプラインを提案する。
このパイプラインは、汎用データセットでトレーニングされた手振り推定のための一般的な機械学習モデルで構成されている。
パイプラインの有効性は、手動のアセンブリシナリオにおいて、下流タスクとしてアクティビティ認識をトレーニングすることで実証される。
論文 参考訳(メタデータ) (2023-07-06T14:13:11Z) - Less is More: Facial Landmarks can Recognize a Spontaneous Smile [7.401833869874254]
MeshSmileNetは、スマイルベラシティ分類のためのトランスフォーマーアーキテクチャである。
我々は、識別的特徴を発見するためにランドマークの相対性と軌道を考える。
このアイデアにより、UVA-NEMO、BBC、MMI Facial Expression、SPOSデータセット上での最先端のパフォーマンスを実現することができる。
論文 参考訳(メタデータ) (2022-10-09T12:21:28Z) - Context-Aware Sequence Alignment using 4D Skeletal Augmentation [67.05537307224525]
コンピュータビジョン、ロボティクス、混合現実の多くの応用において、ビデオにおける人間の行動の微粒化の時間的アライメントが重要である。
本稿では,アクションのシーケンスを整列するコンテキスト認識型自己教師型学習アーキテクチャを提案する。
特に、CASAは、人間の行動の空間的・時間的文脈を組み込むために、自己注意と相互注意のメカニズムを採用している。
論文 参考訳(メタデータ) (2022-04-26T10:59:29Z) - On Contrastive Representations of Stochastic Processes [53.21653429290478]
プロセスの表現を学習することは、機械学習の新たな問題である。
本手法は,周期関数,3次元オブジェクト,動的プロセスの表現の学習に有効であることを示す。
論文 参考訳(メタデータ) (2021-06-18T11:00:24Z) - Progressive Spatio-Temporal Bilinear Network with Monte Carlo Dropout
for Landmark-based Facial Expression Recognition with Uncertainty Estimation [93.73198973454944]
提案手法の性能は, 広く使用されている3つのデータセットで評価される。
ビデオベースの最先端の手法に匹敵するが、複雑さははるかに少ない。
論文 参考訳(メタデータ) (2021-06-08T13:40:30Z) - Face Identity Disentanglement via Latent Space Mapping [47.27253184341152]
本稿では,データ表現を最小限に抑えながら,不整合な方法で表現する方法を学習する手法を提案する。
我々の重要な洞察は、StyleGANのような先行訓練済みの未条件画像生成装置を利用することで、アンタングル化と合成のプロセスを切り離すことである。
提案手法は,既存の手法を超越して,他の顔属性と同一性を切り離すことに成功した。
論文 参考訳(メタデータ) (2020-05-15T18:24:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。