論文の概要: FacialPulse: An Efficient RNN-based Depression Detection via Temporal Facial Landmarks
- arxiv url: http://arxiv.org/abs/2408.03499v1
- Date: Wed, 7 Aug 2024 01:50:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-08 14:05:27.801943
- Title: FacialPulse: An Efficient RNN-based Depression Detection via Temporal Facial Landmarks
- Title(参考訳): FacialPulse: 時間的顔のランドマークによる効率的なRNNによる抑うつ検出
- Authors: Ruiqi Wang, Jinyang Huang, Jie Zhang, Xin Liu, Xiang Zhang, Zhi Liu, Peng Zhao, Sigui Chen, Xiao Sun,
- Abstract要約: うつ病 (Depression) は、個人の生活と幸福に著しく影響を及ぼす精神疾患である。
近年,表情特徴を活用して自動抑うつ検出を行うエンド・ツー・エンドのディープラーニング手法が多数存在する。
本稿では,抑うつを高精度かつ高速に認識するFacialPulseという新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.076600109388394
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depression is a prevalent mental health disorder that significantly impacts individuals' lives and well-being. Early detection and intervention are crucial for effective treatment and management of depression. Recently, there are many end-to-end deep learning methods leveraging the facial expression features for automatic depression detection. However, most current methods overlook the temporal dynamics of facial expressions. Although very recent 3DCNN methods remedy this gap, they introduce more computational cost due to the selection of CNN-based backbones and redundant facial features. To address the above limitations, by considering the timing correlation of facial expressions, we propose a novel framework called FacialPulse, which recognizes depression with high accuracy and speed. By harnessing the bidirectional nature and proficiently addressing long-term dependencies, the Facial Motion Modeling Module (FMMM) is designed in FacialPulse to fully capture temporal features. Since the proposed FMMM has parallel processing capabilities and has the gate mechanism to mitigate gradient vanishing, this module can also significantly boost the training speed. Besides, to effectively use facial landmarks to replace original images to decrease information redundancy, a Facial Landmark Calibration Module (FLCM) is designed to eliminate facial landmark errors to further improve recognition accuracy. Extensive experiments on the AVEC2014 dataset and MMDA dataset (a depression dataset) demonstrate the superiority of FacialPulse on recognition accuracy and speed, with the average MAE (Mean Absolute Error) decreased by 21% compared to baselines, and the recognition speed increased by 100% compared to state-of-the-art methods. Codes are released at https://github.com/volatileee/FacialPulse.
- Abstract(参考訳): うつ病 (Depression) は、個人の生活と幸福に著しく影響を及ぼす精神疾患である。
早期発見と介入はうつ病の効果的な治療と管理に不可欠である。
近年,表情特徴を活用して自動抑うつ検出を行うエンド・ツー・エンドのディープラーニング手法が多数存在する。
しかし、現在のほとんどの手法は、表情の時間的ダイナミクスを見落としている。
非常に最近の3DCNN手法はこのギャップを補うが、CNNベースのバックボーンと冗長な顔の特徴の選択により、より計算コストがかかる。
以上の制約に対処するため,表情のタイミング相関を考慮し,抑うつを高精度かつ高速に認識するFacialPulseという新しいフレームワークを提案する。
Facial Motion Modeling Module (FMMM) はFacialPulseで設計されており、時間的特徴をフルに捉えている。
提案するFMMMは並列処理機能を備え,勾配の消滅を緩和するゲート機構を備えているため,このモジュールはトレーニング速度を大幅に向上させることができる。
さらに、顔のランドマークを効果的に使用して、元の画像を置き換えることで情報の冗長性を低下させるため、顔のランドマークエラーを排除し、認識精度をさらに向上させるために、Facial Landmark Calibration Module (FLCM) が設計された。
AVEC2014データセットとMMDAデータセット(うつ病データセット)の大規模な実験は、認識精度と速度に対するFacialPulseの優位性を示し、平均MAE(Mean Absolute Error)はベースラインに比べて21%減少し、認識速度は最先端の手法に比べて100%向上した。
コードはhttps://github.com/volatileee/FacialPulse.comで公開されている。
関連論文リスト
- Detection of Mild Cognitive Impairment Using Facial Features in Video
Conversations [4.229544696616341]
軽度認知障害(MCI)の早期発見は、MCIから認知症への進行を遅らせるための早期介入につながる。
Deep Learning (DL)アルゴリズムは、初期の非侵襲的で低コストなMCI検出を実現するのに役立つ。
本報告では, 高齢者におけるMCIの検出について, 家庭内会話から抽出した顔の特徴のみに基づくDLモデルを用いて検討する。
論文 参考訳(メタデータ) (2023-08-29T20:45:41Z) - Latent-OFER: Detect, Mask, and Reconstruct with Latent Vectors for
Occluded Facial Expression Recognition [0.0]
提案手法は, 顔の隠蔽部分を, 隠蔽されていないかのように検出し, 認識し, FER精度を向上する。
まず、視覚変換器(ViT)ベースのオクルージョンパッチ検出器は、隠蔽されたパッチから潜在ベクトルのみを訓練することで、隠蔽された位置をマスクする。
第2に、ハイブリッド再構成ネットワークは、ViTと畳み込みニューラルネットワーク(CNN)を用いて、完全な画像としてマスキング位置を生成する。
最後に、式関連潜時ベクトル抽出器は、CNNに基づくクラスアクティベーションマップを適用して、すべての潜時ベクトルから式関連情報を検索し、使用する。
論文 参考訳(メタデータ) (2023-07-21T07:56:32Z) - A Novel Enhanced Convolution Neural Network with Extreme Learning
Machine: Facial Emotional Recognition in Psychology Practices [31.159346405039667]
本研究の目的は、トレーニングセッション中の顔の感情認識精度を改善し、処理時間を短縮することである。
提案したCNNEELMモデルは、JSFFE、CK+、FER2013式データセットでトレーニングされている。
シミュレーションの結果,精度と処理時間が大きく向上し,映像解析に適したモデルが得られた。
論文 参考訳(メタデータ) (2022-08-05T02:21:34Z) - Exposing Deepfake with Pixel-wise AR and PPG Correlation from Faint
Signals [3.0034765247774864]
ディープフェイクは、法的証拠と知的財産保護の信頼性に深刻な脅威をもたらす。
既存の画素レベルの検出方法は、偽ビデオの増大するリアリズムに抵抗できない。
フェースビデオに隠された暗信号を通してディープフェイクを露呈する手法を提案する。
論文 参考訳(メタデータ) (2021-10-29T06:05:52Z) - End2End Occluded Face Recognition by Masking Corrupted Features [82.27588990277192]
最先端の一般的な顔認識モデルは、隠蔽された顔画像に対してうまく一般化しない。
本稿では,1つのエンドツーエンドのディープニューラルネットワークに基づいて,オクルージョンに頑健な新しい顔認識手法を提案する。
我々のアプローチは、深い畳み込みニューラルネットワークから破損した特徴を発見し、動的に学習されたマスクによってそれらをきれいにする。
論文 参考訳(メタデータ) (2021-08-21T09:08:41Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Micro-Facial Expression Recognition Based on Deep-Rooted Learning
Algorithm [0.0]
本稿では,MFEDRL(Micro-Facial Expression Based Deep-Rooted Learning)分類器を提案する。
アルゴリズムの性能は認識率と偽測度を用いて評価する。
論文 参考訳(メタデータ) (2020-09-12T12:23:27Z) - Unsupervised Learning Facial Parameter Regressor for Action Unit
Intensity Estimation via Differentiable Renderer [51.926868759681014]
骨駆動型顔モデル(BDFM)に基づいて,異なる視点で顔パラメータを予測する枠組みを提案する。
提案するフレームワークは,特徴抽出器,ジェネレータ,顔パラメータ回帰器から構成される。
論文 参考訳(メタデータ) (2020-08-20T09:49:13Z) - Deep Face Super-Resolution with Iterative Collaboration between
Attentive Recovery and Landmark Estimation [92.86123832948809]
本稿では,2つの繰り返しネットワーク間の反復的協調による深層面超解像(FSR)手法を提案する。
各繰り返しステップにおいて、リカバリブランチは、ランドマークの事前の知識を利用して、高品質な画像を生成する。
新しい注意融合モジュールはランドマークマップのガイダンスを強化するために設計されている。
論文 参考訳(メタデータ) (2020-03-29T16:04:48Z) - Deep Spatial Gradient and Temporal Depth Learning for Face Anti-spoofing [61.82466976737915]
深層学習は、顔の反偽造の最も効果的な方法の1つとして証明されている。
2つの洞察に基づいて,複数フレームからの提示攻撃を検出する新しい手法を提案する。
提案手法は,5つのベンチマークデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2020-03-18T06:11:20Z) - Suppressing Uncertainties for Large-Scale Facial Expression Recognition [81.51495681011404]
本稿では,不確実性を効果的に抑制し,深層ネットワークが不確実な顔画像に過度に収まらないような,シンプルで効率的なセルフキュアネットワーク(SCN)を提案する。
公開ベンチマークの結果、我々のSCNは現在の最先端メソッドよりも、RAF-DBで textbf88.14%、AffectNetで textbf60.23%、FERPlusで textbf89.35% を上回りました。
論文 参考訳(メタデータ) (2020-02-24T17:24:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。