論文の概要: Multi-hierarchical Convolutional Network for Efficient Remote
Photoplethysmograph Signal and Heart Rate Estimation from Face Video Clips
- arxiv url: http://arxiv.org/abs/2104.02260v1
- Date: Tue, 6 Apr 2021 03:04:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 20:29:23.924179
- Title: Multi-hierarchical Convolutional Network for Efficient Remote
Photoplethysmograph Signal and Heart Rate Estimation from Face Video Clips
- Title(参考訳): マルチヒエラルキー畳み込みネットワークによる高効率リモートフォトプレチモグラフ信号と顔ビデオクリップからの心拍数推定
- Authors: Panpan Zhang, Bin Li, Jinye Peng, Wei Jiang
- Abstract要約: 本研究では,顔ビデオクリップから生理学的信号(r)を推定できる効率的なマルチアーキテクチャ畳み込みネットワークを提案する。
3つのデータセットにおける実験結果から,提案手法は最先端手法よりも優れていた。
- 参考スコア(独自算出の注目度): 12.372651719200851
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Heart beat rhythm and heart rate (HR) are important physiological parameters
of the human body. This study presents an efficient multi-hierarchical
spatio-temporal convolutional network that can quickly estimate remote
physiological (rPPG) signal and HR from face video clips. First, the facial
color distribution characteristics are extracted using a low-level face feature
Generation (LFFG) module. Then, the three-dimensional (3D) spatio-temporal
stack convolution module (STSC) and multi-hierarchical feature fusion module
(MHFF) are used to strengthen the spatio-temporal correlation of multi-channel
features. In the MHFF, sparse optical flow is used to capture the tiny motion
information of faces between frames and generate a self-adaptive region of
interest (ROI) skin mask. Finally, the signal prediction module (SP) is used to
extract the estimated rPPG signal. The experimental results on the three
datasets show that the proposed network outperforms the state-of-the-art
methods.
- Abstract(参考訳): 心拍リズムと心拍数(HR)は人体の重要な生理的パラメータである。
本研究では,顔ビデオクリップから遠隔生理学信号とHRを迅速に推定できる,効率的な多階層型時空間畳み込みネットワークを提案する。
まず、低レベル顔特徴生成(LFFG)モジュールを用いて顔色分布特性を抽出する。
次に,3次元時空間スタック畳み込みモジュール(STSC)と多階層特徴融合モジュール(MHFF)を用いて,多チャンネル特徴の時空間相関を強化する。
MHFFでは、フレーム間の顔の小さな動き情報を捕捉し、関心の自己適応領域(ROI)を生成するためにスパース光学フローを用いる。
最後に、信号予測モジュール(SP)を用いて推定rPPG信号を抽出する。
3つのデータセットの実験結果から,提案したネットワークは最先端手法よりも優れていた。
関連論文リスト
- Freqformer: Frequency-Domain Transformer for 3-D Visualization and Quantification of Human Retinal Circulation [0.9487097819140653]
Freqformerはトランスフォーマーベースのアーキテクチャで、単一のスキャンから人間の網膜循環を3Dで高解像度で可視化するように設計されている。
提案手法は,最先端の畳み込みニューラルネットワーク(CNN)およびトランスフォーマーモデルより優れる。
Freqformerは網膜循環の理解と特性を著しく改善し、潜在的な臨床応用を提供する。
論文 参考訳(メタデータ) (2024-11-17T22:38:39Z) - FactorizePhys: Matrix Factorization for Multidimensional Attention in Remote Physiological Sensing [10.81951503398909]
Factorized Self-Attention Module (FSAM) は、非負行列分解を用いたボクセル埋め込みから多次元の注意を計算する。
提案手法は,空間的,時間的,チャネル的注意を包括的に獲得し,一般的な信号抽出の性能を高めるために,ボクセルの埋め込みを適応的に分解する。
FactorizePhysは、生のビデオフレームから血流パルス信号を推定するためのエンドツーエンドの3D-CNNアーキテクチャである。
論文 参考訳(メタデータ) (2024-11-03T12:22:58Z) - RespDiff: An End-to-End Multi-scale RNN Diffusion Model for Respiratory Waveform Estimation from PPG Signals [3.306437812367815]
PPG信号からの呼吸波形推定のためのエンドツーエンドマルチスケールRNNモデルであるRespDiffを提案する。
モデルはマルチスケールエンコーダを使用し、異なる解像度で特徴を抽出し、双方向RNNを使用してPSG信号を処理し、呼吸波形を抽出する。
BIDMCデータセットで行った実験では、RespDiffはRR推定の1.18bpmの平均絶対誤差(MAE)を達成し、先行研究よりも優れていた。
論文 参考訳(メタデータ) (2024-10-06T05:54:49Z) - PhysFormer++: Facial Video-based Physiological Measurement with SlowFast
Temporal Difference Transformer [76.40106756572644]
最近のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙な手がかりのマイニングに重点を置いている。
本稿では,PhysFormerとPhys++++をベースとした2つのエンドツーエンドビデオ変換器を提案する。
4つのベンチマークデータセットで総合的な実験を行い、時間内テストとクロスデータセットテストの両方において優れた性能を示す。
論文 参考訳(メタデータ) (2023-02-07T15:56:03Z) - MixSTE: Seq2seq Mixed Spatio-Temporal Encoder for 3D Human Pose
Estimation in Video [75.23812405203778]
近年, 学習時間相関のため, 全フレームのボディジョイントを世界規模で考慮し, 2次元キーポイントシーケンスから3次元人間のポーズを推定する手法が提案されている。
本研究では,各関節の時間的動きを別々にモデル化する時間的変圧器ブロックと,関節間空間相関を有する変圧器ブロックを有するミキシングミキシングを提案する。
さらに、ネットワーク出力は、中央フレームから入力ビデオの全フレームに拡張され、入力と出力のベンチマーク間のコヒーレンスが改善される。
論文 参考訳(メタデータ) (2022-03-02T04:20:59Z) - PhysFormer: Facial Video-based Physiological Measurement with Temporal
Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。
本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文 参考訳(メタデータ) (2021-11-23T18:57:11Z) - Video-based Remote Physiological Measurement via Cross-verified Feature
Disentangling [121.50704279659253]
非生理的表現と生理的特徴を混同するための横断的特徴分離戦略を提案する。
次に, 蒸留された生理特性を用いて, 頑健なマルチタスク生理測定を行った。
歪んだ特徴は、最終的に平均HR値やr信号のような複数の生理的信号の合同予測に使用される。
論文 参考訳(メタデータ) (2020-07-16T09:39:17Z) - AutoHR: A Strong End-to-end Baseline for Remote Heart Rate Measurement
with Neural Searching [76.4844593082362]
既存のエンド・ツー・エンドのネットワークが難易度が低い理由を考察し,アーキテクチャ・サーチ(NAS)を用いたリモートHR計測のための強力なベースラインを確立する。
総合的な実験は、時間内テストとクロスデータセットテストの両方で3つのベンチマークデータセットで実施される。
論文 参考訳(メタデータ) (2020-04-26T05:43:21Z) - FPCR-Net: Feature Pyramidal Correlation and Residual Reconstruction for
Optical Flow Estimation [72.41370576242116]
フレーム対からの光フロー推定のための半教師付き特徴ピラミッド相関・残留再構成ネットワーク(FPCR-Net)を提案する。
ピラミッド相関マッピングと残留再構成の2つの主要なモジュールで構成されている。
実験結果から,提案手法は,平均終点誤差 (AEE) に対して0.80, 1.15, 0.10の改善を達成し,最先端性能を実現していることがわかった。
論文 参考訳(メタデータ) (2020-01-17T07:13:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。