論文の概要: A Plug-and-Play Temporal Normalization Module for Robust Remote Photoplethysmography
- arxiv url: http://arxiv.org/abs/2411.15283v1
- Date: Fri, 22 Nov 2024 16:32:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:19:16.300763
- Title: A Plug-and-Play Temporal Normalization Module for Robust Remote Photoplethysmography
- Title(参考訳): ロバストなリモート光胸腺撮影のためのプラグイン・アンド・プレイ時正規化モジュール
- Authors: Kegang Wang, Jiankai Tang, Yantao Wei, Mingxuan Liu, Xin Liu, Yuntao Wang,
- Abstract要約: リモート光胸腺撮影(r)は、顔ビデオの微妙な色変化からPSG信号を抽出する。
ほとんどの r 法は連続するフレーム間の強度差に依存しており、動きや照明によって影響される長期的な信号の変化が欠けている。
本稿では、任意のエンドツーエンドのrネットワークアーキテクチャを持つフレキシブルなプラグアンドプレイモジュールであるテンポラル正規化(TN)を紹介する。
- 参考スコア(独自算出の注目度): 8.164518942155246
- License:
- Abstract: Remote photoplethysmography (rPPG) extracts PPG signals from subtle color changes in facial videos, showing strong potential for health applications. However, most rPPG methods rely on intensity differences between consecutive frames, missing long-term signal variations affected by motion or lighting artifacts, which reduces accuracy. This paper introduces Temporal Normalization (TN), a flexible plug-and-play module compatible with any end-to-end rPPG network architecture. By capturing long-term temporally normalized features following detrending, TN effectively mitigates motion and lighting artifacts, significantly boosting the rPPG prediction performance. When integrated into four state-of-the-art rPPG methods, TN delivered performance improvements ranging from 34.3% to 94.2% in heart rate measurement tasks across four widely-used datasets. Notably, TN showed even greater performance gains in smaller models. We further discuss and provide insights into the mechanisms behind TN's effectiveness.
- Abstract(参考訳): リモート光胸腺造影(rPPG)は、顔ビデオの微妙な色変化からPGG信号を抽出し、健康的応用の可能性を示す。
しかし、ほとんどのrPPG法は連続するフレーム間の強度差に依存しており、動きや照明のアーチファクトの影響を受けないため、精度が低下する。
本稿では,任意のエンド・ツー・エンドのrPPGネットワークアーキテクチャと互換性のある,フレキシブルなプラグイン・アンド・プレイモジュールであるテンポラル正規化(TN)を紹介する。
伸縮後の長期の時間的正規化特徴を捕捉することにより、TNは運動や照明のアーチファクトを効果的に緩和し、rPPG予測性能を大幅に向上させる。
4つの最先端のrPPGメソッドに統合されると、TNは4つの広く使用されているデータセットで34.3%から94.2%の心拍測定タスクに性能改善を施した。
特に、TNはより小さなモデルでさらにパフォーマンスが向上した。
さらに,TNの有効性の背景にあるメカニズムについて考察し,考察する。
関連論文リスト
- RhythmFormer: Extracting rPPG Signals Based on Hierarchical Temporal
Periodic Transformer [17.751885452773983]
本稿では,r周期性の準周期特性を明示的に活用することにより,r信号の完全エンドツーエンド変換手法を提案する。
融合ステムはr特徴に対する自己注意を効果的に導くために提案され、既存の手法に容易に移行し、その性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2024-02-20T07:56:02Z) - Tiny-PPG: A Lightweight Deep Neural Network for Real-Time Detection of
Motion Artifacts in Photoplethysmogram Signals on Edge Devices [6.352499671581954]
光胸腺X線信号は、現実の環境での動き人工物によって容易に汚染される。
この研究は、IoTデバイス上で正確なリアルタイムPSGアーティファクトセグメンテーションを実現するために、Tiny-edgeと呼ばれる軽量なディープニューラルネットワークを提案した。
Tiny-edgeは、リアルタイムPSGアーティファクト検出のために、STM32組み込みシステムにうまくデプロイされた。
論文 参考訳(メタデータ) (2023-05-05T06:17:57Z) - PhysFormer++: Facial Video-based Physiological Measurement with SlowFast
Temporal Difference Transformer [76.40106756572644]
最近のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙な手がかりのマイニングに重点を置いている。
本稿では,PhysFormerとPhys++++をベースとした2つのエンドツーエンドビデオ変換器を提案する。
4つのベンチマークデータセットで総合的な実験を行い、時間内テストとクロスデータセットテストの両方において優れた性能を示す。
論文 参考訳(メタデータ) (2023-02-07T15:56:03Z) - Learning Motion-Robust Remote Photoplethysmography through Arbitrary
Resolution Videos [31.512551653273373]
実世界の長期健康モニタリングのシナリオでは、参加者と頭の動きの距離は時間によって異なり、その結果、不正確なrの測定結果となる。
本稿では,カメラと参加者の一定距離を設計した従来のRモデルと異なり,PFE (physiological signal feature extract block) とTFA (temporal face alignment block) の2つのプラグ・アンド・プレイブロックを提案する。
論文 参考訳(メタデータ) (2022-11-30T11:50:08Z) - Multi-Head Cross-Attentional PPG and Motion Signal Fusion for Heart Rate
Estimation [2.839269856680851]
本稿では,時間的畳み込みと多頭部交差注意を利用してセンサフュージョンの有効性を向上させる新しい深層学習モデルPULSEを提案する。
3つの公開データセット上でのPULSEの性能を評価し,平均絶対誤差を7.56%削減した。
論文 参考訳(メタデータ) (2022-10-14T08:07:53Z) - FAMLP: A Frequency-Aware MLP-Like Architecture For Domain Generalization [73.41395947275473]
本稿では、変換周波数領域において、ドメイン固有の特徴をフィルタリングする新しい周波数認識アーキテクチャを提案する。
3つのベンチマークの実験では、最先端の手法をそれぞれ3%、4%、9%のマージンで上回った。
論文 参考訳(メタデータ) (2022-03-24T07:26:29Z) - PhysFormer: Facial Video-based Physiological Measurement with Temporal
Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。
本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文 参考訳(メタデータ) (2021-11-23T18:57:11Z) - Multiscale Spatio-Temporal Graph Neural Networks for 3D Skeleton-Based
Motion Prediction [92.16318571149553]
本稿では,次世代の3次元骨格型人間のポーズを予測するため,マルチスケール・テンポラルグラフニューラルネットワーク(MST-GNN)を提案する。
MST-GNNは、短期および長期の動作予測において最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-08-25T14:05:37Z) - TransRPPG: Remote Photoplethysmography Transformer for 3D Mask Face
Presentation Attack Detection [53.98866801690342]
3次元マスク提示攻撃検出(PAD)は、3次元マスク攻撃から顔認識システムを保護する上で重要な役割を担っている。
ライブ本質表現を効率的に学習するための純粋なrトランス(TransR)フレームワークを提案する。
当社のTransRは軽量で効率的(547Kパラメータと763MOPのみ)で、モバイルレベルのアプリケーションに期待できる。
論文 参考訳(メタデータ) (2021-04-15T12:33:13Z) - Non-contact PPG Signal and Heart Rate Estimation with Multi-hierarchical
Convolutional Network [12.119293125608976]
心拍数(HR)は人体の重要な生理的パラメータである。
本研究では,顔ビデオクリップからHRを推定できる,効率的な多階層・畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2021-04-06T03:04:27Z) - Temporal Pyramid Network for Action Recognition [129.12076009042622]
本稿では,2次元あるいは3次元のバックボーンネットワークに柔軟に統合可能な汎用時間ピラミッドネットワーク(TPN)を提案する。
TPNは、いくつかのアクション認識データセット上で、他の困難なベースラインよりも一貫して改善されている。
論文 参考訳(メタデータ) (2020-04-07T17:17:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。