論文の概要: A Plug-and-Play Temporal Normalization Module for Robust Remote Photoplethysmography
- arxiv url: http://arxiv.org/abs/2411.15283v1
- Date: Fri, 22 Nov 2024 16:32:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-28 17:07:50.346159
- Title: A Plug-and-Play Temporal Normalization Module for Robust Remote Photoplethysmography
- Title(参考訳): ロバストなリモート光胸腺撮影のためのプラグイン・アンド・プレイ時正規化モジュール
- Authors: Kegang Wang, Jiankai Tang, Yantao Wei, Mingxuan Liu, Xin Liu, Yuntao Wang,
- Abstract要約: リモート光胸腺撮影(r)は、顔ビデオの微妙な色変化からPSG信号を抽出する。
ほとんどの r 法は連続するフレーム間の強度差に依存しており、動きや照明によって影響される長期的な信号の変化が欠けている。
本稿では、任意のエンドツーエンドのrネットワークアーキテクチャを持つフレキシブルなプラグアンドプレイモジュールであるテンポラル正規化(TN)を紹介する。
- 参考スコア(独自算出の注目度): 8.164518942155246
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Remote photoplethysmography (rPPG) extracts PPG signals from subtle color changes in facial videos, showing strong potential for health applications. However, most rPPG methods rely on intensity differences between consecutive frames, missing long-term signal variations affected by motion or lighting artifacts, which reduces accuracy. This paper introduces Temporal Normalization (TN), a flexible plug-and-play module compatible with any end-to-end rPPG network architecture. By capturing long-term temporally normalized features following detrending, TN effectively mitigates motion and lighting artifacts, significantly boosting the rPPG prediction performance. When integrated into four state-of-the-art rPPG methods, TN delivered performance improvements ranging from 34.3% to 94.2% in heart rate measurement tasks across four widely-used datasets. Notably, TN showed even greater performance gains in smaller models. We further discuss and provide insights into the mechanisms behind TN's effectiveness.
- Abstract(参考訳): リモート光胸腺造影(rPPG)は、顔ビデオの微妙な色変化からPGG信号を抽出し、健康的応用の可能性を示す。
しかし、ほとんどのrPPG法は連続するフレーム間の強度差に依存しており、動きや照明のアーチファクトの影響を受けないため、精度が低下する。
本稿では,任意のエンド・ツー・エンドのrPPGネットワークアーキテクチャと互換性のある,フレキシブルなプラグイン・アンド・プレイモジュールであるテンポラル正規化(TN)を紹介する。
伸縮後の長期の時間的正規化特徴を捕捉することにより、TNは運動や照明のアーチファクトを効果的に緩和し、rPPG予測性能を大幅に向上させる。
4つの最先端のrPPGメソッドに統合されると、TNは4つの広く使用されているデータセットで34.3%から94.2%の心拍測定タスクに性能改善を施した。
特に、TNはより小さなモデルでさらにパフォーマンスが向上した。
さらに,TNの有効性の背景にあるメカニズムについて考察し,考察する。
関連論文リスト
- Reperio-rPPG: Relational Temporal Graph Neural Networks for Periodicity Learning in Remote Physiological Measurement [0.0]
リモート光麻痺(英: Remote Photoplethys)は、顔画像の微妙な色の変化を利用して、心拍数や呼吸速度などの重要な兆候を推定する、新たな生理的センシング技術である。
この非侵襲的手法は様々な領域で普及しているが、現実世界の条件下での微細な時間的ダイナミクスを捉える能力は過小評価されている。
周期構造を効果的に捉えるためにトランスフォーマーを戦略的に統合する新しいフレームワークであるGraph Reperio-rを提案する。
論文 参考訳(メタデータ) (2025-11-08T09:41:34Z) - A Hybrid Deep Learning Model for Robust Biometric Authentication from Low-Frame-Rate PPG Signals [0.34376560669160394]
光による皮膚の血流量の変化を計測する光胸腺造影(進化)信号は、最近生体認証において注目を集めている。
光胸腺信号の品質は、運動アーティファクト、照明の変化、および物体間の生理的変動によって挑戦される。
本研究では,低フレームレート指先ビデオから抽出したPSG信号に基づいて,軽量で費用対効果の高い生体認証フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-06T04:16:13Z) - RT-DETRv4: Painlessly Furthering Real-Time Object Detection with Vision Foundation Models [48.91205564876609]
軽量物体検出器の高効率化を目的とした,コスト効率・高適合性蒸留フレームワークを提案する。
当社のアプローチは、さまざまなDETRベースのモデルに対して、目立って一貫したパフォーマンス向上を実現しています。
我々の新しいモデルファミリーRT-DETRv4はCOCOの最先端結果を達成し、APスコアは49.7/53.5/55.4/57.0で、対応する速度は273/169/124/78 FPSである。
論文 参考訳(メタデータ) (2025-10-29T08:13:17Z) - PHASE-Net: Physics-Grounded Harmonic Attention System for Efficient Remote Photoplethysmography Measurement [63.007237197267834]
既存のディープラーニング手法は、主に生理学的モニタリングであり、理論的な堅牢性を欠いている。
本研究では,Navier-Stokes方程式のヘモダイナミックスから導かれる物理インフォームド r パラダイムを提案し,パルス信号が2次系に従うことを示す。
これは、時間的円錐ネットワーク(TCN)を使用する理論的正当性を提供する。
Phase-Netは高い効率で最先端のパフォーマンスを実現し、理論上は基礎的でデプロイ可能な r ソリューションを提供する。
論文 参考訳(メタデータ) (2025-09-29T14:36:45Z) - Accelerating 3D Photoacoustic Computed Tomography with End-to-End Physics-Aware Neural Operators [74.65171736966131]
光音響計算トモグラフィ(PACT)は、光コントラストと超音波分解能を組み合わせることで、光拡散限界を超える深部像を実現する。
現在の実装では、高密度トランスデューサアレイと長い取得時間を必要とし、臨床翻訳を制限している。
本研究では,センサ計測からボリューム再構成まで,逆音響マッピングを直接学習する物理認識モデルであるPanoを紹介する。
論文 参考訳(メタデータ) (2025-09-11T23:12:55Z) - FE-UNet: Frequency Domain Enhanced U-Net with Segment Anything Capability for Versatile Image Segmentation [50.9040167152168]
CNNのコントラスト感度関数を実験的に定量化し,人間の視覚システムと比較した。
本稿ではウェーブレット誘導分光ポーリングモジュール(WSPM)を提案する。
人間の視覚系をさらにエミュレートするために、周波数領域拡張受容野ブロック(FE-RFB)を導入する。
本研究では,SAM2 をバックボーンとし,Hiera-Large を事前学習ブロックとして組み込んだ FE-UNet を開発した。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - Synthesizing Late-Stage Contrast Enhancement in Breast MRI: A Comprehensive Pipeline Leveraging Temporal Contrast Enhancement Dynamics [0.3499870393443268]
本研究では,後期DCE-MRI画像の初期段階データから合成するためのパイプラインを提案する。
提案手法では, コントラストエージェントの時間的挙動を利用して生成モデルの訓練を指導する, 新たな損失関数である時間強度損失(TI-loss)を導入する。
アノテーション付き領域における拡張パターンを検証するContrast Agent Pattern Score(mathcalCP_s$)と、実際の拡張と生成された拡張の違いを測定するAverage difference in Enhancement(mathcalED$)の2つの指標が画像品質を評価するために提案されている。
論文 参考訳(メタデータ) (2024-09-03T04:31:49Z) - RhythmFormer: Extracting rPPG Signals Based on Hierarchical Temporal
Periodic Transformer [17.751885452773983]
本稿では,r周期性の準周期特性を明示的に活用することにより,r信号の完全エンドツーエンド変換手法を提案する。
融合ステムはr特徴に対する自己注意を効果的に導くために提案され、既存の手法に容易に移行し、その性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2024-02-20T07:56:02Z) - Tiny-PPG: A Lightweight Deep Neural Network for Real-Time Detection of
Motion Artifacts in Photoplethysmogram Signals on Edge Devices [6.352499671581954]
光胸腺X線信号は、現実の環境での動き人工物によって容易に汚染される。
この研究は、IoTデバイス上で正確なリアルタイムPSGアーティファクトセグメンテーションを実現するために、Tiny-edgeと呼ばれる軽量なディープニューラルネットワークを提案した。
Tiny-edgeは、リアルタイムPSGアーティファクト検出のために、STM32組み込みシステムにうまくデプロイされた。
論文 参考訳(メタデータ) (2023-05-05T06:17:57Z) - PhysFormer++: Facial Video-based Physiological Measurement with SlowFast
Temporal Difference Transformer [76.40106756572644]
最近のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙な手がかりのマイニングに重点を置いている。
本稿では,PhysFormerとPhys++++をベースとした2つのエンドツーエンドビデオ変換器を提案する。
4つのベンチマークデータセットで総合的な実験を行い、時間内テストとクロスデータセットテストの両方において優れた性能を示す。
論文 参考訳(メタデータ) (2023-02-07T15:56:03Z) - Learning Motion-Robust Remote Photoplethysmography through Arbitrary
Resolution Videos [31.512551653273373]
実世界の長期健康モニタリングのシナリオでは、参加者と頭の動きの距離は時間によって異なり、その結果、不正確なrの測定結果となる。
本稿では,カメラと参加者の一定距離を設計した従来のRモデルと異なり,PFE (physiological signal feature extract block) とTFA (temporal face alignment block) の2つのプラグ・アンド・プレイブロックを提案する。
論文 参考訳(メタデータ) (2022-11-30T11:50:08Z) - Multi-Head Cross-Attentional PPG and Motion Signal Fusion for Heart Rate
Estimation [2.839269856680851]
本稿では,時間的畳み込みと多頭部交差注意を利用してセンサフュージョンの有効性を向上させる新しい深層学習モデルPULSEを提案する。
3つの公開データセット上でのPULSEの性能を評価し,平均絶対誤差を7.56%削減した。
論文 参考訳(メタデータ) (2022-10-14T08:07:53Z) - FAMLP: A Frequency-Aware MLP-Like Architecture For Domain Generalization [73.41395947275473]
本稿では、変換周波数領域において、ドメイン固有の特徴をフィルタリングする新しい周波数認識アーキテクチャを提案する。
3つのベンチマークの実験では、最先端の手法をそれぞれ3%、4%、9%のマージンで上回った。
論文 参考訳(メタデータ) (2022-03-24T07:26:29Z) - PhysFormer: Facial Video-based Physiological Measurement with Temporal
Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。
本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文 参考訳(メタデータ) (2021-11-23T18:57:11Z) - Multiscale Spatio-Temporal Graph Neural Networks for 3D Skeleton-Based
Motion Prediction [92.16318571149553]
本稿では,次世代の3次元骨格型人間のポーズを予測するため,マルチスケール・テンポラルグラフニューラルネットワーク(MST-GNN)を提案する。
MST-GNNは、短期および長期の動作予測において最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-08-25T14:05:37Z) - TransRPPG: Remote Photoplethysmography Transformer for 3D Mask Face
Presentation Attack Detection [53.98866801690342]
3次元マスク提示攻撃検出(PAD)は、3次元マスク攻撃から顔認識システムを保護する上で重要な役割を担っている。
ライブ本質表現を効率的に学習するための純粋なrトランス(TransR)フレームワークを提案する。
当社のTransRは軽量で効率的(547Kパラメータと763MOPのみ)で、モバイルレベルのアプリケーションに期待できる。
論文 参考訳(メタデータ) (2021-04-15T12:33:13Z) - Non-contact PPG Signal and Heart Rate Estimation with Multi-hierarchical
Convolutional Network [12.119293125608976]
心拍数(HR)は人体の重要な生理的パラメータである。
本研究では,顔ビデオクリップからHRを推定できる,効率的な多階層・畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2021-04-06T03:04:27Z) - Temporal Pyramid Network for Action Recognition [129.12076009042622]
本稿では,2次元あるいは3次元のバックボーンネットワークに柔軟に統合可能な汎用時間ピラミッドネットワーク(TPN)を提案する。
TPNは、いくつかのアクション認識データセット上で、他の困難なベースラインよりも一貫して改善されている。
論文 参考訳(メタデータ) (2020-04-07T17:17:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。