論文の概要: TYrPPG: Uncomplicated and Enhanced Learning Capability rPPG for Remote Heart Rate Estimation
- arxiv url: http://arxiv.org/abs/2511.05833v1
- Date: Sat, 08 Nov 2025 03:46:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.607006
- Title: TYrPPG: Uncomplicated and Enhanced Learning Capability rPPG for Remote Heart Rate Estimation
- Title(参考訳): TYrPPG:遠隔心拍推定のための複雑で拡張された学習能力rPPG
- Authors: Taixi Chen, Yiu-ming Cheung,
- Abstract要約: 本稿では,効率的なRGBビデオのための革新的なビデオ理解ブロック(GVB)を提案する。
Mamの構造に基づいて、2D-CNNと3D-CNNを統合し、分析のためのビデオ理解を強化する。
実験により、我々のTYrは一般的に使用されるデータセットで最先端のパフォーマンスを達成できることが示された。
- 参考スコア(独自算出の注目度): 51.56484100374058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote photoplethysmography (rPPG) can remotely extract physiological signals from RGB video, which has many advantages in detecting heart rate, such as low cost and no invasion to patients. The existing rPPG model is usually based on the transformer module, which has low computation efficiency. Recently, the Mamba model has garnered increasing attention due to its efficient performance in natural language processing tasks, demonstrating potential as a substitute for transformer-based algorithms. However, the Mambaout model and its variants prove that the SSM module, which is the core component of the Mamba model, is unnecessary for the vision task. Therefore, we hope to prove the feasibility of using the Mambaout-based module to remotely learn the heart rate. Specifically, we propose a novel rPPG algorithm called uncomplicated and enhanced learning capability rPPG (TYrPPG). This paper introduces an innovative gated video understanding block (GVB) designed for efficient analysis of RGB videos. Based on the Mambaout structure, this block integrates 2D-CNN and 3D-CNN to enhance video understanding for analysis. In addition, we propose a comprehensive supervised loss function (CSL) to improve the model's learning capability, along with its weakly supervised variants. The experiments show that our TYrPPG can achieve state-of-the-art performance in commonly used datasets, indicating its prospects and superiority in remote heart rate estimation. The source code is available at https://github.com/Taixi-CHEN/TYrPPG.
- Abstract(参考訳): リモート光胸腺撮影(rPPG)は、RGBビデオから遠隔で生理的信号を抽出することができる。
既存のrPPGモデルは通常、計算効率の低いトランスモジュールに基づいている。
近年,自然言語処理タスクの効率が向上し,変換アルゴリズムの代替としての可能性を示すため,Mambaモデルに注目が集まっている。
しかし、Mambaoutモデルとその変種は、MambaモデルのコアコンポーネントであるSSMモジュールがビジョンタスクには不要であることを証明している。
そこで我々は,Mambaout ベースのモジュールを用いて遠隔で心拍数を学習できることの可能性を実証したい。
具体的には、複雑で拡張された学習能力を持つ rPPG (TYrPPG) と呼ばれる新しい rPPG アルゴリズムを提案する。
本稿では、RGBビデオの効率的な解析を目的とした革新的なゲート付きビデオ理解ブロック(GVB)を提案する。
Mambaoutの構造に基づいて、2D-CNNと3D-CNNを統合し、分析のためのビデオ理解を強化する。
さらに,モデルの学習能力を向上させるための包括的教師付き損失関数 (CSL) と,その弱教師付き変種を提案する。
実験の結果,我々のTYrPPGは一般的に使用されているデータセットで最先端のパフォーマンスを達成でき,遠隔心拍数推定におけるその可能性と優位性を示している。
ソースコードはhttps://github.com/Taixi-CHEN/TYrPPGで入手できる。
関連論文リスト
- Robust and Generalizable Heart Rate Estimation via Deep Learning for Remote Photoplethysmography in Complex Scenarios [7.2297623319815845]
非リモート光合成技術は、顔ビデオからの心拍測定を可能にする。
既存のネットワークモデルは、アクアリアシー、堅牢性、一般化能力の課題に直面している。
本稿では,3次元畳み込みニューラルネットワークを用いたエンドツーエンドのr抽出ネットワークを提案する。
論文 参考訳(メタデータ) (2025-07-10T14:23:11Z) - VidFormer: A novel end-to-end framework fused by 3DCNN and Transformer for Video-based Remote Physiological Measurement [9.605944796068046]
本稿では、畳み込みネットワーク(CNN)とrタスクのモデルを統合する新しいフレームワークであるVidFormerを紹介する。
5つの公開データセットに対する評価は、VidFormerが現在のSOTA(State-of-the-art)メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2025-01-03T08:18:08Z) - Continual Learning for Remote Physiological Measurement: Minimize Forgetting and Simplify Inference [4.913049603343811]
既存のr測定手法は、しばしば漸進的な学習シナリオを見落としている。
既存のクラスインクリメンタルな学習アプローチはr測定には適していない。
r測定のための連続学習に取り組むためにADDPという新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-19T01:49:09Z) - RhythmMamba: Fast, Lightweight, and Accurate Remote Physiological Measurement [10.132660483466239]
光プリズムグラフィー(英: Photoplethhysmography)は、生理学的ビデオからの信号の非測定方法である。
我々は、長距離遷移をキャプチャする状態空間モデルに基づくRhythmMambaを紹介する。
実験の結果、RhythmMambaは319%と23%のピークGPUメモリでステートフォワードのパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-04-09T17:34:19Z) - Progressive Fourier Neural Representation for Sequential Video
Compilation [75.43041679717376]
連続学習によって動機づけられたこの研究は、シーケンシャルエンコーディングセッションを通じて、複数の複雑なビデオデータに対して、ニューラル暗黙表現を蓄積し、転送する方法を研究する。
本稿では,FFNR(Progressive Fourier Neural Representation)という,FFNR(Progressive Fourier Neural Representation)という,FFNR(Progressive Fourier Neural Representation)という手法を提案する。
我々は,UVG8/17とDAVIS50のビデオシーケンスベンチマークでPFNR法を検証し,強力な連続学習ベースラインよりも優れた性能向上を実現した。
論文 参考訳(メタデータ) (2023-06-20T06:02:19Z) - PhysFormer: Facial Video-based Physiological Measurement with Temporal
Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。
本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文 参考訳(メタデータ) (2021-11-23T18:57:11Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。