論文の概要: StreamPPG: Low-Latency rPPG Estimation via Consistent Privileged Learning
- arxiv url: http://arxiv.org/abs/2606.23186v1
- Date: Mon, 22 Jun 2026 11:31:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 23:34:39.013782
- Title: StreamPPG: Low-Latency rPPG Estimation via Consistent Privileged Learning
- Title(参考訳): StreamPPG: Consistent Privileged Learningによる低レイテンシrPPG推定
- Authors: Yiming Li, Yihan Yang, Yuguang Chu, Yuanhui Hu, Si-Yuan Cao, Xiaohan Zhang, Xiaokai Bai, Zhe Wu, Hui-Liang Shen,
- Abstract要約: リモート光胸腺造影(胸腔鏡)は、顔画像から血液量パルス(BVP)信号を推定し、接触のない健康モニタリングを可能にする。
ビデオクリップを入力として使用する従来のクリップワイドアプローチでは、推論を導入する前に100フレーム以上をキャプチャする必要がある。
本稿では,低レイテンシなフレーム単位の生理学的信号推定を可能にする統一アーキテクチャであるStreamを提案する。
- 参考スコア(独自算出の注目度): 24.385061454563836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote photoplethysmography (rPPG) estimates the blood volume pulse (BVP) signal from facial videos, enabling contact-free health monitoring. Conventional clip-wise approaches, which use video clips as input, require capturing over one hundred frames before inference, thus introducing several seconds of delay and hindering real-time use. Meanwhile, frame-wise approaches struggle to capture long-range temporal and periodic features of physiological rhythms, and therefore lead to reduced estimation accuracy. To overcome these issues, we propose StreamPPG, a unified architecture that enables low-latency frame-wise physiological signal estimation while achieving competitive accuracy compared with clip-wise approaches. StreamPPG is trained under a consistent privileged learning (CPL) strategy, which leverages ground-truth rPPG signals as privileged information to enhance the model's representation capability. Extensive experiments demonstrate that StreamPPG achieves state-of-the-art accuracy across multiple datasets while maintaining real-time throughput on edge devices.
- Abstract(参考訳): RPPG(Remote Photoplethysmography)は、顔画像から血液量パルス(BVP)信号を推定し、接触のない健康モニタリングを可能にする。
ビデオクリップを入力として使用する従来のクリップワイドアプローチでは、推論の前に100フレーム以上をキャプチャする必要があるため、数秒の遅延が発生し、リアルタイムの使用を妨げている。
一方、フレームワイズアプローチは、生理的リズムの長距離時間的特徴と周期的特徴を捉えるのに苦労し、したがって推定精度を低下させる。
本稿では,低レイテンシのフレームワイド生理学的信号推定が可能な統一アーキテクチャであるStreamPPGを提案する。
StreamPPGは、一貫した特権学習(CPL)戦略の下で訓練されており、この戦略は、モデル表現能力を高めるための特権情報として、地道なrPPG信号を利用する。
大規模な実験では、StreamPPGがエッジデバイス上でリアルタイムスループットを維持しながら、複数のデータセットにわたる最先端の精度を実現している。
関連論文リスト
- FCUS-rPPG: A Fast-Converging Unsupervised Framework for Remote Photoplethysmography via Gradient Oscillation Suppression [19.91628990903841]
Photoplethysmography (rmography) は、一般向けカメラを用いた非接触血液量パルス(BVP)信号の抽出を可能にする。
FCUS-r は強力な一般化能力を持つ高速収束型教師なし r フレームワークである。
FCUS-rは、クロスデータセット性能の最先端評価を一貫して達成する。
論文 参考訳(メタデータ) (2026-06-02T02:33:27Z) - Persistent Visual Memory: Sustaining Perception for Deep Generation in LVLMs [66.15429821530503]
Persistent Visual Memoryは、ビジュアルエビデンスへの持続的でオンデマンドアクセスを強化するために設計された、軽量の学習可能なモジュールである。
Qwen3-VLモデルの実験は、PVMが無視可能なパラメータオーバーヘッドで顕著な改善をもたらすことを示した。
詳細な分析により、PVMはより長い世代で堅牢性が向上し、内部予測収束が加速することが明らかとなった。
論文 参考訳(メタデータ) (2026-05-01T17:54:37Z) - Towards Athlete Fatigue Assessment from Association Football Videos [53.20057980542362]
本稿では,ピッチ座標における選手軌跡を抽出する最先端のゲーム状態再構成手法を構築した。
次に,これらの信号から加速度-速度プロファイルを構築し,その挙動を疲労関連性能指標として解析する。
以上の結果から,単眼映像は,A-S時間と相性のあるキネマティックなパターンを回復すると同時に,トラジェクティブノイズ,校正誤差,放送映像固有の時間的不連続性に敏感であることが明らかとなった。
論文 参考訳(メタデータ) (2026-04-07T09:36:28Z) - Video Depth Propagation [54.523028170425256]
既存の手法は単純なフレーム・バイ・フレームの単分子モデルに依存しており、時間的矛盾と不正確な結果をもたらす。
本稿では,オンラインビデオパイプラインを効果的に活用し,深い特徴伝達を行うVeloDepthを提案する。
構造的に時間的整合性を強制し, 連続するフレーム間に安定した深さ予測を行い, 効率を向上する。
論文 参考訳(メタデータ) (2025-12-11T15:08:37Z) - Reperio-rPPG: Relational Temporal Graph Neural Networks for Periodicity Learning in Remote Physiological Measurement [0.0]
リモート光麻痺(英: Remote Photoplethys)は、顔画像の微妙な色の変化を利用して、心拍数や呼吸速度などの重要な兆候を推定する、新たな生理的センシング技術である。
この非侵襲的手法は様々な領域で普及しているが、現実世界の条件下での微細な時間的ダイナミクスを捉える能力は過小評価されている。
周期構造を効果的に捉えるためにトランスフォーマーを戦略的に統合する新しいフレームワークであるGraph Reperio-rを提案する。
論文 参考訳(メタデータ) (2025-11-08T09:41:34Z) - Towards Accurate Heart Rate Measurement from Ultra-Short Video Clips via Periodicity-Guided rPPG Estimation and Signal Reconstruction [8.153034573979857]
我々は,2つの課題に対処することにより,超短2秒ビデオクリップからHRを正確に測定することを目指している。
まず,超短ビデオクリップにおける心拍周期の制限を克服するために,実効周期性誘導r推定法を提案する。
第二に、スペクトルリークによる不正確性を軽減するため、より長いr信号の再構成を行うジェネレータを提案する。
論文 参考訳(メタデータ) (2025-06-27T10:05:00Z) - Periodic-MAE: Periodic Video Masked Autoencoder for rPPG Estimation [6.32655874508904]
本研究では,肌の色調の微妙な変化を経時的に捉え,顔画像から周期的な信号の一般的な表現を学習する手法を提案する。
提案手法をPURE, U-BFCr, MMPD, V-BFC4Vデータセット上で評価した。
その結果,特にクロスデータセット評価の課題において,大幅な性能向上が見られた。
論文 参考訳(メタデータ) (2025-06-27T02:18:10Z) - Recovering Pulse Waves from Video Using Deep Unrolling and Deep Equilibrium Models [45.94962431110573]
カメラによるバイタルサインのモニタリング、つまりイメージング光胸腺撮影(i)は、運転監視、情動コンピューティングなどに応用されている。
本稿では,逆問題における信号処理と深層学習を組み合わせた手法を提案する。
論文 参考訳(メタデータ) (2025-03-21T16:11:21Z) - No-frills Temporal Video Grounding: Multi-Scale Neighboring Attention
and Zoom-in Boundary Detection [52.03562682785128]
時間的ビデオグラウンドティングは、未編集のビデオから言語クエリの時間間隔を取得することを目的としている。
テレビGにおける重要な課題は、低SNR(Semantic Noise Ratio)による低SNRの性能低下である。
本稿では,2つのコアモジュールからなる非フリーズTVGモデルを提案する。
論文 参考訳(メタデータ) (2023-07-20T04:12:10Z) - WPPG Net: A Non-contact Video Based Heart Rate Extraction Network
Framework with Compatible Training Capability [21.33542693986985]
顔の皮膚には、リモートフォトプレシー(r)信号と呼ばれる微妙な色の変化があり、そこから被験者の心拍数を抽出できる。
近年,r信号抽出に関する多くの深層学習手法と関連するデータセットが提案されている。
しかしながら,BVP信号などのラベル波は,我々の体内を流れる時間と他の要因により,実際のr信号に不確実な遅延がある。
本稿では、r信号とラベル波のリズムと周期性に関する共通特性を解析することにより、これらのネットワークを包み、トレーニング時に効率を保ち続けるためのトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-07-04T19:52:30Z) - Intrinsic Temporal Regularization for High-resolution Human Video
Synthesis [59.54483950973432]
時間整合性は、画像処理パイプラインをビデオドメインに拡張する上で重要である。
フレームジェネレーターを介して本質的信頼度マップを推定し,運動推定を調節する,本質的な時間正規化方式を提案する。
我々は、本質的な時間的規制をシングルイメージジェネレータに適用し、強力な「Internet」が512Times512$の人間のアクションビデオを生成します。
論文 参考訳(メタデータ) (2020-12-11T05:29:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。