論文の概要: BeatFormer: Efficient motion-robust remote heart rate estimation through unsupervised spectral zoomed attention filters
- arxiv url: http://arxiv.org/abs/2507.14885v1
- Date: Sun, 20 Jul 2025 10:00:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.105293
- Title: BeatFormer: Efficient motion-robust remote heart rate estimation through unsupervised spectral zoomed attention filters
- Title(参考訳): BeatFormer: 教師なしスペクトルズームアテンションフィルタによる高能率モーションロバスト遠隔心拍数推定
- Authors: Joaquim Comas, Federico Sukno,
- Abstract要約: Photoplethysmography (r)は、ズームしたビデオから心臓の信号を捉え、その多様な応用に注目されている。
ディープラーニングはr推定が進んだが、効率的な一般化のためには大規模で多様なデータセットに依存している。
本稿では、R推定のための軽量スペクトルアテンションモデルであるBeatFormerについて述べる。
我々はまた、BeatFormerをPDGやHRラベルなしでトレーニングできるスペクトルコントラスト学習(SCL)も導入した。
- 参考スコア(独自算出の注目度): 3.069335774032178
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Remote photoplethysmography (rPPG) captures cardiac signals from facial videos and is gaining attention for its diverse applications. While deep learning has advanced rPPG estimation, it relies on large, diverse datasets for effective generalization. In contrast, handcrafted methods utilize physiological priors for better generalization in unseen scenarios like motion while maintaining computational efficiency. However, their linear assumptions limit performance in complex conditions, where deep learning provides superior pulsatile information extraction. This highlights the need for hybrid approaches that combine the strengths of both methods. To address this, we present BeatFormer, a lightweight spectral attention model for rPPG estimation, which integrates zoomed orthonormal complex attention and frequency-domain energy measurement, enabling a highly efficient model. Additionally, we introduce Spectral Contrastive Learning (SCL), which allows BeatFormer to be trained without any PPG or HR labels. We validate BeatFormer on the PURE, UBFC-rPPG, and MMPD datasets, demonstrating its robustness and performance, particularly in cross-dataset evaluations under motion scenarios.
- Abstract(参考訳): リモート光胸腺撮影(rPPG)は、顔画像から心臓の信号を捉え、その多様な応用に注目されている。
ディープラーニングはrPPG推定を進歩させたが、効率的な一般化のためには大規模で多様なデータセットに依存している。
対照的に、手作りの手法は、計算効率を保ちながら、動きのような目に見えないシナリオにおいて、より一般化するために生理的先行性を利用する。
しかし、それらの線形仮定は、深層学習が優れた脈動情報抽出を提供する複雑な条件での性能を制限する。
このことは、両方の方法の長所を組み合わせたハイブリッドアプローチの必要性を強調している。
そこで本稿では,RPPG推定のための軽量スペクトルアテンションモデルであるBeatFormerについて述べる。
さらに、BeatFormerがPSGやHRのラベルを使わずにトレーニングできるSpectral Contrastive Learning (SCL)を導入する。
本研究では, PURE, UBFC-rPPG, MMPDデータセット上でBeatFormerを検証し, その堅牢性と性能, 特に動作シナリオ下でのクロスデータセット評価について検証した。
関連論文リスト
- Towards Anomaly-Aware Pre-Training and Fine-Tuning for Graph Anomaly Detection [59.042018542376596]
グラフ異常検出(GAD)は近年注目度が高まりつつあるが、2つの重要な要因があるため、依然として困難である。
Anomaly-Aware Pre-Training and Fine-Tuning (APF)は、GADの課題を軽減するためのフレームワークである。
10のベンチマークデータセットに関する総合的な実験は、最先端のベースラインと比較してAPFの優れたパフォーマンスを検証する。
論文 参考訳(メタデータ) (2025-04-19T09:57:35Z) - Recovering Pulse Waves from Video Using Deep Unrolling and Deep Equilibrium Models [45.94962431110573]
カメラによるバイタルサインのモニタリング、つまりイメージング光胸腺撮影(i)は、運転監視、情動コンピューティングなどに応用されている。
本稿では,逆問題における信号処理と深層学習を組み合わせた手法を提案する。
論文 参考訳(メタデータ) (2025-03-21T16:11:21Z) - Toward Motion Robustness: A masked attention regularization framework in remote photoplethysmography [5.743550396843244]
MAR-rはROIローカライゼーションと複雑なモーションアーティファクトの影響を統合するフレームワークである。
MAR-rは、顔クリップのセマンティック一貫性を捉えるために、マスクされた注意規則化機構をrフィールドに採用している。
また、モデルが不正確なROIに過度に適合し、その後パフォーマンスが低下するのを防ぐために、マスキング技術を採用している。
論文 参考訳(メタデータ) (2024-07-09T08:25:30Z) - Deep adaptative spectral zoom for improved remote heart rate estimation [10.220888127527152]
Chirp-Z Transform (CZT) は、心拍数に対する狭帯域の利息の範囲までスペクトルを洗練させ、頻繁な分解能を改善し、その結果より正確な推定を可能にする。
本稿では、リモートHR推定にCZTを用いる利点を示し、新しいデータ駆動適応型CZT推定器を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:55:19Z) - RhythmFormer: Extracting Patterned rPPG Signals based on Periodic Sparse Attention [18.412642801957197]
RRhythmは、生理学的ビデオに基づいて生理的信号を検出する非接触法である。
本稿では,周期性によって誘発される時間的注意間隔に基づく周期的注意機構を提案する。
これは、データ内およびデータ間評価の両方において最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-02-20T07:56:02Z) - rPPG-MAE: Self-supervised Pre-training with Masked Autoencoders for
Remote Physiological Measurement [36.54109704201048]
リモート光胸腺撮影(r-MAE)はヒトのバイタルサインを知覚する重要な技術である。
本稿では,生理的信号に先行する自己相似性を抽出する自己教師型フレームワークを開発する。
また,提案手法をPUREとUBFC-rという2つの公開データセット上で評価した。
論文 参考訳(メタデータ) (2023-06-04T08:53:28Z) - PhysFormer++: Facial Video-based Physiological Measurement with SlowFast
Temporal Difference Transformer [76.40106756572644]
最近のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙な手がかりのマイニングに重点を置いている。
本稿では,PhysFormerとPhys++++をベースとした2つのエンドツーエンドビデオ変換器を提案する。
4つのベンチマークデータセットで総合的な実験を行い、時間内テストとクロスデータセットテストの両方において優れた性能を示す。
論文 参考訳(メタデータ) (2023-02-07T15:56:03Z) - Diffusion Probabilistic Model Made Slim [128.2227518929644]
軽量画像合成のためのスリム拡散確率モデル(DPM)のカスタマイズ設計を提案する。
一連の条件および非条件画像生成タスクにおける遅延拡散モデルと比較して,計算複雑性を8-18倍に削減する。
論文 参考訳(メタデータ) (2022-11-27T16:27:28Z) - PhysFormer: Facial Video-based Physiological Measurement with Temporal
Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。
本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文 参考訳(メタデータ) (2021-11-23T18:57:11Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - AutoHR: A Strong End-to-end Baseline for Remote Heart Rate Measurement
with Neural Searching [76.4844593082362]
既存のエンド・ツー・エンドのネットワークが難易度が低い理由を考察し,アーキテクチャ・サーチ(NAS)を用いたリモートHR計測のための強力なベースラインを確立する。
総合的な実験は、時間内テストとクロスデータセットテストの両方で3つのベンチマークデータセットで実施される。
論文 参考訳(メタデータ) (2020-04-26T05:43:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。