論文の概要: FCUS-rPPG: A Fast-Converging Unsupervised Framework for Remote Photoplethysmography via Gradient Oscillation Suppression
- arxiv url: http://arxiv.org/abs/2606.03050v1
- Date: Tue, 02 Jun 2026 02:33:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.702088
- Title: FCUS-rPPG: A Fast-Converging Unsupervised Framework for Remote Photoplethysmography via Gradient Oscillation Suppression
- Title(参考訳): FCUS-rPPG : 勾配振動抑制による遠隔光胸腺撮影のための高速収束型教師なしフレームワーク
- Authors: Jiajie Li, Yu Liu, Rencheng Song, Xun Chen, Juan Cheng,
- Abstract要約: Photoplethysmography (rmography) は、一般向けカメラを用いた非接触血液量パルス(BVP)信号の抽出を可能にする。
FCUS-r は強力な一般化能力を持つ高速収束型教師なし r フレームワークである。
FCUS-rは、クロスデータセット性能の最先端評価を一貫して達成する。
- 参考スコア(独自算出の注目度): 19.91628990903841
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote photoplethysmography (rPPG) enables non-contact extraction of blood volume pulse (BVP) signals using consumer-grade cameras. Recent unsupervised rPPG methods learn BVP representations without requiring ground-truth physiological annotations, yet their optimization is often hindered by noisy and unstable gradients, resulting in slow convergence and limited cross-domain generalization. In this paper, we propose FCUS-rPPG, a fast-converging unsupervised rPPG framework with strong generalization capability. Motivated by the observation that BVP representations exhibit both multi-spectral covariation and low-dimensional manifold structure, we design a spectrally shared backbone that facilitates BVP feature disentanglement while improving optimization efficiency. To jointly enhance convergence stability and generalization performance, we further develop a unified optimization framework operating at the gradient, loss-landscape, and feature-representation levels. Specifically, a post-verification masking mechanism filters out misleading gradients according to the weak-amplitude physiological prior of BVP signals; a perturbation-based loss landscape smoothing strategy steers optimization toward more generalizable flat minima; and a noise-aware null-space regularization constrains feature updates to the orthogonal complement of the noise subspace, thereby mitigating noise-induced representation drift. Extensive experiments on five datasets demonstrate that FCUS-rPPG requires only one training epoch, whereas existing methods typically require tens to hundreds of epochs. Notably, FCUS-rPPG consistently achieves state-of-the-art (SOTA) performance in cross-dataset evaluations. This study provides an efficient and robust solution to the real-world deployment of unsupervised rPPG. The source code will be publicly available at https://github.com/JiaJieLee/FCUS-rPPG.
- Abstract(参考訳): RPPG(Remote Photoplethysmography)は、コンシューマグレードのカメラを用いて、血液量パルス(BVP)信号の非接触抽出を可能にする。
近年の教師なし rPPG 法は、基礎構造的な生理的アノテーションを必要とせずに BVP 表現を学習しているが、その最適化はしばしばノイズや不安定な勾配によって妨げられ、収束が遅く、クロスドメインの一般化が制限される。
本稿では,強力な一般化機能を備えた高速収束型教師なしrPPGフレームワークFCUS-rPPGを提案する。
BVP表現が多スペクトル共変と低次元多様体構造の両方を示すという観測に触発され、最適化効率を向上しつつ、BVP特徴の絡み合いを促進するスペクトル共有バックボーンを設計する。
収束安定性と一般化性能を両立させるため, 勾配, ロスランドスケープ, 特徴表現レベルでの統一最適化フレームワークを開発した。
具体的には、BVP信号の弱振幅の生理学的先行による誤解勾配をフィルタし、摂動に基づく損失景観平滑化戦略により、より一般化可能な平坦なミニマに向けて最適化し、ノイズ対応のヌル空間正規化制約により、ノイズサブ空間の直交補体に特徴的更新を施し、ノイズ誘起表現のドリフトを緩和する。
5つのデータセットに対する大規模な実験では、FCUS-rPPGは1つの訓練エポックしか必要とせず、既存の手法では数十から数百エポックを必要とすることが示されている。
特に、FCUS-rPPGは、クロスデータセット評価において、常に最先端(SOTA)性能を達成する。
この研究は、教師なしrPPGの実際の展開に対する効率的で堅牢なソリューションを提供する。
ソースコードはhttps://github.com/JiaJieLee/FCUS-rPPG.comで公開されている。
関連論文リスト
- Improving Visual Representation Alignment Generation with GRPO [51.071351994330605]
拡散変換器は強い画像合成能力を示したが、弱いアライメントのため、列車には非効率である。
本稿では,REPAの静的アライメント損失を生成的表現ポリシー最適化の目的に置き換える,強化に基づく最適化戦略であるVRPOを提案する。
当社のVRPO駆動トレーニングは拡散トランスフォーマーにシームレスに統合され、無視可能なコストを導入し、SiTとDiTアーキテクチャとの完全な互換性を維持します。
論文 参考訳(メタデータ) (2026-05-30T07:21:40Z) - Clipping Bottleneck: Stabilizing RLVR via Stochastic Recovery of Near-Boundary Signals [83.0127582612634]
Near-boundary Rescue (NSR) は最小限のプラグ・アンド・プレイの修正であり、失った信号を回復するために、アウト・オブ・バウンドトークンを保持する。
NSRはトレーニングの安定性を大幅に改善し、DAPOやGSPOといった強力なベースライン上で一貫したゲインを提供する。
論文 参考訳(メタデータ) (2026-05-21T16:45:31Z) - HIR-ALIGN: Enhancing Hyperspectral Image Restoration via Diffusion-Based Data Generation [50.46910397782266]
ハイパスペクトル画像(HSI)の復元は、ノイズ、ぼかし、分解能損失などの劣化に悩まされるため、信頼性の高い解析に不可欠である。
本稿では,HIR-ALIGNを提案する。HIR-ALIGNは,限られたトレーニング画像と,ターゲット分布と密に一致した合成データとを付加して,ハイパースペクトル画像の復元を促進するための,プラグアンドプレイのターゲット適応型拡張フレームワークである。
論文 参考訳(メタデータ) (2026-05-13T14:14:13Z) - Intervention-Based Self-Supervised Learning: A Causal Probe Paradigm for Remote Photoplethysmography [38.62089038790769]
新たなSSLパラダイムであるCausal Probing(PCP)を提案する。
PCPは潜伏rシグナルを基礎となる物理的ソースとして扱い、結果として生じるピクセルの色の変化を視覚的表現として扱う。
我々のエディタは、VIPL-HRやMMPD-HRといった挑戦的なデータセット上で、ドメイン内およびクロスドメインのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-04-26T09:56:09Z) - Enhancing Gradient Inversion Attacks in Federated Learning via Hierarchical Feature Optimization [56.95448807869383]
フェデレートラーニング(FL)は、プライバシを保存する分散機械学習の魅力的なパラダイムとして登場した。
近年の研究では、FLシステムで交換される勾配もプライバシー漏洩に弱いことが報告されている。
我々は textbfGradient textbfInversion over textbfFeature textbfDomains (GIFD) を提案する。
論文 参考訳(メタデータ) (2026-04-01T14:32:15Z) - Beyond Semantic Priors: Mitigating Optimization Collapse for Generalizable Visual Forensics [12.973951916863989]
我々は,非セマンティックなフォージェリーのランダムな推測にデジェネレーションを施した「最適化崩壊」と呼ばれる故障モードを同定する。
計算効率の良いCGP(Contrastive Gradient Proxy)と3つのトレーニングフリー戦略を統合したContrastive Regional Injection Transformer(CoRIT)を提案する。
CoRITは最適化の崩壊を緩和し、クロスドメインおよびユニバーサルフォージェリーベンチマーク間の最先端の一般化を実現する。
論文 参考訳(メタデータ) (2026-03-25T08:03:30Z) - V-Co: A Closer Look at Visual Representation Alignment via Co-Denoising [65.5867130156805]
統合JTフレームワークにおける視覚的コデノゲーションの体系的研究であるV-Coについて述べる。
本研究は,視覚的コデノジングを効果的に行うための4つの重要な要素を明らかにする。
V-Coは、基礎となる画素空間拡散ベースラインと強い前の画素拡散法より優れている。
論文 参考訳(メタデータ) (2026-03-17T17:01:54Z) - Reperio-rPPG: Relational Temporal Graph Neural Networks for Periodicity Learning in Remote Physiological Measurement [0.0]
リモート光麻痺(英: Remote Photoplethys)は、顔画像の微妙な色の変化を利用して、心拍数や呼吸速度などの重要な兆候を推定する、新たな生理的センシング技術である。
この非侵襲的手法は様々な領域で普及しているが、現実世界の条件下での微細な時間的ダイナミクスを捉える能力は過小評価されている。
周期構造を効果的に捉えるためにトランスフォーマーを戦略的に統合する新しいフレームワークであるGraph Reperio-rを提案する。
論文 参考訳(メタデータ) (2025-11-08T09:41:34Z) - Towards Anomaly-Aware Pre-Training and Fine-Tuning for Graph Anomaly Detection [59.042018542376596]
グラフ異常検出(GAD)は近年注目度が高まりつつあるが、2つの重要な要因があるため、依然として困難である。
Anomaly-Aware Pre-Training and Fine-Tuning (APF)は、GADの課題を軽減するためのフレームワークである。
10のベンチマークデータセットに関する総合的な実験は、最先端のベースラインと比較してAPFの優れたパフォーマンスを検証する。
論文 参考訳(メタデータ) (2025-04-19T09:57:35Z) - RhythmFormer: Extracting Patterned rPPG Signals based on Periodic Sparse Attention [18.412642801957197]
RRhythmは、生理学的ビデオに基づいて生理的信号を検出する非接触法である。
本稿では,周期性によって誘発される時間的注意間隔に基づく周期的注意機構を提案する。
これは、データ内およびデータ間評価の両方において最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-02-20T07:56:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。