論文の概要: Wavelet-Driven Masked Multiscale Reconstruction for PPG Foundation Models
- arxiv url: http://arxiv.org/abs/2601.12215v1
- Date: Sun, 18 Jan 2026 01:34:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.508677
- Title: Wavelet-Driven Masked Multiscale Reconstruction for PPG Foundation Models
- Title(参考訳): PPG基礎モデルのためのウェーブレット駆動型マスク付きマルチスケール再構成
- Authors: Megha Thukral, Cyrus Tanade, Simon A. Lee, Juhyeon Lee, Hao Zhou, Keum San Chun, Migyeong Gwak, Viswam Nathan, Md Mahbubur Rahman, Li Zhu, Mehrab Bin Morshed, Subramaniam Venkatraman, Sharanya Arcot Desai,
- Abstract要約: Masked Multiscale Reconstruction (MMR)は、PSGデータの階層的時間周波数スケールから明確に学習する自己教師付き事前学習フレームワークである。
32,000人のユーザから1700万のラベルのない10秒PSGセグメントを使用して、MMRでモデルを事前訓練する。
19の多様な健康関連タスクのうち、MMRは大規模ウェアラブルPSGデータを改善し、最先端のオープンソースPSGモデルに適合させる。
- 参考スコア(独自算出の注目度): 13.267230682892503
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Wearable foundation models have the potential to transform digital health by learning transferable representations from large-scale biosignals collected in everyday settings. While recent progress has been made in large-scale pretraining, most approaches overlook the spectral structure of photoplethysmography (PPG) signals, wherein physiological rhythms unfold across multiple frequency bands. Motivated by the insight that many downstream health-related tasks depend on multi-resolution features spanning fine-grained waveform morphology to global rhythmic dynamics, we introduce Masked Multiscale Reconstruction (MMR) for PPG representation learning - a self-supervised pretraining framework that explicitly learns from hierarchical time-frequency scales of PPG data. The pretraining task is designed to reconstruct randomly masked out coefficients obtained from a wavelet-based multiresolution decomposition of PPG signals, forcing the transformer encoder to integrate information across temporal and spectral scales. We pretrain our model with MMR using ~17 million unlabeled 10-second PPG segments from ~32,000 smartwatch users. On 17 of 19 diverse health-related tasks, MMR trained on large-scale wearable PPG data improves over or matches state-of-the-art open-source PPG foundation models, time-series foundation models, and other self-supervised baselines. Extensive analysis of our learned embeddings and systematic ablations underscores the value of wavelet-based representations, showing that they capture robust and physiologically-grounded features. Together, these results highlight the potential of MMR as a step toward generalizable PPG foundation models.
- Abstract(参考訳): ウェアラブル基礎モデルは、日常的に収集された大規模なバイオシグナーから伝達可能な表現を学習することで、デジタルヘルスを変革する可能性がある。
大規模プレトレーニングでは最近の進歩があるが、ほとんどのアプローチは光胸腺造影(PPG)信号のスペクトル構造を見落としており、複数の周波数帯域で生理的リズムが広がる。
PPG表現学習のためのMasked Multiscale Reconstruction (MMR)を導入し、PPGデータの階層的時間周波数スケールから明確に学習する自己教師型事前学習フレームワークを提案する。
プレトレーニングタスクは、ウェーブレットに基づくPSG信号の多分解分解から得られた係数をランダムにマスキングし、トランスフォーマーエンコーダに時間的およびスペクトル的なスケールで情報を統合するよう強制するように設計されている。
我々は、約3万2000人のスマートウォッチユーザーから、ラベル付けされていない10秒のPSGセグメントを使用して、MMRでモデルを事前訓練する。
19の多様な健康関連タスクのうち、MMRは大規模ウェアラブルPSGデータの改善や、最先端のオープンソースPSGファンデーションモデル、時系列ファンデーションモデル、その他の自己管理ベースラインに適合する。
学習した埋め込みと体系的な改善の広範な分析は、ウェーブレットに基づく表現の価値を強調し、それらが堅牢で生理学的に接地された特徴を捉えていることを示す。
これらの結果は、一般化可能なPSG基盤モデルに向けたステップとして、MMRの可能性を強調している。
関連論文リスト
- Reperio-rPPG: Relational Temporal Graph Neural Networks for Periodicity Learning in Remote Physiological Measurement [0.0]
リモート光麻痺(英: Remote Photoplethys)は、顔画像の微妙な色の変化を利用して、心拍数や呼吸速度などの重要な兆候を推定する、新たな生理的センシング技術である。
この非侵襲的手法は様々な領域で普及しているが、現実世界の条件下での微細な時間的ダイナミクスを捉える能力は過小評価されている。
周期構造を効果的に捉えるためにトランスフォーマーを戦略的に統合する新しいフレームワークであるGraph Reperio-rを提案する。
論文 参考訳(メタデータ) (2025-11-08T09:41:34Z) - KM-GPT: An Automated Pipeline for Reconstructing Individual Patient Data from Kaplan-Meier Plots [45.53914693601933]
我々は、Kaplan-Meierプロットから直接IDDを再構築するための、最初の完全に自動化されたAI駆動パイプラインであるKM-GPTを開発した。
KM-GPTは、高度な画像前処理、GPT-5によるマルチモーダル推論、反復再構成アルゴリズムを統合している。
そのハイブリッド推論アーキテクチャは、構造化されていない情報の構造化データフローへの変換を自動化する。
KM-GPTは、合成および実世界のデータセットに対して厳格に評価され、常に優れた精度を示す。
論文 参考訳(メタデータ) (2025-09-15T00:38:38Z) - PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.243031514520794]
LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。
PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文 参考訳(メタデータ) (2025-05-06T15:18:38Z) - PaPaGei: Open Foundation Models for Optical Physiological Signals [8.78925327256804]
光胸腺撮影は生体信号と心臓血管の健康をモニタリングする主要な非侵襲的手法である。
PPG信号に基づいて訓練された機械学習モデルは、タスク固有であり、一般化に苦慮する傾向がある。
PPG信号のための最初のオープン基盤モデルPaPaGeiを提案する。
論文 参考訳(メタデータ) (2024-10-27T18:18:06Z) - Amplitude-Independent Machine Learning for PPG through Visibility Graphs
and Transfer Learning [16.79885220470521]
Photoplethysmography (Photoplethysmography)は、光を用いた血液量の変化の測定である。
光胸腺造影信号は、身体の循環系に関する洞察を与える。
光胸腺造影信号は、心拍数や血管老化などの様々な生体機能を引き出すために用いられる。
論文 参考訳(メタデータ) (2023-05-23T13:41:52Z) - PhysFormer++: Facial Video-based Physiological Measurement with SlowFast
Temporal Difference Transformer [76.40106756572644]
最近のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙な手がかりのマイニングに重点を置いている。
本稿では,PhysFormerとPhys++++をベースとした2つのエンドツーエンドビデオ変換器を提案する。
4つのベンチマークデータセットで総合的な実験を行い、時間内テストとクロスデータセットテストの両方において優れた性能を示す。
論文 参考訳(メタデータ) (2023-02-07T15:56:03Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - PhysFormer: Facial Video-based Physiological Measurement with Temporal
Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。
本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文 参考訳(メタデータ) (2021-11-23T18:57:11Z) - Video-based Remote Physiological Measurement via Cross-verified Feature
Disentangling [121.50704279659253]
非生理的表現と生理的特徴を混同するための横断的特徴分離戦略を提案する。
次に, 蒸留された生理特性を用いて, 頑健なマルチタスク生理測定を行った。
歪んだ特徴は、最終的に平均HR値やr信号のような複数の生理的信号の合同予測に使用される。
論文 参考訳(メタデータ) (2020-07-16T09:39:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。