論文の概要: VAMP-Diff: VampPrior Latent Diffusion for Photoplethysmography Modeling
- arxiv url: http://arxiv.org/abs/2605.22851v1
- Date: Sun, 17 May 2026 18:45:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:19.993642
- Title: VAMP-Diff: VampPrior Latent Diffusion for Photoplethysmography Modeling
- Title(参考訳): VAMP-Diff:フォトプレソグラフィーモデリングのためのVampPrior遅延拡散
- Authors: Fatemeh Ghasemi Balouei, Nathan Willemsen, Mahesh Banavar, Bahman Moraffah,
- Abstract要約: 光胸腺造影(PSG)はユビキタスな生理的シグナルとなっている。
現在の生成モデルは、リアルな波形形態を保存し、心臓と呼吸の生理学を捉える潜在構造を学ぶのに苦労している。
本稿では, 時間的PSGエンコーダ, 条件付き1次元拡散デコーダ, コンパクトプール型潜水器上でのVampPrior正規化を組み合わせた, 共同訓練による変動拡散モデルであるVampPrior Latent Diffusion (VAMP-Diff)を提案する。
- 参考スコア(独自算出の注目度): 0.45498315114762483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photoplethysmography (PPG) has become a ubiquitous physiological signal; however, current generative models still struggle to preserve realistic waveform morphology and learn a latent structure that captures cardiac and respiratory physiology. PPG generators trained with adversarial losses can produce plausible waveforms, but provide no inference path from a real signal to a latent representation. Variational autoencoders, on the other hand, map the PPG data to latent codes, although their decoders often blur systolic upstrokes and dampen amplitude and spectral details. Diffusion models improve waveform fidelity, but typically lack an inference path for reconstruction and physiological analysis. We propose VampPrior Latent Diffusion (VAMP-Diff), a jointly trained variational diffusion model that combines a temporal PPG encoder, a conditional one-dimensional diffusion decoder, and VampPrior regularization on a compact pooled latent. The model uses full temporal latent during diffusion reconstruction, giving the decoder access to beat timing and morphology while generating samples from learned VampPrior components instead of a fixed Gaussian prior. We demonstrate on the CapnoBase dataset that VAMP-Diff produces realistic PPG signals, reconstructs sharper physiological waveforms than Gaussian-prior baselines, preserves heart-rate information, maintains respiratory-rate consistency, and is sensitive to waveform corruptions through reconstruction error.
- Abstract(参考訳): 光胸腺撮影(PPG)は、ユビキタスな生理的シグナルとなっているが、現在の生成モデルは、現実的な波形形態を保存し、心臓と呼吸の生理学を捉える潜在構造を学ぶのに苦慮している。
逆損失で訓練されたPGジェネレータは、可塑性波形を生成することができるが、実信号から潜在表現への推論経路は提供しない。
一方、変分オートエンコーダは、PSGデータを潜時符号にマッピングするが、デコーダはしばしば収縮性アップストロークを曖昧にし、振幅とスペクトルの詳細を減衰させる。
拡散モデルは波形の忠実性を改善するが、典型的には再構成と生理学的解析のための推論経路が欠如している。
本稿では, 時間的PSGエンコーダ, 条件付き1次元拡散デコーダ, コンパクトプール型潜水器上でのVampPrior正規化を組み合わせた, 共同訓練による変動拡散モデルであるVampPrior Latent Diffusion (VAMP-Diff)を提案する。
このモデルは拡散再構成中にフルテンポラル潜水剤を使用し、デコーダはガウス以前の固定ではなく、学習したVampPriorコンポーネントからサンプルを生成しながら、タイミングと形態にアクセスできる。
本稿では, VAMP-Diff が現実的な PPG 信号を生成し, ガウシアン・プライアベースラインよりもシャープな生理波形を再構成し, 心拍情報を保存し, 呼吸速度の整合性を維持し, 再構成誤差により波形の破損に敏感であることを示す。
関連論文リスト
- FreqPhys: Repurposing Implicit Physiological Frequency Prior for Robust Remote Photoplethysmography [54.32412212867472]
Photoplethysmographyは、ビデオから肌の色の変化を微妙に捉え、接触のない生理的モニタリングを可能にする。
FreqPhysは、シグナル回復のために生理的頻度事前を明示的に活用する周波数誘導リレーションフレームワークである。
これは、特に挑戦的な運動条件下で、最先端のアプローチよりも大幅に改善される。
論文 参考訳(メタデータ) (2026-04-01T06:25:42Z) - AWDiff: An a trous wavelet diffusion model for lung ultrasound image synthesis [5.0322920296798435]
肺超音波(LUS)は安全かつポータブルな画像モダリティであるが、データの不足により、画像解釈と疾患モニタリングのための機械学習手法の開発が制限される。
A Trous Wavelet Diffusion (AWDiff) は、トロイスウェーブレットを統合して微細構造を保存するための拡散に基づく拡張フレームワークである。
AWDiffは既存の方法に比べて歪みが低く、知覚品質も高く、構造的忠実度と臨床多様性の両方を実証した。
論文 参考訳(メタデータ) (2026-03-03T15:57:57Z) - Wavelet-Driven Masked Multiscale Reconstruction for PPG Foundation Models [13.267230682892503]
Masked Multiscale Reconstruction (MMR)は、PSGデータの階層的時間周波数スケールから明確に学習する自己教師付き事前学習フレームワークである。
32,000人のユーザから1700万のラベルのない10秒PSGセグメントを使用して、MMRでモデルを事前訓練する。
19の多様な健康関連タスクのうち、MMRは大規模ウェアラブルPSGデータを改善し、最先端のオープンソースPSGモデルに適合させる。
論文 参考訳(メタデータ) (2026-01-18T01:34:47Z) - Coupled Diffusion-Encoder Models for Reconstruction of Flow Fields [11.478292682955669]
本稿では,従来の畳み込み型ResNetエンコーダと確率拡散モデルを統合する結合フレームワークであるDiffCoderを提案する。
積極的な圧縮の下では、DiffCoderはスペクトル精度を大幅に向上し、VAEは相当な劣化を示す。
DiffCoderはフローの分布構造をよりよく保存する。
論文 参考訳(メタデータ) (2026-01-12T19:24:52Z) - Higher fidelity perceptual image and video compression with a latent conditioned residual denoising diffusion model [55.2480439325792]
本稿では,認知品質に最適化されたハイブリッド圧縮方式を提案し,CDCモデルのアプローチをデコーダネットワークで拡張する。
CDCと比較した場合,LPIPSとFIDの知覚スコアを比較検討しながら,最大2dBPSNRの忠実度向上を実現した。
論文 参考訳(メタデータ) (2025-05-19T14:13:14Z) - X$^{2}$-Gaussian: 4D Radiative Gaussian Splatting for Continuous-time Tomographic Reconstruction [64.2059940799033]
現在の方法では、時間分解能を呼吸ゲーティング装置で固定相に識別する。
新規なフレームワークであるX$2$-Gaussianは、動的放射スプラッティングと自己監督型呼吸運動学習を統合することで、連続的な4DCT再構成を可能にする。
論文 参考訳(メタデータ) (2025-03-27T17:59:57Z) - RespDiff: An End-to-End Multi-scale RNN Diffusion Model for Respiratory Waveform Estimation from PPG Signals [3.306437812367815]
PPG信号からの呼吸波形推定のためのエンドツーエンドマルチスケールRNNモデルであるRespDiffを提案する。
モデルはマルチスケールエンコーダを使用し、異なる解像度で特徴を抽出し、双方向RNNを使用してPSG信号を処理し、呼吸波形を抽出する。
BIDMCデータセットで行った実験では、RespDiffはRR推定の1.18bpmの平均絶対誤差(MAE)を達成し、先行研究よりも優れていた。
論文 参考訳(メタデータ) (2024-10-06T05:54:49Z) - Reconstructing Richtmyer-Meshkov instabilities from noisy radiographs using low dimensional features and attention-based neural networks [3.6270672925388263]
トレーニングされた注意に基づくトランスフォーマーネットワークは、Richtmyer-Meshkoff不安定性によって与えられる複雑なトポロジーを確実に回復することができる。
このアプローチは、ICFのような二重貝殻流体力学シミュレーションで実証される。
論文 参考訳(メタデータ) (2024-08-02T03:02:39Z) - Adaptive Multi-step Refinement Network for Robust Point Cloud Registration [82.64560249066734]
ポイントクラウド登録は、同じシーンの2つのポイントクラウド間の相対的な厳密な変換を推定する。
本稿では,前ステップからの情報を活用することで,各ステップの登録品質を向上する適応型多段階改良ネットワークを提案する。
本手法は3DMatch/3DLoMatchベンチマークとKITTIベンチマークの両方で最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-05T18:59:41Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with
Adaptive Noise Spectral Shaping [51.698273019061645]
SpecGradは拡散雑音に適応し、その時間変化スペクトル包絡が条件付き対数メル分光器に近づく。
時間周波数領域で処理され、計算コストは従来のDDPMベースのニューラルボコーダとほぼ同じである。
論文 参考訳(メタデータ) (2022-03-31T02:08:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。