論文の概要: Vision4PPG: Emergent PPG Analysis Capability of Vision Foundation Models for Vital Signs like Blood Pressure
- arxiv url: http://arxiv.org/abs/2510.10366v1
- Date: Sat, 11 Oct 2025 23:13:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.909831
- Title: Vision4PPG: Emergent PPG Analysis Capability of Vision Foundation Models for Vital Signs like Blood Pressure
- Title(参考訳): Vision4PPG:血圧のようなバイタルサインのためのビジョン基礎モデルの創発的PSG解析能力
- Authors: Saurabh Kataria, Ayca Ermis, Lovely Yeswanth Panchumarthi, Minxiao Wang, Xiao Hu,
- Abstract要約: ウェアラブルおよび臨床機器における光胸腺撮影(S)センサーは、非侵襲的でリアルタイムな方法で貴重な生理的洞察を提供する。
本研究は,PSGの視力モデルと最先端の時系列FMを比較検討することにより,従来より改善されている。
私たちは臨床医に、計算的にも効率的な、新しい強力なツールセットを提供しています。
PEFT(Efficient Fine-Tuning)技術。
- 参考スコア(独自算出の注目度): 5.249707825578274
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photoplethysmography (PPG) sensor in wearable and clinical devices provides valuable physiological insights in a non-invasive and real-time fashion. Specialized Foundation Models (FM) or repurposed time-series FMs are used to benchmark physiological tasks. Our experiments with fine-tuning FMs reveal that Vision FM (VFM) can also be utilized for this purpose and, in fact, surprisingly leads to state-of-the-art (SOTA) performance on many tasks, notably blood pressure estimation. We leverage VFMs by simply transforming one-dimensional PPG signals into image-like two-dimensional representations, such as the Short-Time Fourier transform (STFT). Using the latest VFMs, such as DINOv3 and SIGLIP-2, we achieve promising performance on other vital signs and blood lab measurement tasks as well. Our proposal, Vision4PPG, unlocks a new class of FMs to achieve SOTA performance with notable generalization to other 2D input representations, including STFT phase and recurrence plots. Our work improves upon prior investigations of vision models for PPG by conducting a comprehensive study, comparing them to state-of-the-art time-series FMs, and demonstrating the general PPG processing ability by reporting results on six additional tasks. Thus, we provide clinician-scientists with a new set of powerful tools that is also computationally efficient, thanks to Parameter-Efficient Fine-Tuning (PEFT) techniques.
- Abstract(参考訳): ウェアラブルおよび臨床機器における光胸腺撮影(PPG)センサーは、非侵襲的でリアルタイムな方法で貴重な生理的洞察を提供する。
特殊ファンデーションモデル(FM)または再使用された時系列FMは、生理的タスクのベンチマークに使用される。
微調整FMを用いた実験では、視覚FM(VFM)もこの目的に利用でき、実際、多くのタスク、特に血圧推定における最先端(SOTA)のパフォーマンスにつながることが判明した。
我々は,一次元PSG信号を短時間フーリエ変換(STFT)などの画像のような2次元表現に変換することで,VFMを利用する。
DINOv3やSIGLIP-2といった最新のVFMを用いて、他のバイタルサインや血液検査にも有望な性能を発揮する。
我々の提案であるVision4PPGは、STFT位相や繰り返しプロットを含む他の2次元入力表現への顕著な一般化により、SOTA性能を達成するための新しい種類のFMをアンロックする。
本研究は,PTGの視覚モデルに関する先行調査を総合的な研究により改善し,現状の時系列FMと比較し,さらに6つのタスクについて結果を報告することで一般PSG処理能力を実証する。
そこで我々は,PEFT(パラメータ・エフェクト・ファイン・チューニング)技術により,計算効率も向上した新しい強力なツールセットを臨床科学者に提供する。
関連論文リスト
- Estimating Clinical Lab Test Result Trajectories from PPG using Physiological Foundation Model and Patient-Aware State Space Model -- a UNIPHY+ Approach [5.103773025435573]
Photoplethysmogram (PHY) は、心血管動態を反映する非侵襲的、連続的に記録された集中治療単位(ICU)の信号である。
UNI+Labは,局所波形符号化のための大規模PPG基盤モデルと,長距離時間モデルのための患者対応Mambaモデルを組み合わせたフレームワークである。
論文 参考訳(メタデータ) (2025-09-19T18:38:06Z) - Single GPU Task Adaptation of Pathology Foundation Models for Whole Slide Image Analysis [8.076987502347327]
病理基盤モデル(PFM)は、スライド画像全体(WSI)を解析するための強力なツールとして登場した。
TAPFMは、特徴表現と注目重みの両方を最適化しながら、MILアグリゲーションに視覚変換器(ヴィット)アテンションを使用する。
膀胱癌および肺腺癌に対する突然変異予測タスクの評価。
論文 参考訳(メタデータ) (2025-06-05T15:56:45Z) - Enhancing Fluorescence Lifetime Parameter Estimation Accuracy with Differential Transformer Based Deep Learning Model Incorporating Pixelwise Instrument Response Function [0.3441582801949978]
蛍光ライフタイムイメージング(FLI)は、組織微小環境に関するユニークな情報を提供する。
近年のディープラーニングの進歩により、蛍光寿命パラメーターの推定が改善されている。
本稿では,実験的な光子時間ヒストグラムとともに,計装応答関数(IRF)を付加入力として統合した新しいDLアーキテクチャであるMFliNetを提案する。
論文 参考訳(メタデータ) (2024-11-25T20:03:41Z) - VideoGLUE: Video General Understanding Evaluation of Foundation Models [89.07145427268948]
我々は、慎重に設計された実験プロトコルを用いて、基礎モデル(FM)の映像理解能力を評価する。
一般的な映像理解タスクに適応する際のFMの目印と有効性について共同で検討する。
論文 参考訳(メタデータ) (2023-07-06T17:47:52Z) - Customizing General-Purpose Foundation Models for Medical Report
Generation [64.31265734687182]
ラベル付き医用画像-レポートペアの不足は、ディープニューラルネットワークや大規模ニューラルネットワークの開発において大きな課題となっている。
本稿では,コンピュータビジョンと自然言語処理の基盤モデル (FM) として,市販の汎用大規模事前学習モデルのカスタマイズを提案する。
論文 参考訳(メタデータ) (2023-06-09T03:02:36Z) - Amplitude-Independent Machine Learning for PPG through Visibility Graphs
and Transfer Learning [16.79885220470521]
Photoplethysmography (Photoplethysmography)は、光を用いた血液量の変化の測定である。
光胸腺造影信号は、身体の循環系に関する洞察を与える。
光胸腺造影信号は、心拍数や血管老化などの様々な生体機能を引き出すために用いられる。
論文 参考訳(メタデータ) (2023-05-23T13:41:52Z) - PhysFormer++: Facial Video-based Physiological Measurement with SlowFast
Temporal Difference Transformer [76.40106756572644]
最近のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙な手がかりのマイニングに重点を置いている。
本稿では,PhysFormerとPhys++++をベースとした2つのエンドツーエンドビデオ変換器を提案する。
4つのベンチマークデータセットで総合的な実験を行い、時間内テストとクロスデータセットテストの両方において優れた性能を示す。
論文 参考訳(メタデータ) (2023-02-07T15:56:03Z) - Pre-training and Fine-tuning Transformers for fMRI Prediction Tasks [69.85819388753579]
TFFはトランスフォーマーベースのアーキテクチャと2フェーズのトレーニングアプローチを採用している。
自己教師付きトレーニングは、fMRIスキャンのコレクションに適用され、モデルが3Dボリュームデータの再構成のために訓練される。
その結果、年齢や性別の予測、統合失調症認知など、さまざまなfMRIタスクにおける最先端のパフォーマンスが示された。
論文 参考訳(メタデータ) (2021-12-10T18:04:26Z) - PhysFormer: Facial Video-based Physiological Measurement with Temporal
Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。
本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文 参考訳(メタデータ) (2021-11-23T18:57:11Z) - Video-based Remote Physiological Measurement via Cross-verified Feature
Disentangling [121.50704279659253]
非生理的表現と生理的特徴を混同するための横断的特徴分離戦略を提案する。
次に, 蒸留された生理特性を用いて, 頑健なマルチタスク生理測定を行った。
歪んだ特徴は、最終的に平均HR値やr信号のような複数の生理的信号の合同予測に使用される。
論文 参考訳(メタデータ) (2020-07-16T09:39:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。