論文の概要: A General Framework for Generative Self-supervised Learning in Non-invasive Estimation of Physiological Parameters Using Photoplethysmography
- arxiv url: http://arxiv.org/abs/2604.22780v1
- Date: Fri, 03 Apr 2026 12:42:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.175535
- Title: A General Framework for Generative Self-supervised Learning in Non-invasive Estimation of Physiological Parameters Using Photoplethysmography
- Title(参考訳): フォトプレソグラフィーを用いた生理的パラメータの非侵襲的推定における自己教師型学習の一般的な枠組み
- Authors: Zexing Zhang, Huimin Lu, Songzhe Ma, Jianzhong Peng, Chenglin Lin, Niya Li, Bingwang Dong,
- Abstract要約: SSRLフレームワークは、時間、分光、時間-分光混合ドメインを用いて、普遍的および非侵襲的な生理学的パラメータ推定のためのPSGのユニークな特徴を探索し、組み込むために提案される。
CTFGAとDPTの結合性能は,生理的パラメータ推定タスクにおいて,標準生成学習よりも有意に優れていた。
- 参考スコア(独自算出の注目度): 3.154286239027942
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Aligning physiological parameter labels with large-scale photoplethysmographic (PPG) data for deep learning is challenging and resource-intensive. While self-supervised representation learning (SSRL) can handle limited annotated data, the challenge lies in learning robust shared representations from vast unlabeled data and integrating contextual cues to learn distinctive representations. To alleviate these challenges, a generative SSRL framework TS2TC is proposed to utilize the temporal, spectrogram, and temporal-spectrogram mixed domains to explore and incorporate the unique features of PPG for universal and noninvasive physiological parameter estimation. A pretext task named Cross-Temporal Fusion Generative Anchor (CTFGA) is designed, modeling temporal dependencies and reconstructing independent segments at a coarse level to provide robust global feature extraction and local contextual representation. The framework includes sub-signals from PPG with diverse frequency scales and order derivatives reflecting hemodynamics to facilitate learning shared representations at varying semantic levels. Secondly, a cognitive-inspired dual-process transfer (DPT) strategy is formulated, consisting of prior-dependent autonomous processes and posterior observation reasoning processes, to leverage the independent and integrated advantages of shared and specific representations. TS2TC introduces a bilinear temporal-spectrogram fusion method in the mixed domain, aligning latent representations from different domains and establishing fine-grained contextual interactions across multiple sources of information. Extensive experiments on physiological parameter estimation tasks showed that the joint performance of CTFGA and DPT outperforms standard generative learning significantly. TS2TC achieved an average 2.49\% improvement in RMSE over state-of-the-art estimation methods with only 10\% training data.
- Abstract(参考訳): 深層学習のための大規模光胸腺撮影(PPG)データを用いた生理的パラメータラベルの調整は困難かつ資源集約的である。
自己教師付き表現学習(SSRL)は、限られた注釈付きデータを扱うことができるが、課題は、膨大なラベルのないデータから頑健な共有表現を学習し、文脈的手がかりを統合して、独特な表現を学習することにある。
これらの課題を軽減するために, 時間, 分光, 時間-スペクトル混合ドメインを用いたSSRLフレームワークTS2TCを提案する。
CTFGA(Cross-Temporal Fusion Generative Anchor)と呼ばれるプレテキストタスクは、時間的依存関係をモデル化し、粗いレベルで独立したセグメントを再構築し、ロバストなグローバルな特徴抽出と局所的な文脈表現を提供する。
このフレームワークは、多様な周波数スケールを持つPGGのサブシグナルと、様々な意味レベルで共有表現の学習を容易にするために血行動態を反映するオーダーデリバティブを含んでいる。
第二に、認知にインスパイアされたデュアルプロセス転送(DPT)戦略が定式化され、事前依存した自律プロセスと後部観察推論プロセスで構成され、共有表現と特定の表現の独立的で統合された利点を活用する。
TS2TCは、混合ドメインに双線形時間スペクトル融合法を導入し、異なるドメインからの潜在表現を整列させ、複数の情報ソースにまたがる微細なコンテキスト相互作用を確立する。
CTFGAとDPTの結合性能は,生理的パラメータ推定タスクにおいて,標準生成学習よりも有意に優れていた。
TS2TC は10%のトレーニングデータしか持たない最先端推定法よりも平均 2.49 % 改善された。
関連論文リスト
- A Lightweight Transformer for Pain Recognition from Brain Activity [11.72500739025842]
本稿では,複数のfNIRS表現を統一トークン化機構を通じて融合する軽量トランスフォーマーアーキテクチャを提案する。
提案したトークン混合戦略は、異種入力を共有潜在表現に投影することにより、空間的・時間的・時間的特性を保存する。
このモデルは、重畳された生波形とfNIRS入力のパワースペクトル密度表現を用いてAI4Painデータセット上で評価する。
論文 参考訳(メタデータ) (2026-04-13T13:25:19Z) - Bidirectional Learning of Facial Action Units and Expressions via Structured Semantic Mapping across Heterogeneous Datasets [85.74213192818668]
本研究では,異なるデータ領域下での双方向AU-FE学習のための構造化セマンティックマッピング(SSM)フレームワークを提案する。
SSMは、(1)動的AUとFEビデオから統一された顔表現を学習する共有視覚バックボーン、(2)テキストセマンティックプロトタイプ(TSP)モジュールによるセマンティックメディエーション、(3)顔行動符号化システムから派生した事前知識を組み込んだ動的優先マッピング(DPM)モジュールの3つの主要な構成要素から構成される。
論文 参考訳(メタデータ) (2026-04-12T09:08:32Z) - SPADE: Spatial Transcriptomics and Pathology Alignment Using a Mixture of Data Experts for an Expressive Latent Space [19.44068776198238]
本研究では,空間転写学データと病理組織学を統合し,画像表現学習を指導する基礎モデルSPADEを紹介する。
SPADEは20のダウンストリームタスクで評価され、ベースラインモデルと比較して非常に優れた数ショット性能を示している。
論文 参考訳(メタデータ) (2025-06-27T02:20:51Z) - CRIA: A Cross-View Interaction and Instance-Adapted Pre-training Framework for Generalizable EEG Representations [52.251569042852815]
CRIAは、可変長および可変チャネルコーディングを使用して、異なるデータセット間でEEGデータの統一表現を実現する適応フレームワークである。
このモデルでは、時間的、スペクトル的、空間的特徴を効果的に融合させるクロスアテンション機構を採用している。
テンプル大学脳波コーパスとCHB-MITデータセットによる実験結果から、CRIAは既存の方法よりも、同じ事前学習条件で優れていることが示された。
論文 参考訳(メタデータ) (2025-06-19T06:31:08Z) - Cross-Sequence Semi-Supervised Learning for Multi-Parametric MRI-Based Visual Pathway Delineation [18.101169568060786]
本稿では,VP記述のための新しい半教師付き多パラメータ特徴分解フレームワークを提案する。
具体的には、相関制約付き特徴分解(CFD)は複雑な相互系列関係を扱うように設計されている。
2つのパブリックデータセットと1つの社内マルチシェル拡散MRI(MDM)データセットを用いて、我々のフレームワークを検証する。
論文 参考訳(メタデータ) (2025-05-26T09:18:58Z) - PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.243031514520794]
LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。
PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文 参考訳(メタデータ) (2025-05-06T15:18:38Z) - Intrapartum Ultrasound Image Segmentation of Pubic Symphysis and Fetal Head Using Dual Student-Teacher Framework with CNN-ViT Collaborative Learning [1.5233179662962222]
pubic symphysis and fetal head (PSFH) の分節は、労働の進行をモニターし、潜在的に引き起こされる合併症を特定するための重要なステップである。
従来の半教師付き学習アプローチは、主に畳み込みニューラルネットワーク(CNN)に基づく統合ネットワークモデルを利用する。
CNN と Transformer を組み合わせた新しいフレームワークである Dual-Student and Teacher Combining CNN (DSTCT) を導入する。
論文 参考訳(メタデータ) (2024-09-11T00:57:31Z) - Graph-Aware Contrasting for Multivariate Time-Series Classification [50.84488941336865]
既存のコントラスト学習手法は主に、時間的拡張とコントラスト技術による時間的一貫性を達成することに焦点を当てている。
MTSデータ間の空間的整合性を考慮したグラフ認識コントラストを提案する。
提案手法は,様々なMSS分類タスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-11T02:35:22Z) - Spatial-Temporal Correlation and Topology Learning for Person
Re-Identification in Videos [78.45050529204701]
クロススケール空間時空間相関をモデル化し, 識別的, 堅牢な表現を追求する新しい枠組みを提案する。
CTLはCNNバックボーンとキーポイント推定器を使用して人体から意味的局所的特徴を抽出する。
グローバルな文脈情報と人体の物理的接続の両方を考慮して、多スケールグラフを構築するためのコンテキスト強化トポロジーを探求する。
論文 参考訳(メタデータ) (2021-04-15T14:32:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。