論文の概要: PulseLM: A Foundation Dataset and Benchmark for PPG-Text Learning
- arxiv url: http://arxiv.org/abs/2603.03331v1
- Date: Tue, 10 Feb 2026 18:46:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 01:20:08.159637
- Title: PulseLM: A Foundation Dataset and Benchmark for PPG-Text Learning
- Title(参考訳): PulseLM: PPGテキスト学習のための基礎データセットとベンチマーク
- Authors: Hung Manh Pham, Jinyang Wu, Xiao Ma, Yiming Zhang, Yixin Xu, Aaqib Saeed, Bin Zhu, Zhou Pan, Dong Ma,
- Abstract要約: Photoplethysmographyは、連続した心血管および生理的モニタリングに広く用いられている非侵襲的なセンシングモダリティである。
既存のPSGデータセットは、数値測定やタスク固有のラベルの形で監督する。
我々はPulseLMを紹介した。PulseLMは生のPPG波形と自然言語をブリッジするために設計された大規模PPGテキストデータセットである。
- 参考スコア(独自算出の注目度): 22.000303329807462
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Photoplethysmography (PPG) is a widely used non-invasive sensing modality for continuous cardiovascular and physiological monitoring across clinical, laboratory, and wearable settings. While existing PPG datasets support a broad range of downstream tasks, they typically provide supervision in the form of numerical measurements or task-specific labels, limiting their suitability for language-based physiological reasoning and multimodal foundation models. In this work, we introduce PulseLM, a large-scale PPG-text dataset designed to bridge raw PPG waveforms and natural language through a unified, closed-ended question answering (QA) formulation. PulseLM aggregates PPG recordings from fifteen publicly available sources and harmonizes heterogeneous annotations into twelve common physiologically QA tasks. The dataset comprises 1.31 million standardized 10-second PPG segments, associated with 3.15 million question-answer pairs. We further define reproducible preprocessing, supervision, and evaluation protocols and establish baseline benchmarks using multimodal PPG-aware large language models. PulseLM provides a standardized foundation for studying multimodal physiological reasoning, cross-dataset generalization, and scalable benchmarking of PPG-based language models. The data and code can be found publicly available at: https://github.com/manhph2211/PulseLM.
- Abstract(参考訳): Photoplethysmography (PPG) は、臨床、実験室、ウェアラブル環境における連続的な心血管および生理的モニタリングに広く用いられている非侵襲的な知覚モダリティである。
既存のPSGデータセットは幅広い下流タスクをサポートしているが、典型的には数値測定やタスク固有のラベルの形での監督を提供し、言語に基づく生理的推論やマルチモーダル基礎モデルに対する適合性を制限している。
本稿では,PulseLMについて紹介する。PulseLMは生のPPG波形と自然言語を統一的で閉じた質問応答(QA)の定式化によってブリッジする大規模PPGテキストデータセットである。
PulseLMは15の公開ソースからのPDG記録を集約し、異種アノテーションを12の一般的な生理的QAタスクに調和させる。
データセットは、131万の標準化された10秒のPSGセグメントからなり、315万の質問応答ペアに関連付けられている。
さらに、再現可能な事前処理、監督、評価プロトコルを定義し、マルチモーダルPSG対応大規模言語モデルを用いてベースラインベンチマークを確立する。
PulseLMは、マルチモーダルな生理学的推論、クロスデータセットの一般化、PSGベースの言語モデルのスケーラブルなベンチマークの研究のための標準化された基盤を提供する。
データとコードは、https://github.com/manhph2211/PulseLMで公開されている。
関連論文リスト
- Wavelet-Driven Masked Multiscale Reconstruction for PPG Foundation Models [13.267230682892503]
Masked Multiscale Reconstruction (MMR)は、PSGデータの階層的時間周波数スケールから明確に学習する自己教師付き事前学習フレームワークである。
32,000人のユーザから1700万のラベルのない10秒PSGセグメントを使用して、MMRでモデルを事前訓練する。
19の多様な健康関連タスクのうち、MMRは大規模ウェアラブルPSGデータを改善し、最先端のオープンソースPSGモデルに適合させる。
論文 参考訳(メタデータ) (2026-01-18T01:34:47Z) - MedQARo: A Large-Scale Benchmark for Medical Question Answering in Romanian [50.767415194856135]
ルーマニア初の大規模医療QAベンチマークであるMedQARoを紹介する。
がん患者に関連する102,646のQAペアからなる高品質で大規模なデータセットを構築した。
論文 参考訳(メタデータ) (2025-08-22T13:48:37Z) - Finetuning and Quantization of EEG-Based Foundational BioSignal Models on ECG and PPG Data for Blood Pressure Estimation [46.36100528165335]
光胸腺撮影と心電図は、連続血圧モニタリング(BP)を可能にする可能性がある。
しかし、データ品質と患者固有の要因の変化のため、正確で堅牢な機械学習(ML)モデルは依然として困難である。
本研究では,1つのモータリティで事前学習したモデルを効果的に利用して,異なる信号タイプの精度を向上させる方法について検討する。
本手法は, 拡張期BPの最先端精度を約1.5倍に向上し, 拡張期BPの精度を1.5倍に向上させる。
論文 参考訳(メタデータ) (2025-02-10T13:33:12Z) - Pulse-PPG: An Open-Source Field-Trained PPG Foundation Model for Wearable Applications Across Lab and Field Settings [15.077834063212704]
光胸腺撮影に基づく基礎モデルは、様々な健康分野にまたがる一般化の可能性から、注目を集めている。
既存のPSGファウンデーションモデルはオープンソースだが、臨床データやクローズドソースに基づいてトレーニングされており、現実の環境での適用性が制限されている。
我々はPulseを紹介した。Pulseは、120人の参加者による100日間のフィールド調査で収集された生PSGデータに特化して訓練された、オープンソースのPulse基盤モデルである。
論文 参考訳(メタデータ) (2025-02-03T06:56:40Z) - PaPaGei: Open Foundation Models for Optical Physiological Signals [8.78925327256804]
光胸腺撮影は生体信号と心臓血管の健康をモニタリングする主要な非侵襲的手法である。
PPG信号に基づいて訓練された機械学習モデルは、タスク固有であり、一般化に苦慮する傾向がある。
PPG信号のための最初のオープン基盤モデルPaPaGeiを提案する。
論文 参考訳(メタデータ) (2024-10-27T18:18:06Z) - Rethinking Model Selection and Decoding for Keyphrase Generation with
Pre-trained Sequence-to-Sequence Models [76.52997424694767]
キーフレーズ生成(英: Keyphrase Generation, KPG)は、NLPにおける長年の課題である。
Seq2seq 事前訓練言語モデル (PLM) は KPG に転換期を迎え、有望な性能改善をもたらした。
本稿では, PLM に基づく KPG におけるモデル選択と復号化戦略の影響について, 系統解析を行った。
論文 参考訳(メタデータ) (2023-10-10T07:34:45Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。