論文の概要: M3PD Dataset: Dual-view Photoplethysmography (PPG) Using Front-and-rear Cameras of Smartphones in Lab and Clinical Settings
- arxiv url: http://arxiv.org/abs/2511.02349v1
- Date: Tue, 04 Nov 2025 08:13:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:05.847045
- Title: M3PD Dataset: Dual-view Photoplethysmography (PPG) Using Front-and-rear Cameras of Smartphones in Lab and Clinical Settings
- Title(参考訳): M3PDデータセット:実験室および臨床現場におけるスマートフォンの前後カメラを用いたデュアルビュー光胸部撮影(PPG)
- Authors: Jiankai Tang, Tao Zhang, Jia Li, Yiru Zhang, Mingyu Zhang, Kegang Wang, Yuming Hao, Bolin Wang, Haiyang Li, Xingyao Wang, Yuanchun Shi, Yuntao Wang, Sichong Qian,
- Abstract要約: スマートフォン上のビデオベースのフォトプレソグラフィーは、便利な非侵襲的な代替手段を提供する。
依然として、モーションアーティファクト、照明のバリエーション、シングルビューの制約によって引き起こされる信頼性の課題に直面している。
初めて公開されたデュアルビュー・モバイル・フォトプレソグラフィー・データセットを紹介する。
本研究では,マンバをベースとした時間モデルを用いて顔と指先を融合するF3Mambaを提案する。
- 参考スコア(独自算出の注目度): 25.57004371812805
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Portable physiological monitoring is essential for early detection and management of cardiovascular disease, but current methods often require specialized equipment that limits accessibility or impose impractical postures that patients cannot maintain. Video-based photoplethysmography on smartphones offers a convenient noninvasive alternative, yet it still faces reliability challenges caused by motion artifacts, lighting variations, and single-view constraints. Few studies have demonstrated reliable application to cardiovascular patients, and no widely used open datasets exist for cross-device accuracy. To address these limitations, we introduce the M3PD dataset, the first publicly available dual-view mobile photoplethysmography dataset, comprising synchronized facial and fingertip videos captured simultaneously via front and rear smartphone cameras from 60 participants (including 47 cardiovascular patients). Building on this dual-view setting, we further propose F3Mamba, which fuses the facial and fingertip views through Mamba-based temporal modeling. The model reduces heart-rate error by 21.9 to 30.2 percent over existing single-view baselines while improving robustness in challenging real-world scenarios. Data and code: https://github.com/Health-HCI-Group/F3Mamba.
- Abstract(参考訳): ポータブルな生理的モニタリングは、心臓血管疾患の早期発見と管理に不可欠であるが、現在の方法は、アクセシビリティを制限したり、患者が維持できない非現実的な姿勢を課す特別な機器を必要とすることが多い。
スマートフォン上のビデオベースのフォトプレソグラフィーは、便利な非侵襲的な代替手段を提供するが、それでもモーションアーティファクト、照明のバリエーション、シングルビューの制約によって生じる信頼性の問題に直面している。
心臓血管系患者への信頼性の高い応用を示す研究はほとんどなく、デバイス間の精度を高めるために広く使われているオープンデータセットは存在しない。
これらの制約に対処するため、M3PDデータセットを導入した。このデータセットは、60人の参加者(47人の心血管系患者を含む)から、正面および後方のスマートフォンカメラで同時に撮影された顔と指先を同期したビデオを含む、初めて公開されたデュアルビュー・モバイル・フォトプレソグラフィーデータセットである。
このデュアルビュー・セッティングに基づいて,マンバをベースとした時間モデルを用いて顔と指先を融合するF3Mambaを提案する。
このモデルは、既存のシングルビューベースラインよりも21.9から30.2%の心拍誤差を減少させ、現実のシナリオに挑戦する際の堅牢性を改善する。
データとコード:https://github.com/Health-HCI-Group/F3Mamba
関連論文リスト
- Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - Efficient Multi-View Fusion and Flexible Adaptation to View Missing in Cardiovascular System Signals [4.519437028632205]
深層学習は、心臓血管系(CVS)信号に関する自動多視点融合(MVF)を促進する。
MVFモデルアーキテクチャは、しばしば同じ時間ステップからCVS信号と一致するが、統一された表現に異なる視点を持つ。
本稿では,事前学習したMVFモデルに対して,様々なシナリオに柔軟に対応するためのプロンプト手法を提案する。
論文 参考訳(メタデータ) (2024-06-13T08:58:59Z) - Coordinate Transformer: Achieving Single-stage Multi-person Mesh
Recovery from Videos [91.44553585470688]
ビデオから複数人の3Dメッシュを回収することは、バーチャルリアリティーや理学療法などにおけるグループ行動の自動認識に向けた重要な第一歩である。
本稿では,複数人物の時空間関係を直接モデル化し,同時にエンドツーエンドでマルチ・メッシュ・リカバリを行うコーディネート・トランスフォーマーを提案する。
3DPWデータセットの実験では、CoordFormerが最先端の精度を大幅に向上し、MPJPE、PAMPJPE、PVEの計測値でそれぞれ4.2%、8.8%、そして4.7%を上回った。
論文 参考訳(メタデータ) (2023-08-20T18:23:07Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Next-generation Surgical Navigation: Marker-less Multi-view 6DoF Pose Estimation of Surgical Instruments [64.59698930334012]
静止カメラとヘッドマウントカメラを組み合わせたマルチカメラ・キャプチャー・セットアップを提案する。
第2に,手術用ウェットラボと実際の手術用劇場で撮影された元脊椎手術のマルチビューRGB-Dビデオデータセットを公表した。
第3に,手術器具の6DoFポーズ推定の課題に対して,最先端のシングルビューとマルチビューの3つの手法を評価した。
論文 参考訳(メタデータ) (2023-05-05T13:42:19Z) - Model Explainability in Physiological and Healthcare-based Neural
Networks [26.241527103973887]
新型コロナウイルスのパンデミックは、SpO2の早期発見の重要性を強調している。
従来のSpO2測定方法は、コンタクトベースのセンシングに依存している。
パルスオキシメータは 地域社会や未開発国では使えません
提案手法は,コンシューマグレードのスマートフォンから撮影したビデオを用いて,より効率的かつ正確なSpO2監視方法を提供する。
論文 参考訳(メタデータ) (2023-04-03T20:58:32Z) - Medical diffusion on a budget: Textual Inversion for medical image generation [3.0826983115939823]
スクラッチからトレーニングするには、大きなキャプション付きデータセットと重要な計算リソースが必要である。
本研究は, 予め訓練した安定拡散モデルを医用画像モダリティに適応させることが, テキスト埋め込みの訓練によって達成可能であることを示す。
トレーニングされた埋め込みはコンパクト(1MB未満)で、プライバシー上の懸念を減らしてデータ共有を容易にする。
論文 参考訳(メタデータ) (2023-03-23T16:50:19Z) - M3FAS: An Accurate and Robust MultiModal Mobile Face Anti-Spoofing System [39.37647248710612]
フェイスプレゼンテーションアタック(FPA)は、様々な悪意あるアプリケーションを通じて、公衆の懸念を高めている。
我々は,M3FASという,正確で堅牢なマルチモーダル・モバイル・フェイス・アンチ・スポーフィングシステムを開発した。
論文 参考訳(メタデータ) (2023-01-30T12:37:04Z) - Facial Masks and Soft-Biometrics: Leveraging Face Recognition CNNs for
Age and Gender Prediction on Mobile Ocular Images [53.913598771836924]
スマートフォンで撮影した自撮り眼画像を使って年齢や性別を推定します。
ImageNet Challengeの文脈で提案された2つの既存の軽量CNNを適応させる。
一部のネットワークは顔認識のためにさらにトレーニングされており、非常に大規模なトレーニングデータベースが利用可能です。
論文 参考訳(メタデータ) (2021-03-31T01:48:29Z) - A Supervised Learning Approach for Robust Health Monitoring using Face
Videos [32.157163136267954]
非接触型非接触型人体検知法は、特殊な心臓および血圧モニタリング装置の必要性をなくすことができる。
本稿では,市販のウェブカメラで撮影する顔ビデオのみを必要とする非接触方式を用いた。
提案手法では,顔のランドマークを用いて映像の各フレームの顔を検出する。
論文 参考訳(メタデータ) (2021-01-30T22:03:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。