論文の概要: Camera-Based Remote Physiology Sensing for Hundreds of Subjects Across Skin Tones
- arxiv url: http://arxiv.org/abs/2404.05003v1
- Date: Sun, 7 Apr 2024 15:58:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-09 18:41:48.794411
- Title: Camera-Based Remote Physiology Sensing for Hundreds of Subjects Across Skin Tones
- Title(参考訳): 皮膚のトーンを横断する何百人もの被験者に対するカメラによるリモート生理計測
- Authors: Jiankai Tang, Xinyi Li, Jiacheng Liu, Xiyuxing Zhang, Zeyu Wang, Yuntao Wang,
- Abstract要約: 本稿では,893名の被験者と6名のスキントーンを対象とする,これまでで最大規模の実世界のrデータセットであるVitalVideoデータセットの詳細な分析を行う。
6つの教師なし手法と3つの教師なしモデルによる実験により、データセットが効果的なrモデルトレーニングに十分であることを示す。
- 参考スコア(独自算出の注目度): 8.270444315801475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Remote photoplethysmography (rPPG) emerges as a promising method for non-invasive, convenient measurement of vital signs, utilizing the widespread presence of cameras. Despite advancements, existing datasets fall short in terms of size and diversity, limiting comprehensive evaluation under diverse conditions. This paper presents an in-depth analysis of the VitalVideo dataset, the largest real-world rPPG dataset to date, encompassing 893 subjects and 6 Fitzpatrick skin tones. Our experimentation with six unsupervised methods and three supervised models demonstrates that datasets comprising a few hundred subjects(i.e., 300 for UBFC-rPPG, 500 for PURE, and 700 for MMPD-Simple) are sufficient for effective rPPG model training. Our findings highlight the importance of diversity and consistency in skin tones for precise performance evaluation across different datasets.
- Abstract(参考訳): 遠隔プラチスモグラフィー(rPPG)は、カメラの広範な存在を利用して、非侵襲的で便利なバイタルサインの測定のための有望な方法として現れる。
進歩にもかかわらず、既存のデータセットはサイズと多様性の点で不足しており、多様な条件下での包括的な評価を制限している。
本稿では,893名の被験者と6名のフィッツパトリックスキントーンを含む世界最大級のrPPGデータセットであるVitalVideoデータセットについて,詳細な分析を行った。
6つの教師なし手法と3つの教師付きモデルを用いて実験したところ、数百の被験者(UBFC-rPPGは300、PUREは500、MMPD-Simpleは700)からなるデータセットが有効なrPPGモデルトレーニングに十分であることが示された。
本研究は,異なるデータセット間での正確な性能評価のために,肌の色調における多様性と一貫性の重要性を強調した。
関連論文リスト
- An Attention-Guided Deep Learning Approach for Classifying 39 Skin Lesion Types [0.9467360130705921]
本研究は,39種類の皮膚病変からなる包括的および多種多様なデータセットをキュレートすることにより,分野を前進させる。
MobileNetV2、Xception、InceptionV3、EfficientNetB1、Vision Transformerの5つの最先端ディープラーニングモデルが厳格に評価されている。
CBAMと統合されたビジョントランスフォーマーモデルは、93.46%の精度、94%の精度、93%のリコール、93%のF1スコア、93.67%の特異性を達成した。
論文 参考訳(メタデータ) (2025-01-10T14:25:01Z) - SELMA3D challenge: Self-supervised learning for 3D light-sheet microscopy image segmentation [6.473752329913864]
私たちは、MICCAI 2024カンファレンスでSELMA3D Challengeを組織しました。SELMA3Dは、クリアドマウスとヒト脳からの大量の光シート画像を提供します。
本論文では,課題の全段階に5つのチームが参加し,提案手法について概説する。
SELMA3Dは3次元顕微鏡画像セグメンテーションのための自己教師あり学習に焦点を当てた第1回MICCAIチャレンジとして,今後もサポートし,拡張していく。
論文 参考訳(メタデータ) (2025-01-07T15:43:36Z) - PaPaGei: Open Foundation Models for Optical Physiological Signals [8.78925327256804]
光胸腺撮影は生体信号と心臓血管の健康をモニタリングする主要な非侵襲的手法である。
PPG信号に基づいて訓練された機械学習モデルは、タスク固有であり、一般化に苦慮する傾向がある。
PPG信号のための最初のオープン基盤モデルPaPaGeiを提案する。
論文 参考訳(メタデータ) (2024-10-27T18:18:06Z) - Omni6DPose: A Benchmark and Model for Universal 6D Object Pose Estimation and Tracking [9.365544189576363]
6D Object Pose Estimationは、大規模なデータセットの不足に悩まされているコンピュータビジョンにおいて、決定的に難しいタスクである。
本稿では,Omni6DPoseについて紹介する。Omni6DPoseは,オブジェクトのカテゴリ,大規模,多様性の多様性を特徴とするデータセットである。
我々は、SOTAカテゴリレベルのポーズ推定フレームワークの強化版であるGenPose++を紹介し、2つの重要な改善を取り入れた。
論文 参考訳(メタデータ) (2024-06-06T17:57:20Z) - Diffusion Facial Forgery Detection [56.69763252655695]
本稿では,顔に焦点をあてた拡散生成画像を対象とした包括的データセットであるDiFFを紹介する。
人体実験といくつかの代表的な偽造検出手法を用いて,DiFFデータセットの広範な実験を行った。
その結果、人間の観察者と自動検出者の2値検出精度は30%以下であることが判明した。
論文 参考訳(メタデータ) (2024-01-29T03:20:19Z) - Does complimentary information from multispectral imaging improve face
presentation attack detection? [2.8090476488905254]
プレゼンテーション攻撃検出(PAD)は、特に可視光スペクトルにおいて広く研究されている。
3種類の異なる人工物から得られた8種類のプレゼンテーションアーティファクトに対して構築したマルチスペクトル画像に基づくPADを提案する。
スコア融合法と画像融合法に基づくPADは優れた性能を示し, 提示品の検出にマルチスペクトルイメージングを用いることの重要性を示した。
論文 参考訳(メタデータ) (2023-11-20T07:04:46Z) - Next-generation Surgical Navigation: Marker-less Multi-view 6DoF Pose
Estimation of Surgical Instruments [66.74633676595889]
静止カメラとヘッドマウントカメラを組み合わせたマルチカメラ・キャプチャー・セットアップを提案する。
第2に,手術用ウェットラボと実際の手術用劇場で撮影された元脊椎手術のマルチビューRGB-Dビデオデータセットを公表した。
第3に,手術器具の6DoFポーズ推定の課題に対して,最先端のシングルビューとマルチビューの3つの手法を評価した。
論文 参考訳(メタデータ) (2023-05-05T13:42:19Z) - Wild Face Anti-Spoofing Challenge 2023: Benchmark and Results [73.98594459933008]
顔認証システム(FAS)は、顔認識システムの完全性を保護するための重要なメカニズムである。
この制限は、公開可能なFASデータセットの不足と多様性の欠如に起因する可能性がある。
制約のない環境で収集された大規模で多様なFASデータセットであるWild Face Anti-Spoofingデータセットを紹介した。
論文 参考訳(メタデータ) (2023-04-12T10:29:42Z) - Fingerprint Liveness Detection Based on Quality Measures [66.76480178498315]
新たな特徴セットは、完全なライブネス検出システムで使用され、LivDETコンペティションの開発セットでテストされている。
提案手法はマルチセンサのシナリオに対して堅牢であることが証明され、全体の93%が正しく分類されたサンプルである。
論文 参考訳(メタデータ) (2022-07-11T12:15:27Z) - Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。
グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。
当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文 参考訳(メタデータ) (2022-04-22T17:27:00Z) - GraspNet: A Large-Scale Clustered and Densely Annotated Dataset for
Object Grasping [49.777649953381676]
我々は,統合評価システムを用いた大規模グリップポーズ検出データセットに貢献する。
データセットには87,040枚のRGBD画像と3億7000万枚以上のグリップポーズが含まれている。
論文 参考訳(メタデータ) (2019-12-31T18:15:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。