論文の概要: Joint Spatial-Temporal Modeling and Contrastive Learning for Self-supervised Heart Rate Measurement
- arxiv url: http://arxiv.org/abs/2406.04942v1
- Date: Fri, 7 Jun 2024 13:53:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-10 13:51:43.650763
- Title: Joint Spatial-Temporal Modeling and Contrastive Learning for Self-supervised Heart Rate Measurement
- Title(参考訳): 自己監督型心拍計測のための共同空間時間モデルとコントラスト学習
- Authors: Wei Qian, Qi Li, Kun Li, Xinke Wang, Xiao Sun, Meng Wang, Dan Guo,
- Abstract要約: 本稿では,我々のチームであるHFUT-VUT(HFUT-VUT)による,自己監督型心拍数測定トラック1のソリューションについて紹介する。
目標は、ラベルなしの顔ビデオを用いた自己監督型心拍数生理学(HR)を開発することである。
提案手法は,テストデータセットのRMSEスコア8.85277を達成し,この課題のトラック1のbftext2位を確保した。
- 参考スコア(独自算出の注目度): 28.370473108391426
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper briefly introduces the solutions developed by our team, HFUT-VUT, for Track 1 of self-supervised heart rate measurement in the 3rd Vision-based Remote Physiological Signal Sensing (RePSS) Challenge hosted at IJCAI 2024. The goal is to develop a self-supervised learning algorithm for heart rate (HR) estimation using unlabeled facial videos. To tackle this task, we present two self-supervised HR estimation solutions that integrate spatial-temporal modeling and contrastive learning, respectively. Specifically, we first propose a non-end-to-end self-supervised HR measurement framework based on spatial-temporal modeling, which can effectively capture subtle rPPG clues and leverage the inherent bandwidth and periodicity characteristics of rPPG to constrain the model. Meanwhile, we employ an excellent end-to-end solution based on contrastive learning, aiming to generalize across different scenarios from complementary perspectives. Finally, we combine the strengths of the above solutions through an ensemble strategy to generate the final predictions, leading to a more accurate HR estimation. As a result, our solutions achieved a remarkable RMSE score of 8.85277 on the test dataset, securing \textbf{2nd place} in Track 1 of the challenge.
- Abstract(参考訳): 本稿では,IJCAI 2024で開催されている第3ビジョンベースリモート生理信号センシング(REPSS)チャレンジにおける,自己監督型心拍数測定のトラック1(HFUT-VUT)について,我々のチームが開発したソリューションを簡潔に紹介する。
目標は、ラベルなしの顔ビデオを用いた心拍数推定のための自己教師付き学習アルゴリズムを開発することである。
この課題に対処するために、空間時間モデルとコントラスト学習を統合した2つの自己教師型HR推定ソリューションを提案する。
具体的には、まず、空間時間モデルに基づく非エンドツーエンドのHR計測フレームワークを提案する。これは、微妙なrPPGの手がかりを効果的に捉え、rPPG固有の帯域幅と周期特性を利用してモデルを制約する。
一方、コントラスト学習に基づく優れたエンドツーエンドソリューションを採用し、相補的な視点から様々なシナリオを一般化することを目的としている。
最後に、上記の解の強みをアンサンブル戦略で組み合わせ、最終的な予測を生成し、より正確なHR推定を行う。
その結果,テストデータセット上でのRMSEスコア8.85277を達成し,その課題のトラック1の‘textbf{2 place}’を確保できた。
関連論文リスト
- A Time-Aware Approach to Early Detection of Anorexia: UNSL at eRisk 2024 [0.9208007322096532]
eRisk研究所は、Web上の早期リスク検出に関連する問題に対処することを目的としている。
研究グループは,CPI+DMCアプローチを定義し,両目標を独立に解決し,タイムアウェアアプローチによってタスク2を解決した。
ERDE50測定値とランキングベース測定値で優れた結果を得た結果,ERDE50の問題を解決する上での一貫性を実証した。
論文 参考訳(メタデータ) (2024-10-23T15:30:37Z) - ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T16:33:31Z) - Inter-slice Super-resolution of Magnetic Resonance Images by Pre-training and Self-supervised Fine-tuning [49.197385954021456]
臨床実践では、2次元磁気共鳴(MR)シーケンスが広く採用されている。個々の2次元スライスを積み重ねて3次元ボリュームを形成できるが、比較的大きなスライスススペーシングは可視化とその後の解析タスクに課題をもたらす可能性がある。
スライス間隔を低減するため,ディープラーニングに基づく超解像技術が広く研究されている。
現在のほとんどのソリューションは、教師付きトレーニングのために、かなりの数の高解像度と低解像度の画像を必要とするが、通常は現実のシナリオでは利用できない。
論文 参考訳(メタデータ) (2024-06-10T02:20:26Z) - Supervised Contrastive Learning based Dual-Mixer Model for Remaining
Useful Life Prediction [3.081898819471624]
Remaining Useful Life (RUL)予測は、現在の予測モーメントからデバイスの完全な障害までの残時間を正確に見積もることを目的としている。
従来のRUL予測手法における時間的特徴と空間的特徴の厳密結合の欠点を克服するため,Dual-Mixerモデルと呼ばれる空間的時間的特徴抽出器を提案する。
提案手法の有効性は,C-MAPSSデータセットに関する他の最新の研究結果との比較により検証した。
論文 参考訳(メタデータ) (2024-01-29T14:38:44Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - Embedding Temporal Convolutional Networks for Energy-Efficient PPG-Based
Heart Rate Monitoring [17.155316991045765]
Photoplethysmography (volution) センサーは非侵襲的で快適な心拍数モニタリングを可能にする。
モーションアーティファクト(MA)はモニタリングの精度に大きく影響を与え、皮膚とセンサーのインターフェースに高いばらつきをもたらす。
PPGに基づく人事推定のための計算軽量で頑健な深層学習手法を提案する。
PPGDaliaのMean Absolute Error(MAE)の3.84 Beats per Minute(BPM)という2つのベンチマークデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2022-03-01T17:04:28Z) - Self-Supervised Learning Framework for Remote Heart Rate Estimation
Using Spatiotemporal Augmentation [12.783744603679942]
近年の深層学習法では、顔画像を用いて心拍数をリモートで測定できることが示されている。
顔画像におけるリモートHR推定のための3次元自己教師型学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-07-16T04:00:13Z) - Two-Stream Consensus Network: Submission to HACS Challenge 2021
Weakly-Supervised Learning Track [78.64815984927425]
弱い監督による時間的行動ローカライゼーションの目標は、ビデオの興味ある動作を時間的に特定し、分類することである。
この課題では,2ストリームコンセンサスネットワーク(TSCN)を主要なフレームワークとして採用しています。
この課題では,本手法が今後の学術研究のベースラインとなることを期待して,第2位にランクインした。
論文 参考訳(メタデータ) (2021-06-21T03:36:36Z) - Semi-supervised Facial Action Unit Intensity Estimation with Contrastive
Learning [54.90704746573636]
提案手法では,手動でキーフレームを選択する必要はなく,2%の注釈付きフレームで最先端の結果を生成できる。
提案手法は, ランダムに選択したデータに対してわずか2%の費用で作業した場合に, 既存の手法よりも優れていることを実験的に検証した。
論文 参考訳(メタデータ) (2020-11-03T17:35:57Z) - AutoHR: A Strong End-to-end Baseline for Remote Heart Rate Measurement
with Neural Searching [76.4844593082362]
既存のエンド・ツー・エンドのネットワークが難易度が低い理由を考察し,アーキテクチャ・サーチ(NAS)を用いたリモートHR計測のための強力なベースラインを確立する。
総合的な実験は、時間内テストとクロスデータセットテストの両方で3つのベンチマークデータセットで実施される。
論文 参考訳(メタデータ) (2020-04-26T05:43:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。