論文の概要: PhySU-Net: Long Temporal Context Transformer for rPPG with
Self-Supervised Pre-training
- arxiv url: http://arxiv.org/abs/2402.11913v1
- Date: Mon, 19 Feb 2024 07:59:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-20 17:37:58.902084
- Title: PhySU-Net: Long Temporal Context Transformer for rPPG with
Self-Supervised Pre-training
- Title(参考訳): PhySU-Net: 自己教師付き事前学習によるrPPGの長期文脈変換器
- Authors: Marko Savic, Guoying Zhao
- Abstract要約: 本稿では,Phy-Net,Phy-Net,Phy-Net,Phy-Net,Phy-Net,Phy-Net,Phy-Netを提案する。
我々のモデルは2つの公開データセット(OBFとVIPL-HR)でテストされ、教師あり訓練において優れた性能を示す。
- 参考スコア(独自算出の注目度): 21.521146237660766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote photoplethysmography (rPPG) is a promising technology that consists of
contactless measuring of cardiac activity from facial videos. Most recent
approaches utilize convolutional networks with limited temporal modeling
capability or ignore long temporal context. Supervised rPPG methods are also
severely limited by scarce data availability. In this work, we propose
PhySU-Net, the first long spatial-temporal map rPPG transformer network and a
self-supervised pre-training strategy that exploits unlabeled data to improve
our model. Our strategy leverages traditional methods and image masking to
provide pseudo-labels for self-supervised pre-training. Our model is tested on
two public datasets (OBF and VIPL-HR) and shows superior performance in
supervised training. Furthermore, we demonstrate that our self-supervised
pre-training strategy further improves our model's performance by leveraging
representations learned from unlabeled data.
- Abstract(参考訳): 遠隔胸部CT(remote Photoplethysmography, RPPG)は, 顔画像からの心臓活動の非接触計測技術である。
最近のアプローチでは、時間的モデリング能力に制限のある畳み込みネットワークを使用するか、長い時間的文脈を無視する。
監視されたrPPGメソッドも、データ可用性の不足によって大幅に制限されている。
本研究では,最初の空間時空間マップrppgトランスフォーマーネットワークであるphysu-netと,ラベルなしデータを利用してモデルを改善する自己教師あり事前学習戦略を提案する。
従来の手法と画像マスキングを活用し,自己教師付き事前学習のための擬似ラベルを提供する。
我々のモデルは2つの公開データセット(OBFとVIPL-HR)でテストされ、教師あり訓練において優れた性能を示す。
さらに,ラベルなしデータから学習した表現を活用し,自己教師付き事前学習戦略により,モデルの性能がさらに向上することを示す。
関連論文リスト
- Continual Learning for Remote Physiological Measurement: Minimize Forgetting and Simplify Inference [4.913049603343811]
既存のr測定手法は、しばしば漸進的な学習シナリオを見落としている。
既存のクラスインクリメンタルな学習アプローチはr測定には適していない。
r測定のための連続学習に取り組むためにADDPという新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-19T01:49:09Z) - GPT-ST: Generative Pre-Training of Spatio-Temporal Graph Neural Networks [24.323017830938394]
この作業は、ベースラインとシームレスに統合し、パフォーマンスを向上する事前トレーニングフレームワークを導入することで、課題に対処することを目的としている。
フレームワークは2つの重要な設計に基づいて構築されている。
Apple-to-appleマスクオートエンコーダは、学習時間依存のための事前トレーニングモデルである。
これらのモジュールは、時間内カスタマイズされた表現とセマンティック・クラスタ間関係を捉えるように設計されている。
論文 参考訳(メタデータ) (2023-11-07T02:36:24Z) - Temporal DINO: A Self-supervised Video Strategy to Enhance Action
Prediction [15.696593695918844]
本稿では、DINOにインスパイアされた行動予測(ラベルのない自己蒸留)を強化するための、新しい自己教師型ビデオ戦略を提案する。
実験結果は、3D-ResNet、Transformer、LSTMアーキテクチャで予測性能が大幅に向上したことを示している。
これらの知見は,行動認識,運動計画,シーン理解など,多様な映像ベースタスクにおけるアプローチの可能性を強調した。
論文 参考訳(メタデータ) (2023-08-08T21:18:23Z) - In-Domain Self-Supervised Learning Improves Remote Sensing Image Scene
Classification [5.323049242720532]
リモートセンシング画像分類のための有望なアプローチとして,自己教師付き学習が登場している。
そこで本研究では,14の下流データセットにまたがる自己教師型事前学習戦略について検討し,その効果を評価する。
論文 参考訳(メタデータ) (2023-07-04T10:57:52Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - PhysFormer: Facial Video-based Physiological Measurement with Temporal
Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。
本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文 参考訳(メタデータ) (2021-11-23T18:57:11Z) - Regularizing Generative Adversarial Networks under Limited Data [88.57330330305535]
本研究は、限られたデータ上で堅牢なGANモデルをトレーニングするための正規化手法を提案する。
正規化損失とLeCam-divergenceと呼ばれるf-divergenceの関連性を示す。
論文 参考訳(メタデータ) (2021-04-07T17:59:06Z) - Semi-supervised Facial Action Unit Intensity Estimation with Contrastive
Learning [54.90704746573636]
提案手法では,手動でキーフレームを選択する必要はなく,2%の注釈付きフレームで最先端の結果を生成できる。
提案手法は, ランダムに選択したデータに対してわずか2%の費用で作業した場合に, 既存の手法よりも優れていることを実験的に検証した。
論文 参考訳(メタデータ) (2020-11-03T17:35:57Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Improving Semantic Segmentation via Self-Training [75.07114899941095]
半教師付きアプローチ,特に自己学習パラダイムを用いて,最先端の成果を得ることができることを示す。
まず、ラベル付きデータに基づいて教師モデルを訓練し、次にラベルなしデータの大規模なセット上で擬似ラベルを生成する。
私たちの堅牢なトレーニングフレームワークは、人名と擬似ラベルを共同で消化し、Cityscapes、CamVid、KITTIデータセット上で最高のパフォーマンスを達成することができます。
論文 参考訳(メタデータ) (2020-04-30T17:09:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。