論文の概要: PhysBench: A Benchmark Framework for rPPG with a New Dataset and
Baseline
- arxiv url: http://arxiv.org/abs/2305.04161v2
- Date: Sun, 3 Sep 2023 16:27:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-07 05:24:27.349899
- Title: PhysBench: A Benchmark Framework for rPPG with a New Dataset and
Baseline
- Title(参考訳): PhysBench: 新しいデータセットとベースラインを備えたrPPG用のベンチマークフレームワーク
- Authors: Kegang Wang, Yantao Wei, Mingwen Tong, Jie Gao, Yi Tian, YuJian Ma,
ZhongJin Zhao
- Abstract要約: 顔画像から生理的信号を回復するための、完全かつ効率的なエンドツーエンドトレーニングおよびテストフレームワークを提案する。
データセットには、58人の被験者による32時間(3.53Mフレーム)のビデオが含まれている。
- 参考スコア(独自算出の注目度): 8.857250526608954
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In recent years, due to the widespread use of internet videos, physiological
remote sensing has gained more and more attention in the fields of affective
computing and telemedicine. Recovering physiological signals from facial videos
is a challenging task that involves a series of preprocessing, image
algorithms, and post-processing to finally restore waveforms. We propose a
complete and efficient end-to-end training and testing framework that provides
fair comparisons for different algorithms through unified preprocessing and
post-processing. In addition, we introduce a highly synchronized lossless
format dataset along with a lightweight algorithm. The dataset contains over 32
hours (3.53M frames) of video from 58 subjects; by training on our collected
dataset both our proposed algorithm as well as existing ones can achieve
improvements.
- Abstract(参考訳): 近年,インターネットビデオの普及により,感情コンピューティングや遠隔医療の分野で生理的リモートセンシングが注目されている。
顔の映像から生理学的シグナルを復元することは、前処理、画像アルゴリズム、そして波形を復元する後処理の一連の課題である。
本稿では,統一前処理と後処理によって異なるアルゴリズムを公平に比較可能な,完全かつ効率的なエンドツーエンドのトレーニングおよびテストフレームワークを提案する。
さらに、軽量なアルゴリズムとともに、高度に同期されたロスレスフォーマットデータセットを導入する。
データセットには58名の被験者による32時間(3.53mフレーム)以上のビデオが含まれている。
関連論文リスト
- A New Real-World Video Dataset for the Comparison of Defogging
Algorithms [45.023332704223755]
我々は, 霧の密度や地底の真実を無霧で比較するために, 新たなReal-world VIdeoデータセットを提案する。
ビデオデフォッギングアルゴリズムも言及されており、時間的冗長性を利用してアーチファクトを最小化し、フレーム間の露出変動を最小化するというキーアイデアがある。
様々なアプリケーションのためのディープラーニングにおけるTransformersアーキテクチャの成功に触発されて、ニューラルネットワークでこの種のアーキテクチャを選択し、提案したデータセットの関連性を示す。
論文 参考訳(メタデータ) (2023-10-02T09:12:39Z) - TempNet: Temporal Attention Towards the Detection of Animal Behaviour in
Videos [63.85815474157357]
本稿では,映像中の生物学的行動を検出するための,効率的なコンピュータビジョンと深層学習に基づく手法を提案する。
TempNetはエンコーダブリッジと残留ブロックを使用して、2段階の空間的、そして時間的、エンコーダでモデル性能を維持する。
本研究では,サブルフィッシュ (Anoplopoma fimbria) 幼虫の検出への応用を実証する。
論文 参考訳(メタデータ) (2022-11-17T23:55:12Z) - Neural Maximum A Posteriori Estimation on Unpaired Data for Motion
Deblurring [87.97330195531029]
本稿では、ニューラルネットワークをトレーニングし、失明したデータから視覚情報や鋭いコンテンツを復元するためのニューラルネットワークの最大Aポストエリオリ(NeurMAP)推定フレームワークを提案する。
提案されたNeurMAPは、既存のデブロアリングニューラルネットワークに対するアプローチであり、未使用データセット上のイメージデブロアリングネットワークのトレーニングを可能にする最初のフレームワークである。
論文 参考訳(メタデータ) (2022-04-26T08:09:47Z) - GAN-Supervised Dense Visual Alignment [95.37027391102684]
本稿では,識別モデル学習のためのフレームワークであるGAN-Supervised Learningと,GAN生成した学習データをエンドツーエンドで共同で学習する手法を提案する。
従来のCongealing法にインスパイアされた我々のGANgealingアルゴリズムは、Spatial Transformerを訓練し、不整合データに基づいて訓練されたGANのランダムなサンプルを共通の目標モードにマッピングする。
論文 参考訳(メタデータ) (2021-12-09T18:59:58Z) - VideoPose: Estimating 6D object pose from videos [14.210010379733017]
我々は、畳み込みニューラルネットワークを用いて、ビデオから直接オブジェクトのポーズを推定する、単純だが効果的なアルゴリズムを導入する。
提案するネットワークは、トレーニング済みの2Dオブジェクト検出器を入力として、リカレントニューラルネットワークを介して視覚的特徴を集約し、各フレームで予測を行う。
YCB-Videoデータセットの実験的評価から,本手法は最先端のアルゴリズムと同等であることがわかった。
論文 参考訳(メタデータ) (2021-11-20T20:57:45Z) - Are we ready for beyond-application high-volume data? The Reeds robot
perception benchmark dataset [3.781421673607643]
本稿ではロボット認識アルゴリズムの研究のためにReedsと呼ばれるデータセットを提案する。
このデータセットは、アプリケーション固有のソリューションをテストする環境を提供するのではなく、アルゴリズムに要求されるベンチマーク機会を提供することを目的としている。
論文 参考訳(メタデータ) (2021-09-16T23:21:42Z) - TEACHTEXT: CrossModal Generalized Distillation for Text-Video Retrieval [103.85002875155551]
本研究では,大規模言語前訓練を利用した一般化蒸留法TeachTextを提案する。
提案手法をビデオ側モダリティに拡張し,テスト時に使用するモダリティの数を効果的に削減できることを示す。
提案手法は,いくつかのビデオ検索ベンチマークの精度を著しく向上させ,テスト時の計算オーバーヘッドを増加させない。
論文 参考訳(メタデータ) (2021-04-16T17:55:28Z) - Fast ultrasonic imaging using end-to-end deep learning [1.0266286487433585]
ディープニューラルネットワーク(DNN)は、データ前処理とイメージ後処理のステップを別々に使用する。
エンド・ツー・エンドのトレーニングを実現するために,3つのステップをすべて統合した新しいディープラーニングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-04T13:53:46Z) - Improving Deep Stereo Network Generalization with Geometric Priors [93.09496073476275]
地上の真実が密集した多様な現実世界のシーンの大規模なデータセットを得ることは困難である。
多くのアルゴリズムは、似たようなシーンや合成データセットの小さな実世界のデータセットに依存している。
本稿では,シーン幾何学の事前知識をエンド・ツー・エンドのステレオネットワークに統合し,ネットワークの一般化を支援することを提案する。
論文 参考訳(メタデータ) (2020-08-25T15:24:02Z) - Human Body Model Fitting by Learned Gradient Descent [48.79414884222403]
画像に3次元の人体形状を適合させる新しいアルゴリズムを提案する。
このアルゴリズムは高速(約120ms収束)で、データセットに頑健であり、公開評価データセットの最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2020-08-19T14:26:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。