論文の概要: Advancing Generalizable Remote Physiological Measurement through the
Integration of Explicit and Implicit Prior Knowledge
- arxiv url: http://arxiv.org/abs/2403.06947v1
- Date: Mon, 11 Mar 2024 17:33:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-12 17:56:46.082859
- Title: Advancing Generalizable Remote Physiological Measurement through the
Integration of Explicit and Implicit Prior Knowledge
- Title(参考訳): 明示的・暗黙的事前知識の統合による総合的遠隔生理計測の促進
- Authors: Yuting Zhang, Hao Lu, Xin Liu, Yingcong Chen, Kaishun Wu
- Abstract要約: リモート光胸腺撮影(remote photoplethysmography、r)は、顔ビデオから生理的信号をキャプチャする有望な技術である。
既存の方法の多くは r の事前の知識を見落としており、結果として一般化能力は劣る。
本稿では,rタスクにおける暗黙的,暗黙的な事前知識手法を同時に活用する新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 30.31568804817144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote photoplethysmography (rPPG) is a promising technology that captures
physiological signals from face videos, with potential applications in medical
health, emotional computing, and biosecurity recognition. The demand for rPPG
tasks has expanded from demonstrating good performance on intra-dataset testing
to cross-dataset testing (i.e., domain generalization). However, most existing
methods have overlooked the prior knowledge of rPPG, resulting in poor
generalization ability. In this paper, we propose a novel framework that
simultaneously utilizes explicit and implicit prior knowledge in the rPPG task.
Specifically, we systematically analyze the causes of noise sources (e.g.,
different camera, lighting, skin types, and movement) across different domains
and incorporate these prior knowledge into the network. Additionally, we
leverage a two-branch network to disentangle the physiological feature
distribution from noises through implicit label correlation. Our extensive
experiments demonstrate that the proposed method not only outperforms
state-of-the-art methods on RGB cross-dataset evaluation but also generalizes
well from RGB datasets to NIR datasets. The code is available at
https://github.com/keke-nice/Greip.
- Abstract(参考訳): 遠隔プラチスモグラフィー(remote photoplethysmography, RPPG)は、顔ビデオから生理的信号を捉え、医療、感情コンピューティング、バイオセキュリティ認識などに応用できる有望な技術である。
rPPGタスクの需要は、データセット内テストにおける優れた性能を示すものから、クロスデータセットテスト(ドメイン一般化)まで拡大している。
しかし、既存のほとんどの手法は、rPPGの以前の知識を見落としており、一般化能力は劣っている。
本稿では,rPPGタスクにおける暗黙的,暗黙的な事前知識を同時に活用する新しいフレームワークを提案する。
具体的には,様々な領域にまたがるノイズ源(カメラ,照明,スキンタイプ,移動など)の原因を系統的に解析し,これらの知識をネットワークに取り入れる。
さらに,2分岐ネットワークを用いて,暗黙のラベル相関により,雑音から生理的特徴分布を分離する。
実験により,提案手法はRGBのクロスデータセット評価において最先端の手法より優れているだけでなく,RGBのデータセットからNIRのデータセットまでよく一般化できることを示した。
コードはhttps://github.com/keke-nice/greipで入手できる。
関連論文リスト
- EAPCR: A Universal Feature Extractor for Scientific Data without Explicit Feature Relation Patterns [11.699722328870955]
明示的な特徴関係パターン(FRP)を持たないデータのための普遍的特徴抽出装置EAPCRを紹介する。
さまざまな科学的タスクでテストされたEAPCRは、従来の手法を一貫して上回り、ディープラーニングモデルが不足するギャップを埋める。
論文 参考訳(メタデータ) (2024-11-12T20:15:32Z) - Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - A Bipartite Graph is All We Need for Enhancing Emotional Reasoning with
Commonsense Knowledge [16.410940528107115]
両部不均一グラフ(BHG)を用いて,コモンセンス知識による感情的推論を強化する手法を提案する。
BHGベースの知識注入は、直接、多種多粒な知識ソースに一般化することができる。
論文 参考訳(メタデータ) (2023-08-09T09:09:17Z) - Remote Bio-Sensing: Open Source Benchmark Framework for Fair Evaluation
of rPPG [2.82697733014759]
r(pg photoplethysmography)は、カメラで捉えたヘモグロビンの光吸収特性を用いてBVP(Blood Volume Pulse)を測定し、分析する技術である。
本研究は,多種多様なデータセットを対象とした様々なrベンチマーク手法の評価を行い,妥当性評価と比較を行うためのフレームワークを提供することを目的とする。
論文 参考訳(メタデータ) (2023-07-24T09:35:47Z) - rPPG-MAE: Self-supervised Pre-training with Masked Autoencoders for
Remote Physiological Measurement [36.54109704201048]
リモート光胸腺撮影(r-MAE)はヒトのバイタルサインを知覚する重要な技術である。
本稿では,生理的信号に先行する自己相似性を抽出する自己教師型フレームワークを開発する。
また,提案手法をPUREとUBFC-rという2つの公開データセット上で評価した。
論文 参考訳(メタデータ) (2023-06-04T08:53:28Z) - DRNet: Decomposition and Reconstruction Network for Remote Physiological
Measurement [39.73408626273354]
既存の方法は一般に2つのグループに分けられる。
1つ目は、顔ビデオから微妙な音量パルス(BVP)信号を抽出することに焦点を当てているが、顔ビデオコンテンツを支配するノイズを明示的にモデル化することはめったにない。
第二に、ノイズの多いデータを直接モデリングすることに焦点を当てており、これらの厳密なランダムノイズの規則性の欠如により、最適以下の性能が得られる。
論文 参考訳(メタデータ) (2022-06-12T07:40:10Z) - Dual Swin-Transformer based Mutual Interactive Network for RGB-D Salient
Object Detection [67.33924278729903]
本研究では,Dual Swin-Transformerを用いたMutual Interactive Networkを提案する。
視覚入力における長距離依存をモデル化するために,RGBと奥行きモードの両方の機能抽出器としてSwin-Transformerを採用している。
5つの標準RGB-D SODベンチマークデータセットに関する総合的な実験は、提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2022-06-07T08:35:41Z) - Complex-valued Federated Learning with Differential Privacy and MRI Applications [51.34714485616763]
複雑な値を持つガウスのメカニズムを導入し、その振る舞いは$f$-DP、$(varepsilon, delta)$-DP、R'enyi-DPで特徴づけられる。
本稿では,DPと互換性のある複雑なニューラルネットワークプリミティブを提案する。
実験では,実世界の課題に対して,DPを用いた複合数値ニューラルネットワークを訓練することで概念実証を行う。
論文 参考訳(メタデータ) (2021-10-07T14:03:00Z) - Signal Processing and Machine Learning Techniques for Terahertz Sensing:
An Overview [89.09270073549182]
テラヘルツ(THz)信号生成と放射法は、無線システムの未来を形作っている。
THz 固有の信号処理技術は、THz 帯域の効率的な利用のために、この THz センシングへの関心を補う必要がある。
本稿では,信号前処理に着目した手法の概要を示す。
また,THz帯で有望な知覚能力を探索し,深層学習の有効性についても検討した。
論文 参考訳(メタデータ) (2021-04-09T01:38:34Z) - SumGNN: Multi-typed Drug Interaction Prediction via Efficient Knowledge
Graph Summarization [64.56399911605286]
本稿では,サブグラフ抽出モジュールによって実現された知識要約グラフニューラルネットワークSumGNNを提案する。
SumGNNは5.54%まで最高のベースラインを上回り、データ関係の低いタイプでは特にパフォーマンスの向上が顕著である。
論文 参考訳(メタデータ) (2020-10-04T00:14:57Z) - Opportunities and Challenges of Deep Learning Methods for
Electrocardiogram Data: A Systematic Review [62.490310870300746]
心電図(Electrocardiogram、ECG)は、医学および医療において最も一般的に用いられる診断ツールの1つである。
深層学習法は心電図信号を用いた予測医療タスクにおいて有望な結果を得た。
本稿では、モデリングとアプリケーションの観点から、ECGデータに対するディープラーニング手法の体系的なレビューを行う。
論文 参考訳(メタデータ) (2019-12-28T02:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。