論文の概要: Toward Motion Robustness: A masked attention regularization framework in remote photoplethysmography
- arxiv url: http://arxiv.org/abs/2407.06653v1
- Date: Tue, 9 Jul 2024 08:25:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-10 18:46:17.677089
- Title: Toward Motion Robustness: A masked attention regularization framework in remote photoplethysmography
- Title(参考訳): 運動ロバストネスに向けて:リモート光胸腺撮影におけるマスク付き注意規則化フレームワーク
- Authors: Pengfei Zhao, Qigong Sun, Xiaolin Tian, Yige Yang, Shuo Tao, Jie Cheng, Jiantong Chen,
- Abstract要約: MAR-rはROIローカライゼーションと複雑なモーションアーティファクトの影響を統合するフレームワークである。
MAR-rは、顔クリップのセマンティック一貫性を捉えるために、マスクされた注意規則化機構をrフィールドに採用している。
また、モデルが不正確なROIに過度に適合し、その後パフォーマンスが低下するのを防ぐために、マスキング技術を採用している。
- 参考スコア(独自算出の注目度): 5.743550396843244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There has been growing interest in facial video-based remote photoplethysmography (rPPG) measurement recently, with a focus on assessing various vital signs such as heart rate and heart rate variability. Despite previous efforts on static datasets, their approaches have been hindered by inaccurate region of interest (ROI) localization and motion issues, and have shown limited generalization in real-world scenarios. To address these challenges, we propose a novel masked attention regularization (MAR-rPPG) framework that mitigates the impact of ROI localization and complex motion artifacts. Specifically, our approach first integrates a masked attention regularization mechanism into the rPPG field to capture the visual semantic consistency of facial clips, while it also employs a masking technique to prevent the model from overfitting on inaccurate ROIs and subsequently degrading its performance. Furthermore, we propose an enhanced rPPG expert aggregation (EREA) network as the backbone to obtain rPPG signals and attention maps simultaneously. Our EREA network is capable of discriminating divergent attentions from different facial areas and retaining the consistency of spatiotemporal attention maps. For motion robustness, a simple open source detector MediaPipe for data preprocessing is sufficient for our framework due to its superior capability of rPPG signal extraction and attention regularization. Exhaustive experiments on three benchmark datasets (UBFC-rPPG, PURE, and MMPD) substantiate the superiority of our proposed method, outperforming recent state-of-the-art works by a considerable margin.
- Abstract(参考訳): 近年, 心拍数や心拍変動など, 種々の重要な指標を評価することに焦点を当て, 顔画像を用いた遠隔胸部CT(rPPG)測定への関心が高まっている。
静的データセットに対するこれまでの取り組みにもかかわらず、それらのアプローチは、関心領域(ROI)の非正確なローカライゼーションと動きの問題によって妨げられ、現実のシナリオでは限定的な一般化が示されてきた。
これらの課題に対処するために、ROI局在化と複雑な動きアーティファクトの影響を緩和する新しいマスキングアテンション正規化(MAR-rPPG)フレームワークを提案する。
具体的には、まず、マスク付き注意規則化機構をrPPGフィールドに統合し、顔クリップの視覚的意味的一貫性を捉えるとともに、モデルが不正確なROIに過度に収まらないようマスキング技術を用いて、その性能を劣化させる。
さらに,RPPG信号とアテンションマップを同時に取得するために,拡張rPPG専門家アグリゲーション(EREA)ネットワークをバックボーンとして提案する。
我々のEREAネットワークは、異なる顔領域から異なる注意を識別し、時空間の注意マップの一貫性を維持することができる。
データ前処理のための単純なオープンソース検出器MediaPipeは,rPPG信号抽出とアテンション正規化の優れた性能のために,我々のフレームワークに十分である。
3つのベンチマークデータセット(UBFC-rPPG, PURE, MMPD)に対する被曝実験は,提案手法の優位性を裏付けるものである。
関連論文リスト
- FactorizePhys: Matrix Factorization for Multidimensional Attention in Remote Physiological Sensing [10.81951503398909]
Factorized Self-Attention Module (FSAM) は、非負行列分解を用いたボクセル埋め込みから多次元の注意を計算する。
提案手法は,空間的,時間的,チャネル的注意を包括的に獲得し,一般的な信号抽出の性能を高めるために,ボクセルの埋め込みを適応的に分解する。
FactorizePhysは、生のビデオフレームから血流パルス信号を推定するためのエンドツーエンドの3D-CNNアーキテクチャである。
論文 参考訳(メタデータ) (2024-11-03T12:22:58Z) - SQUWA: Signal Quality Aware DNN Architecture for Enhanced Accuracy in Atrial Fibrillation Detection from Noisy PPG Signals [37.788535094404644]
心房細動(AF)は脳卒中、心臓病、死亡のリスクを著しく増大させる。
光胸腺造影(PPG)信号は、運動人工物や、しばしば起立条件で遭遇する他の要因による腐敗に影響を受けやすい。
本研究では,一部劣化したPSGから正確な予測の維持方法を学習するための新しい深層学習モデルを提案する。
論文 参考訳(メタデータ) (2024-04-15T01:07:08Z) - Attention Consistency Refined Masked Frequency Forgery Representation
for Generalizing Face Forgery Detection [96.539862328788]
既存の偽造検出方法は、未確認領域の真正性を決定する不満足な一般化能力に悩まされている。
ACMF(Attention Consistency Refined masked frequency forgery representation model)を提案する。
いくつかのパブリックフェイスフォージェリーデータセットの実験結果から,提案手法の性能は最先端の手法と比較して優れていることが示された。
論文 参考訳(メタデータ) (2023-07-21T08:58:49Z) - Sequential Attention Source Identification Based on Feature
Representation [88.05527934953311]
本稿では,テンポラルシーケンスに基づくグラフ注意源同定(TGASI)と呼ばれるシーケンス・ツー・シーケンス・ベースのローカライズ・フレームワークを提案する。
なお、このインダクティブラーニングのアイデアは、TGASIが他の事前の知識を知らずに新しいシナリオのソースを検出できることを保証する。
論文 参考訳(メタデータ) (2023-06-28T03:00:28Z) - Mask Attack Detection Using Vascular-weighted Motion-robust rPPG Signals [21.884783786547782]
R-based face anti-spoofing method は、しばしばビデオシーケンスの不安定な顔アライメントによる性能劣化に悩まされる。
SIFTキーポイントと顔ランドマークの両方を用いて, 顔の鮮明かつ正確に画素レベルで整列するランドマークアンコール顔縫合法を提案する。
Gated Recurrent Unit (GRU) を備えた軽量なEfficientNetは、分類のための空間的特徴と時間的特徴の両方を抽出するように設計されている。
論文 参考訳(メタデータ) (2023-05-25T11:22:17Z) - PS-ARM: An End-to-End Attention-aware Relation Mixer Network for Person
Search [56.02761592710612]
モジュール・パーソン・サーチのための新しいアテンション・アウェア・リレーション・ミキサー(ARM)を提案する。
私たちのARMモジュールはネイティブで、きめ細かい監督やトポロジカルな仮定に依存していません。
我々のPS-ARMは、両方のデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-10-07T10:04:12Z) - ScoreNet: Learning Non-Uniform Attention and Augmentation for
Transformer-Based Histopathological Image Classification [11.680355561258427]
高解像度画像はデジタル病理の進歩を妨げる。
パッチベースの処理は、しばしば複数のインスタンス学習(MIL)を組み込んで、画像レベルの予測をもたらす局所的なパッチレベルの表現を集約する。
本稿では,組織像分類に適したトランスフォーマーアーキテクチャを提案する。
局所的なきめ細かな注意と粗いグローバルな注意機構を組み合わせることで、高解像度画像の意味的な表現を効率的な計算コストで学習する。
論文 参考訳(メタデータ) (2022-02-15T16:55:09Z) - Robust and Precise Facial Landmark Detection by Self-Calibrated Pose
Attention Network [73.56802915291917]
より堅牢で正確な顔のランドマーク検出を実現するための半教師付きフレームワークを提案する。
より効果的な顔形状制約をモデル化するために,境界対応ランドマーク強度(BALI)フィールドを提案する。
自己キャリブレーション・ポース・アテンション(SCPA)モデルは、中間的監督を強制する自己学習型目標関数を提供するように設計されている。
論文 参考訳(メタデータ) (2021-12-23T02:51:08Z) - MC-LCR: Multi-modal contrastive classification by locally correlated
representations for effective face forgery detection [11.124150983521158]
局所的関連表現を用いたマルチモーダルコントラスト分類法を提案する。
我々のMC-LCRは、空間領域と周波数領域の両方から真偽顔と偽顔の暗黙の局所的不一致を増幅することを目的としている。
我々は最先端の性能を達成し,本手法の堅牢性と一般化を実証する。
論文 参考訳(メタデータ) (2021-10-07T09:24:12Z) - Local Relation Learning for Face Forgery Detection [73.73130683091154]
局所的関係学習による顔の偽造検出の新たな視点を提案する。
具体的には,局所的な特徴間の類似度を測定するMPSM(Multi-scale Patch similarity Module)を提案する。
また、より包括的な局所特徴表現のために、RGBおよび周波数領域の情報を融合するRGB-Frequency Attention Module (RFAM)を提案する。
論文 参考訳(メタデータ) (2021-05-06T10:44:32Z) - Unsupervised Instance Segmentation in Microscopy Images via Panoptic
Domain Adaptation and Task Re-weighting [86.33696045574692]
病理組織像における教師なし核分割のためのCycle Consistency Panoptic Domain Adaptive Mask R-CNN(CyC-PDAM)アーキテクチャを提案する。
まず,合成画像中の補助的な生成物を除去するための核塗布機構を提案する。
第二に、ドメイン識別器を持つセマンティックブランチは、パンプトレベルのドメイン適応を実現するように設計されている。
論文 参考訳(メタデータ) (2020-05-05T11:08:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。