論文の概要: Align the GAP: Prior-based Unified Multi-Task Remote Physiological Measurement Framework For Domain Generalization and Personalization
- arxiv url: http://arxiv.org/abs/2506.16160v1
- Date: Thu, 19 Jun 2025 09:17:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.014766
- Title: Align the GAP: Prior-based Unified Multi-Task Remote Physiological Measurement Framework For Domain Generalization and Personalization
- Title(参考訳): ドメインの一般化とパーソナライゼーションのための事前ベース統合マルチタスクリモート生理計測フレームワーク
- Authors: Jiyao Wang, Xiao Yang, Hao Lu, Dengbo He, Kaishun Wu,
- Abstract要約: MSSDtextbfG と TTPtextbfPriors (textbfGAP) をバイオメトリックスとリモート・フォトプレソグラフィーで統合したフレームワークを提案した。
MSSDGベンチマークを6つの公開データセット上でTTPAプロトコルに拡張し、完全なラベリングを備えた新しい実世界駆動データセットを導入しました。
- 参考スコア(独自算出の注目度): 13.53570294343287
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-source synsemantic domain generalization (MSSDG) for multi-task remote physiological measurement seeks to enhance the generalizability of these metrics and attracts increasing attention. However, challenges like partial labeling and environmental noise may disrupt task-specific accuracy. Meanwhile, given that real-time adaptation is necessary for personalized products, the test-time personalized adaptation (TTPA) after MSSDG is also worth exploring, while the gap between previous generalization and personalization methods is significant and hard to fuse. Thus, we proposed a unified framework for MSSD\textbf{G} and TTP\textbf{A} employing \textbf{P}riors (\textbf{GAP}) in biometrics and remote photoplethysmography (rPPG). We first disentangled information from face videos into invariant semantics, individual bias, and noise. Then, multiple modules incorporating priors and our observations were applied in different stages and for different facial information. Then, based on the different principles of achieving generalization and personalization, our framework could simultaneously address MSSDG and TTPA under multi-task remote physiological estimation with minimal adjustments. We expanded the MSSDG benchmark to the TTPA protocol on six publicly available datasets and introduced a new real-world driving dataset with complete labeling. Extensive experiments that validated our approach, and the codes along with the new dataset will be released.
- Abstract(参考訳): マルチタスクリモート生理計測のためのマルチソースシンセマンティックドメイン一般化(MSSDG)は、これらのメトリクスの一般化性を高め、注目を惹きつける。
しかし、部分的なラベリングや環境騒音といった課題はタスク固有の精度を損なう可能性がある。
一方、パーソナライズされた製品にはリアルタイム適応が不可欠であることを考えると、MSSDG後のテストタイムパーソナライズ適応(TTPA)も検討する価値がある。
そこで本研究では,バイオメトリックスとリモート光胸腺撮影(rPPG)において, \textbf{P}riors (\textbf{GAP}) を用いて, MSSD\textbf{G} と TTP\textbf{A} の統一フレームワークを提案する。
私たちはまず、顔ビデオから不変セマンティクス、個人のバイアス、ノイズに情報を絞った。
そして, 先行と観察を取り入れた複数のモジュールを, 異なる段階, 異なる顔情報に適用した。
そして、一般化とパーソナライゼーションの異なる原則に基づいて、最小限の調整でマルチタスクリモート生理的評価の下で、MSSDGとTTPAを同時に扱うことができる。
MSSDGベンチマークを6つの公開データセット上でTTPAプロトコルに拡張し、完全なラベリングを備えた新しい実世界駆動データセットを導入しました。
我々のアプローチを検証する大規模な実験と、新しいデータセットと共にコードがリリースされる。
関連論文リスト
- PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.243031514520794]
LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。
PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文 参考訳(メタデータ) (2025-05-06T15:18:38Z) - Towards Generalizable Scene Change Detection [4.527270266697462]
現在最先端のScene Change Detectionアプローチは、目に見えない環境と異なる時間条件下では信頼性が低い。
本稿では,未確認領域の性能と時間的整合性に対処するため,GeSCF(Generalizable Scene Change Detection Framework)を提案する。
GeSCFは、既存のSCDデータセットで平均19.2%、ChangeVPRデータセットで30.0%のパフォーマンス向上を達成した。
論文 参考訳(メタデータ) (2024-09-10T04:45:25Z) - Fully Test-Time rPPG Estimation via Synthetic Signal-Guided Feature Learning [8.901227918730562]
TestTime Adaptation (TTA)では、ソースデータを参照することなく、ラベルのないターゲットデータにオンライン適応することで、さまざまな未確認領域のr信号を適応的に推定することができる。
擬似基底真理として、擬似r信号を用いた合成信号誘導特徴学習法を開発し、潜在r特徴を生成する条件生成装置を誘導する。
論文 参考訳(メタデータ) (2024-07-18T09:22:40Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - PhysMLE: Generalizable and Priors-Inclusive Multi-task Remote Physiological Measurement [24.424510759648072]
本稿では,マルチタスク遠隔生理計測(PhysMLE)のためのローランクエキスパートのエンドツーエンド混合について述べる。
PhysMLEは、新しいルータ機構を持つ複数の低ランクの専門家に基づいており、モデルがタスク内の仕様と相関の両方を十分に扱えるようにしている。
公平かつ包括的な評価のために,マルチソース・シンセマンティック・ドメイン・ジェネリゼーション・プロトコルと呼ばれる大規模マルチタスク・ジェネリゼーション・ベンチマークを提案する。
論文 参考訳(メタデータ) (2024-05-10T02:36:54Z) - Test-Time Domain Generalization for Face Anti-Spoofing [60.94384914275116]
Face Anti-Spoofing (FAS) は、顔認識システムをプレゼンテーション攻撃から保護するために重要である。
本稿では,テストデータを活用してモデルの一般化性を高める新しいテスト時間領域一般化フレームワークについて紹介する。
テスト時間スタイル投影 (TTSP) とディバーススタイルシフトシミュレーション (DSSS) によって構成された本手法は, 目に見えないデータを領域空間に効果的に投影する。
論文 参考訳(メタデータ) (2024-03-28T11:50:23Z) - PhysFormer: Facial Video-based Physiological Measurement with Temporal
Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。
本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文 参考訳(メタデータ) (2021-11-23T18:57:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。