Fugu-MT 論文翻訳(概要): PhysMamba: State Space Duality Model for Remote Physiological Measurement

論文の概要: PhysMamba: State Space Duality Model for Remote Physiological Measurement

arxiv url: http://arxiv.org/abs/2408.01077v3
Date: Thu, 16 Jan 2025 02:08:47 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-17 16:36:31.500398
Title: PhysMamba: State Space Duality Model for Remote Physiological Measurement
Title（参考訳）: PhysMamba:リモート生理計測のための状態空間双対モデル
Authors: Zhixin Yan, Yan Zhong, Hongbin Xu, Wenjun Zhang, Shangru Yi, Lin Shu, Wenxiong Kang,
Abstract要約: リモート光胸腺撮影(remote Photoplethysmography, RBFC)は、顔画像から非接触的な生理的信号の抽出を可能にする。この研究は、リアルタイム遠隔医療を含む非接触型健康モニタリングの実践的応用の基盤となる。
参考スコア（独自算出の注目度）: 18.423806804725032
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Remote Photoplethysmography (rPPG) enables non-contact physiological signal extraction from facial videos, offering applications in psychological state analysis, medical assistance, and anti-face spoofing. However, challenges such as motion artifacts, lighting variations, and noise limit its real-world applicability. To address these issues, we propose PhysMamba, a novel dual-pathway time-frequency interaction model based on Synergistic State Space Duality (SSSD), which for the first time integrates state space models with attention mechanisms in a dual-branch framework. Combined with a Multi-Scale Query (MQ) mechanism, PhysMamba achieves efficient information exchange and enhanced feature representation, ensuring robustness under noisy and dynamic conditions. Experiments on PURE, UBFC-rPPG, and MMPD datasets demonstrate that PhysMamba outperforms state-of-the-art methods, offering superior accuracy and generalization. This work lays a strong foundation for practical applications in non-contact health monitoring, including real-time remote patient care.
Abstract（参考訳）: リモート光胸腺造影(remote Photoplethysmography, RPPG)は、顔画像から非接触的な生理的シグナルを抽出し、心理学的状態分析、医療支援、および対面スプーフィングに応用する。しかし、モーションアーティファクト、照明のバリエーション、ノイズといった課題は現実の応用性を制限している。これらの問題に対処するため、我々はSynergistic State Space Duality (SSSD)に基づく新しい双方向時間周波数相互作用モデルであるPhysMambaを提案する。マルチスケールクエリ(MQ)メカニズムと組み合わせることで、PhysMambaは効率的な情報交換と機能表現の強化を実現し、ノイズや動的条件下で堅牢性を確保する。 PURE、UBFC-rPPG、MMPDデータセットの実験により、PhysMambaは最先端の手法よりも優れ、精度と一般化が優れていることが示された。この研究は、リアルタイム遠隔医療を含む非接触型健康モニタリングの実践的応用の基盤となる。

関連論文リスト

Efficient and Robust Multidimensional Attention in Remote Physiological Sensing through Target Signal Constrained Factorization [7.947387272047604]
マルチモーダルビデオ入力からの光胸腺造影(rRSP)信号と呼吸(rRSP)信号の同時推定を目的とした,効率的なデュアルブランチ3D-CNNアーキテクチャであるMMRPhysを提案する。 TSFMを用いたMMRPhysは、リアルタイムアプリケーションに適した最小の推論レイテンシを維持しつつ、RRSP推定のための領域シフトの一般化において最先端の手法を著しく上回ることを示す。
論文参考訳（メタデータ） (2025-05-11T15:20:45Z)
PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.243031514520794]
LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。 PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文参考訳（メタデータ） (2025-05-06T15:18:38Z)
SkelMamba: A State Space Model for Efficient Skeleton Action Recognition of Neurological Disorders [14.304356695180005]
骨格に基づく人間行動認識のための新しい状態空間モデル(SSM)を提案する。本モデルでは,複数部位にわたる局所的な関節相互作用と大域的な運動パターンを捉える。この歩行認識分解は、診断において重要な微妙な動きパターンを識別する能力を高める。
論文参考訳（メタデータ） (2024-11-29T08:43:52Z)
Multimodal Physiological Signals Representation Learning via Multiscale Contrasting for Depression Recognition [18.65975882665568]
機能近赤外分光法(NIRS)や脳波法(EEG)などの生理的信号に基づく抑うつは大きな進歩を遂げている。本稿では,抑うつ認識のためのマルチスケールコントラストを用いたアーキテクチャを用いたマルチモーダル生理学的信号表現学習フレームワークを提案する。刺激タスクに関連する意味表現の学習を強化するために,意味コントラストモジュールを提案する。
論文参考訳（メタデータ） (2024-06-22T09:28:02Z)
Interpretable Spatio-Temporal Embedding for Brain Structural-Effective Network with Ordinary Differential Equation [56.34634121544929]
本研究では,まず動的因果モデルを用いて脳効果ネットワークを構築する。次に、STE-ODE(Spatio-Temporal Embedding ODE)と呼ばれる解釈可能なグラフ学習フレームワークを導入する。このフレームワークは、構造的および効果的なネットワーク間の動的相互作用を捉えることを目的とした、特異的に設計されたノード埋め込み層を含んでいる。
論文参考訳（メタデータ） (2024-05-21T20:37:07Z)
MS-MANO: Enabling Hand Pose Tracking with Biomechanical Constraints [50.61346764110482]
筋骨格系と学習可能なパラメトリックハンドモデルMANOを統合し,MS-MANOを作成する。このモデルは骨格系を駆動する筋肉と腱の力学をエミュレートし、結果として生じるトルク軌跡に生理学的に現実的な制約を与える。また,マルチ層パーセプトロンネットワークによる初期推定ポーズを改良する,ループ式ポーズ改善フレームワークBioPRを提案する。
論文参考訳（メタデータ） (2024-04-16T02:18:18Z)
Real-Time Model-Based Quantitative Ultrasound and Radar [65.268245109828]
本稿では,波動伝搬の物理モデルに基づくニューラルネットワークを提案し,受信信号と物理特性の関係を定義した。我々のネットワークは、複雑で現実的なシナリオのために、1秒未満で複数の物理的特性を再構築することができる。
論文参考訳（メタデータ） (2024-02-16T09:09:16Z)
AI-Aristotle: A Physics-Informed framework for Systems Biology Gray-Box Identification [1.8434042562191815]
本稿では,システム生物学におけるパラメータ推定と物理識別の欠如 (グレーボックス) のための新しい枠組みを提案する。提案するフレームワーク - AI-Aristotle は,EXtreme Theory of Functional Connection (X-TFC) ドメイン分割と物理インフォームドニューラルネットワーク (PINN) を組み合わせたものだ。システム生物学における2つのベンチマーク問題に基づいて,AI-Aristotleの精度,速度,柔軟性,堅牢性を検証した。
論文参考訳（メタデータ） (2023-09-29T14:45:51Z)
Physics-informed State-space Neural Networks for Transport Phenomena [0.0]
本研究は物理インフォームドステートスペースニューラルネットワークモデル(PSM)を紹介する。 PSMは、自律システムにおけるリアルタイム最適化、柔軟性、フォールトトレランスを達成するための新しいソリューションである。 PSMはデジタルツインの基盤として機能し、物理的システムのデジタル表現を常に更新する。
論文参考訳（メタデータ） (2023-09-21T16:14:36Z)
Dual-path TokenLearner for Remote Photoplethysmography-based Physiological Measurement with Facial Videos [24.785755814666086]
本稿では,学習可能なトークンの概念を利用して,ビデオのグローバルな視点から空間的・時間的情報的コンテキストを統合する。 TTL(Temporal TokenLearner)は、頭部運動などの時間的乱れを排除し、心拍の準周期パターンを推定するように設計されている。
論文参考訳（メタデータ） (2023-08-15T13:45:45Z)
PhysFormer++: Facial Video-based Physiological Measurement with SlowFast Temporal Difference Transformer [76.40106756572644]
最近のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙な手がかりのマイニングに重点を置いている。本稿では,PhysFormerとPhys++++をベースとした2つのエンドツーエンドビデオ変換器を提案する。 4つのベンチマークデータセットで総合的な実験を行い、時間内テストとクロスデータセットテストの両方において優れた性能を示す。
論文参考訳（メタデータ） (2023-02-07T15:56:03Z)
DRNet: Decomposition and Reconstruction Network for Remote Physiological Measurement [39.73408626273354]
既存の方法は一般に2つのグループに分けられる。 1つ目は、顔ビデオから微妙な音量パルス(BVP)信号を抽出することに焦点を当てているが、顔ビデオコンテンツを支配するノイズを明示的にモデル化することはめったにない。第二に、ノイズの多いデータを直接モデリングすることに焦点を当てており、これらの厳密なランダムノイズの規則性の欠如により、最適以下の性能が得られる。
論文参考訳（メタデータ） (2022-06-12T07:40:10Z)
PhysFormer: Facial Video-based Physiological Measurement with Temporal Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文参考訳（メタデータ） (2021-11-23T18:57:11Z)
Non-contact Pain Recognition from Video Sequences with Remote Physiological Measurements Prediction [53.03469655641418]
痛み認識のための非接触方式で外観変化と生理的手がかりの両方を符号化する新しいマルチタスク学習フレームワークを提案する。我々は、一般に利用可能な痛みデータベース上で、非接触痛認識の最先端性能を確立する。
論文参考訳（メタデータ） (2021-05-18T20:47:45Z)
Data-driven generation of plausible tissue geometries for realistic photoacoustic image synthesis [53.65837038435433]
光音響トモグラフィ(pat)は形態的および機能的組織特性を回復する可能性がある。我々は,PATデータシミュレーションの新たなアプローチを提案し,これを「シミュレーションの学習」と呼ぶ。我々は、意味的注釈付き医療画像データに基づいて訓練されたGAN(Generative Adversarial Networks)の概念を活用して、可塑性組織ジオメトリを生成する。
論文参考訳（メタデータ） (2021-03-29T11:30:18Z)
Video-based Remote Physiological Measurement via Cross-verified Feature Disentangling [121.50704279659253]
非生理的表現と生理的特徴を混同するための横断的特徴分離戦略を提案する。次に, 蒸留された生理特性を用いて, 頑健なマルチタスク生理測定を行った。歪んだ特徴は、最終的に平均HR値やr信号のような複数の生理的信号の合同予測に使用される。
論文参考訳（メタデータ） (2020-07-16T09:39:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。