論文の概要: CardiacMamba: A Multimodal RGB-RF Fusion Framework with State Space Models for Remote Physiological Measurement
- arxiv url: http://arxiv.org/abs/2502.13624v1
- Date: Wed, 19 Feb 2025 11:00:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-20 13:59:50.629126
- Title: CardiacMamba: A Multimodal RGB-RF Fusion Framework with State Space Models for Remote Physiological Measurement
- Title(参考訳): CardiacMamba: リモート生理計測のための状態空間モデルを用いた多モードRGB-RF核融合フレームワーク
- Authors: Zheng Wu, Yiping Xie, Bo Zhao, Jiguang He, Fei Luo, Ning Deng, Zitong Yu,
- Abstract要約: 遠隔光麻痺(rPl)による心拍数(HR)推定は、健康モニタリングに非侵襲的な解決策を提供する。
従来の単一モダリティアプローチ(RGBまたはRF)は、照明のバリエーション、モーションアーティファクト、皮膚のトーンバイアスによるロバストさと精度のバランスをとる上で、課題に直面している。
両モードの相補的強度を利用するマルチモーダルRGB-RF融合フレームワークであるCardiacMambaを提案する。
- 参考スコア(独自算出の注目度): 24.511384674989223
- License:
- Abstract: Heart rate (HR) estimation via remote photoplethysmography (rPPG) offers a non-invasive solution for health monitoring. However, traditional single-modality approaches (RGB or Radio Frequency (RF)) face challenges in balancing robustness and accuracy due to lighting variations, motion artifacts, and skin tone bias. In this paper, we propose CardiacMamba, a multimodal RGB-RF fusion framework that leverages the complementary strengths of both modalities. It introduces the Temporal Difference Mamba Module (TDMM) to capture dynamic changes in RF signals using timing differences between frames, enhancing the extraction of local and global features. Additionally, CardiacMamba employs a Bidirectional SSM for cross-modal alignment and a Channel-wise Fast Fourier Transform (CFFT) to effectively capture and refine the frequency domain characteristics of RGB and RF signals, ultimately improving heart rate estimation accuracy and periodicity detection. Extensive experiments on the EquiPleth dataset demonstrate state-of-the-art performance, achieving marked improvements in accuracy and robustness. CardiacMamba significantly mitigates skin tone bias, reducing performance disparities across demographic groups, and maintains resilience under missing-modality scenarios. By addressing critical challenges in fairness, adaptability, and precision, the framework advances rPPG technology toward reliable real-world deployment in healthcare. The codes are available at: https://github.com/WuZheng42/CardiacMamba.
- Abstract(参考訳): RPPG(remote Photoplethysmography)による心拍数推定は、健康モニタリングに非侵襲的な解決策を提供する。
しかし、従来の単一モードアプローチ(RGBまたはRF)は、照明のバリエーション、モーションアーティファクト、皮膚のトーンバイアスによるロバストさと精度のバランスをとる上で困難に直面している。
本稿では,両モードの相補的強度を利用するマルチモーダルRGB-RF融合フレームワークであるCardiacMambaを提案する。
時間差マンバモジュール(TDMM)を導入し、フレーム間の時間差を利用してRF信号の動的変化を捉え、局所的特徴と大域的特徴の抽出を強化する。
さらに、CardiacMambaは双方向SSMを用いてクロスモーダルアライメントを行い、Channel-wise Fast Fourier Transform (CFFT)を用いてRGBおよびRF信号の周波数領域特性を効果的に捕捉し、最終的に心拍推定精度と周期性検出を改善する。
EquiPlethデータセットに関する大規模な実験は、最先端のパフォーマンスを示し、精度と堅牢性を著しく改善した。
CardiacMambaは、皮膚のトーンバイアスを著しく軽減し、人口集団間のパフォーマンス格差を低減し、欠落したモダリティシナリオの下でレジリエンスを維持する。
公平性、適応性、正確性において重要な課題に対処することで、このフレームワークはrPPG技術を医療における信頼性の高い現実的な展開に向けて前進させる。
コードは、https://github.com/WuZheng42/CardiacMamba.comで入手できる。
関連論文リスト
- FE-UNet: Frequency Domain Enhanced U-Net with Segment Anything Capability for Versatile Image Segmentation [50.9040167152168]
CNNのコントラスト感度関数を実験的に定量化し,人間の視覚システムと比較した。
本稿ではウェーブレット誘導分光ポーリングモジュール(WSPM)を提案する。
人間の視覚系をさらにエミュレートするために、周波数領域拡張受容野ブロック(FE-RFB)を導入する。
本研究では,SAM2 をバックボーンとし,Hiera-Large を事前学習ブロックとして組み込んだ FE-UNet を開発した。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - Fast-RF-Shimming: Accelerate RF Shimming in 7T MRI using Deep Learning [16.39978444212565]
高次場は、電波透過(RF)磁場の不均一性のような課題を導入し、不均一なフリップ角と画像強度のアーチファクトをもたらす。
従来のRFシミング法(Magnitude Least Squares (MLS) 最適化、RFフィールドの不均一性を緩和するが、時間集約的であり、患者の存在を必要とすることが多い。
繰り返し投影されたリッジ回帰によるRFシム予測のような最近の機械学習手法は、代替アプローチを提供するが、広範なトレーニング要件のような課題に直面している。
本稿では,5000倍の高速化を実現するFast RF Shimmingという,総合的な学習ベースフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-21T14:09:58Z) - FgC2F-UDiff: Frequency-guided and Coarse-to-fine Unified Diffusion Model for Multi-modality Missing MRI Synthesis [6.475175425060296]
我々は、周波数誘導および粗粒拡散モデル(FgC2F-UDiff)という新しい統合合成モデルを提案する。
論文 参考訳(メタデータ) (2025-01-07T04:42:45Z) - MHSA: A Multi-scale Hypergraph Network for Mild Cognitive Impairment Detection via Synchronous and Attentive Fusion [4.526574526136158]
同期核融合によるMCI検出のためのマルチスケールハイパーグラフネットワークを提案する。
本手法では、関心領域のスペクトル領域における位相同期関係を計算するために、位相同期値(PLV)を用いる。
PLV係数は動的に戦略を調整し,時間スペクトル融合行列に基づいて動的ハイパーグラフをモデル化する。
論文 参考訳(メタデータ) (2024-12-11T02:59:57Z) - Accelerated Multi-Contrast MRI Reconstruction via Frequency and Spatial Mutual Learning [50.74383395813782]
本稿では,周波数・空間相互学習ネットワーク(FSMNet)を提案する。
提案したFSMNetは, 加速度係数の異なるマルチコントラストMR再構成タスクに対して, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-09-21T12:02:47Z) - Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.902047563260496]
我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。
より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。
我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文 参考訳(メタデータ) (2024-05-08T11:09:24Z) - TAI-GAN: A Temporally and Anatomically Informed Generative Adversarial
Network for early-to-late frame conversion in dynamic cardiac PET inter-frame
motion correction [15.380659401728735]
本稿では,TAI-GAN(Temporally and Anatomically Informed Generative Adrial Network)と呼ばれる新しい手法を提案する。
提案手法は臨床用82-Rb PETデータセットを用いて評価し, この結果から, TAI-GANは実際の参照フレームに匹敵する高画質の変換早期フレームを生成できることが示唆された。
論文 参考訳(メタデータ) (2024-02-14T20:39:07Z) - Frequency Domain Modality-invariant Feature Learning for
Visible-infrared Person Re-Identification [79.9402521412239]
本稿では、周波数領域から見たモダリティの相違を低減するために、新しい周波数領域モダリティ不変特徴学習フレームワーク(FDMNet)を提案する。
我々のフレームワークでは、インスタンス適応振幅フィルタ(IAF)とPhrase-Preserving Normalization(PPNorm)という、2つの新しいモジュールを導入している。
論文 参考訳(メタデータ) (2024-01-03T17:11:27Z) - Diffusion Probabilistic Model Made Slim [128.2227518929644]
軽量画像合成のためのスリム拡散確率モデル(DPM)のカスタマイズ設計を提案する。
一連の条件および非条件画像生成タスクにおける遅延拡散モデルと比較して,計算複雑性を8-18倍に削減する。
論文 参考訳(メタデータ) (2022-11-27T16:27:28Z) - Video-based Remote Physiological Measurement via Cross-verified Feature
Disentangling [121.50704279659253]
非生理的表現と生理的特徴を混同するための横断的特徴分離戦略を提案する。
次に, 蒸留された生理特性を用いて, 頑健なマルチタスク生理測定を行った。
歪んだ特徴は、最終的に平均HR値やr信号のような複数の生理的信号の合同予測に使用される。
論文 参考訳(メタデータ) (2020-07-16T09:39:17Z) - Efficient and Phase-aware Video Super-resolution for Cardiac MRI [23.5319835123499]
我々は,CMRビデオの超解像問題を解決するために,新しいエンドツーエンドのトレーニング可能なネットワークを提案する。
心的知識をモデルに組み込んで時間的情報の利用を支援する。
論文 参考訳(メタデータ) (2020-05-21T13:29:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。