Fugu-MT 論文翻訳(概要): Physiology-Aware Masked Cross-Modal Reconstruction for Biosignal Representation Learning

論文の概要: Physiology-Aware Masked Cross-Modal Reconstruction for Biosignal Representation Learning

arxiv url: http://arxiv.org/abs/2605.00973v1
Date: Fri, 01 May 2026 17:04:15 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-05 20:33:49.525636
Title: Physiology-Aware Masked Cross-Modal Reconstruction for Biosignal Representation Learning
Title（参考訳）: 生体信号表現学習のための生理的適応型クロスモーダル再構成
Authors: Hao Zhou, Simon A. Lee, Cyrus Tanade, Keum San Chun, Juhyeon Lee, Migyeong Gwak, Megha Thukral, Justin Sung, Eugene Hwang, Mehrab Bin Morshed, Li Zhu, Viswam Nathan, Md Mahbubur Rahman, Subramaniam Venkatraman, Sharanya Arcot Desai,
Abstract要約: 我々は、時間的制約として時間的に順序付けられた生体信号間の相互変換を利用する生体信号事前学習フレームワークであるxMAEを紹介する。その結果、xMAEによる事前学習は、19の下流タスクにおいて、非モーダルベースラインとマルチモーダルベースラインの両方を上回った表現が得られることがわかった。 xMAEは、時間構造をマルチモーダル事前学習信号に組み込むことで、共有プロセスの異なる段階を観察できることを示す。
参考スコア（独自算出の注目度）: 14.840342258743448
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Biosignals acquired from different locations on the body often provide temporally ordered views of the same underlying physiological process. However, most existing self supervised learning methods treat these signals as interchangeable views, overlooking the directional temporal dynamics that link them. A canonical example is the relationship between electrocardiography (ECG), which captures the electrical activation initiating each heartbeat, and photoplethysmography (PPG), which records the resulting peripheral pulse delayed by vascular dynamics. To capture this structured relationship, we introduce xMAE, a biosignal pretraining framework that leverages masked cross modal reconstruction across temporally ordered biosignals as a training time constraint to encourage physiologically meaningful timing structure in the learned representations. We show that pretraining with xMAE yields representations that outperform both unimodal and multimodal baselines on 15 of 19 downstream tasks, including cardiovascular outcome prediction, abnormal laboratory test detection, sleep staging, and demographic inference, while generalizing across devices, body locations, and acquisition settings. Further analysis suggests that the ECG PPG timing structure is reflected in the learned PPG representations. More broadly, xMAE demonstrates the effectiveness of incorporating temporal structure into multimodal pretraining when signals observe different stages of a shared underlying process. Code is available at https://github.com/hzhou3/xMAE.
Abstract（参考訳）: 生体上の異なる場所から取得された生体信号は、しばしば、同じ基礎となる生理的過程の時間的に秩序づけられたビューを提供する。しかし、既存の自己教師あり学習手法のほとんどは、これらの信号を相互に関連付ける方向の時間的ダイナミクスを見渡して、交換可能なビューとして扱う。標準的例として、心電図(ECG)は各心拍の電気的活性化を捉え、光胸腺図(PPG)は血管動態によって遅延した末梢脈波を記録する。この構造的関係を捉えるために, 時間的に順序付けられた生体信号間のマスク付きクロスモーダル再構成をトレーニング時間制約として活用し, 学習表現における生理的意味のあるタイミング構造を促進させる生体信号事前学習フレームワークであるxMAEを導入する。心血管結果予測, 検査検査異常検出, 睡眠ステージ, 人口動態推定, デバイス, 身体位置, 獲得設定など, ダウンストリームタスクの15項目において, 単調, マルチモーダルのベースラインを上回り, 単調, マルチモーダルのベースラインを上回りながら, プレトレーニングを行った結果が得られた。さらに分析したところ、ECG PPGタイミング構造が学習されたPSG表現に反映されていることが示唆された。より広義に、xMAEは、信号が共有プロセスの異なる段階を観察するときに、時間構造をマルチモーダル事前学習に組み込むことの有効性を示す。コードはhttps://github.com/hzhou3/xMAEで入手できる。

関連論文リスト

Reperio-rPPG: Relational Temporal Graph Neural Networks for Periodicity Learning in Remote Physiological Measurement [0.0]
リモート光麻痺(英: Remote Photoplethys)は、顔画像の微妙な色の変化を利用して、心拍数や呼吸速度などの重要な兆候を推定する、新たな生理的センシング技術である。この非侵襲的手法は様々な領域で普及しているが、現実世界の条件下での微細な時間的ダイナミクスを捉える能力は過小評価されている。周期構造を効果的に捉えるためにトランスフォーマーを戦略的に統合する新しいフレームワークであるGraph Reperio-rを提案する。
論文参考訳（メタデータ） (2025-11-08T09:41:34Z)
S4ECG: Exploring the impact of long-range interactions for arrhythmia prediction [1.6873748786804317]
マルチエポックな不整脈分類のための構造化状態空間モデルを利用した新しいディープラーニングアーキテクチャであるS4ECGを紹介する。共同マルチエポック予測は,マクロAUROCでは1.0-11.6%,単一エポックアプローチでは有意に優れていた。この研究は、時間的に認識される不整脈検出アルゴリズムへのパラダイムシフトに寄与し、ECG解釈の新しい可能性を開く。
論文参考訳（メタデータ） (2025-10-20T10:48:44Z)
Masked Autoencoders that Feel the Heart: Unveiling Simplicity Bias for ECG Analyses [24.039917512972977]
単純性バイアス(Simplicity Bias, SB)として知られる細粒度だが臨床的に重要な手がかりを見越して, 支配的かつ反復的なパターンに適合する傾向を示した。本稿では,1)ECG信号の動的特性を反映した時間周波数特性を捉えるための時間周波数対応フィルタと,2)2つの領域をまたいだ粗い表現学習のための多言語プロトタイプ再構成と,さらにSBを緩和する手法を提案する。
論文参考訳（メタデータ） (2025-06-25T03:25:49Z)
Cross-Learning Between ECG and PCG: Exploring Common and Exclusive Characteristics of Bimodal Electromechanical Cardiac Waveforms [6.81602773853736]
本稿では,ECGとPCGの共通性と排他的特性について検討する。線形および非線形機械学習モデルを用いて、各モダリティを他方から再構成する。臨床的に関連がある心電図のバイオマーカー、例えば、動注点やQT間隔は、PCGのクロスオブジェクト設定から推定できる。
論文参考訳（メタデータ） (2025-06-11T22:16:59Z)
PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.243031514520794]
LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。 PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文参考訳（メタデータ） (2025-05-06T15:18:38Z)
PSDNorm: Test-Time Temporal Normalization for Deep Learning in Sleep Staging [63.05435596565677]
我々は,モンジュマッピングと時間文脈を利用したPSDNormを提案し,信号の深層学習モデルにおける特徴写像の正規化を行う。 PSDNormは、BatchNormよりも4倍のデータ効率が高く、目に見えない左のデータセットで最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (2025-03-06T16:20:25Z)
CTPD: Cross-Modal Temporal Pattern Discovery for Enhanced Multimodal Electronic Health Records Analysis [50.56875995511431]
マルチモーダルEHRデータから有意な時間的パターンを効率的に抽出するために,CTPD(Cross-Modal Temporal Pattern Discovery)フレームワークを導入する。提案手法では,時間的セマンティックな埋め込みを生成するためにスロットアテンションを用いて改良された時間的パターン表現を提案する。
論文参考訳（メタデータ） (2024-11-01T15:54:07Z)
PhysFormer++: Facial Video-based Physiological Measurement with SlowFast Temporal Difference Transformer [76.40106756572644]
最近のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙な手がかりのマイニングに重点を置いている。本稿では,PhysFormerとPhys++++をベースとした2つのエンドツーエンドビデオ変換器を提案する。 4つのベンチマークデータセットで総合的な実験を行い、時間内テストとクロスデータセットテストの両方において優れた性能を示す。
論文参考訳（メタデータ） (2023-02-07T15:56:03Z)
Learning ECG Representations based on Manipulated Temporal-Spatial Reverse Detection [11.615287369669971]
本稿では,ECG表現を学習する上で,単純だが効果的な手法を提案する。 ECGの時間的特性と空間的特性にインスパイアされ、元の信号を水平に、垂直に、そして水平に、そして垂直に、それぞれ反転させる。その結果,本手法で学習したECG表現は,下流タスクにおいて顕著な性能を示すことがわかった。
論文参考訳（メタデータ） (2022-02-25T02:01:09Z)
PhysFormer: Facial Video-based Physiological Measurement with Temporal Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文参考訳（メタデータ） (2021-11-23T18:57:11Z)
Video-based Remote Physiological Measurement via Cross-verified Feature Disentangling [121.50704279659253]
非生理的表現と生理的特徴を混同するための横断的特徴分離戦略を提案する。次に, 蒸留された生理特性を用いて, 頑健なマルチタスク生理測定を行った。歪んだ特徴は、最終的に平均HR値やr信号のような複数の生理的信号の合同予測に使用される。
論文参考訳（メタデータ） (2020-07-16T09:39:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。