論文の概要: QualityFM: a Multimodal Physiological Signal Foundation Model with Self-Distillation for Signal Quality Challenges in Critically Ill Patients
- arxiv url: http://arxiv.org/abs/2509.06516v1
- Date: Mon, 08 Sep 2025 10:20:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:04.060962
- Title: QualityFM: a Multimodal Physiological Signal Foundation Model with Self-Distillation for Signal Quality Challenges in Critically Ill Patients
- Title(参考訳): QualityFM : 重症心不全患者の信号品質問題に対する自己蒸留を用いた多モード生理信号基礎モデル
- Authors: Zongheng Guo, Tao Chen, Manuela Ferrario,
- Abstract要約: Photoplethysmogram(PSG)とElectrocardiogram(ECG)は一般的にICU(ICU)と手術室(OR)に記録されている。
これまでに調査された手法は、限定的な一般化可能性、広範なラベル付きデータへの依存、およびクロスタスク転送性に悩まされている。
本稿では,これらの生理的信号に対する新しいマルチモーダル基礎モデルであるQualityFMを紹介する。
- 参考スコア(独自算出の注目度): 3.744688073010934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photoplethysmogram (PPG) and electrocardiogram (ECG) are commonly recorded in intesive care unit (ICU) and operating room (OR). However, the high incidence of poor, incomplete, and inconsistent signal quality, can lead to false alarms or diagnostic inaccuracies. The methods explored so far suffer from limited generalizability, reliance on extensive labeled data, and poor cross-task transferability. To overcome these challenges, we introduce QualityFM, a novel multimodal foundation model for these physiological signals, designed to acquire a general-purpose understanding of signal quality. Our model is pre-trained on an large-scale dataset comprising over 21 million 30-second waveforms and 179,757 hours of data. Our approach involves a dual-track architecture that processes paired physiological signals of differing quality, leveraging a self-distillation strategy where an encoder for high-quality signals is used to guide the training of an encoder for low-quality signals. To efficiently handle long sequential signals and capture essential local quasi-periodic patterns, we integrate a windowed sparse attention mechanism within our Transformer-based model. Furthermore, a composite loss function, which combines direct distillation loss on encoder outputs with indirect reconstruction loss based on power and phase spectra, ensures the preservation of frequency-domain characteristics of the signals. We pre-train three models with varying parameter counts (9.6 M to 319 M) and demonstrate their efficacy and practical value through transfer learning on three distinct clinical tasks: false alarm of ventricular tachycardia detection, the identification of atrial fibrillation and the estimation of arterial blood pressure (ABP) from PPG and ECG signals.
- Abstract(参考訳): 光胸腺図(PPG)と心電図(ECG)は、一般的にICU(ICU)と手術室(OR)に記録される。
しかし、貧弱で不完全で一貫性のない信号品質の高頻度は、誤報や診断の不正確さにつながる可能性がある。
これまでに調査された手法は、限定的な一般化可能性、広範なラベル付きデータへの依存、およびクロスタスク転送性に悩まされている。
これらの課題を克服するために、我々は、これらの生理的信号に対する新しいマルチモーダル基礎モデルであるQualityFMを導入し、信号品質の汎用的な理解を得ることを目的としている。
本モデルは,2100万30秒以上の波形と179,757時間のデータからなる大規模データセット上で事前学習を行う。
提案手法は,高品質信号用エンコーダを用いて低品質信号用エンコーダの訓練を指導する自己蒸留戦略を利用して,異なる品質の生理的信号のペア処理を行うデュアルトラックアーキテクチャである。
長周期信号を効率よく処理し,重要な局所準周期パターンを捉えるために,トランスフォーマーモデルに窓付きスパースアテンション機構を統合する。
さらに、エンコーダ出力の直接蒸留損失と電力と位相スペクトルに基づく間接再構成損失とを組み合わせた複合損失関数により、信号の周波数領域特性の保存が保証される。
心室頻拍検出の誤報,心房細動の同定,PTGおよび心電図信号からの動脈圧 (ABP) の推定の3つの異なる臨床課題において, 各種パラメータ数 (9.6M~319M) のモデルの事前訓練を行った。
関連論文リスト
- TF-TransUNet1D: Time-Frequency Guided Transformer U-Net for Robust ECG Denoising in Digital Twin [16.693268731997996]
U-NetベースのエンコーダデコーダアーキテクチャとTransformerエンコーダを統合した,新しい1次元ディープニューラルネットワークTF-TransUNet1Dを提案する。
このモデルは、局所的な形態的特徴と長距離時間的依存関係を同時に捉えるように設計されている。
高精度デノゲーションを提供することで、この作業は心臓のデジタル双生児のための前処理パイプラインにおいて重要なギャップを埋める。
論文 参考訳(メタデータ) (2025-08-28T03:51:19Z) - A Novel Data Augmentation Strategy for Robust Deep Learning Classification of Biomedical Time-Series Data: Application to ECG and EEG Analysis [2.355460994057843]
本研究では,様々な信号タイプにまたがる最先端性能を実現する,新しい統合型深層学習フレームワークを提案する。
従来の研究とは異なり、将来予測能力を達成するために信号の複雑さを科学的に増加させ、最高の予測を導いた。
アーキテクチャには130MBのメモリとプロセスが10ミリ秒で必要であり、ローエンドデバイスやウェアラブルデバイスへのデプロイに適していることを示唆している。
論文 参考訳(メタデータ) (2025-07-16T21:38:10Z) - PhysioWave: A Multi-Scale Wavelet-Transformer for Physiological Signal Representation [18.978031999678507]
様々な生理的信号におけるマルチスケールの時間周波数特徴を捉えることを目的とした,新しいウェーブレットに基づく生理的信号解析手法を提案する。
EMGとECGに特有の2つの大規模事前訓練モデルが導入され、性能が向上し、下流タスクに新たなベースラインが設定された。
統合されたマルチモーダルフレームワークは、事前訓練されたEEGモデルを統合することで構築され、各モーダルはその専用ブランチを通してガイドされ、学習可能な重み付き融合によって融合される。
論文 参考訳(メタデータ) (2025-06-12T05:11:41Z) - Auto-FEDUS: Autoregressive Generative Modeling of Doppler Ultrasound Signals from Fetal Electrocardiograms [3.1295375129864644]
胎児心電図(FECG)信号を対応するDUS波形(Auto-FEDUS)にマッピングするための新しい自己回帰生成モデルを提案する。
拡張因果畳み込みに基づくニューラル・テンポラル・ネットワークを活用することで、このモデルは、信号内の短距離および長距離の依存関係を効果的にキャプチャし、生成されたデータの完全性を維持する。
クロスオブジェクト実験により、Auto-FEDUSは時間領域と周波数領域の両方で従来の生成アーキテクチャよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-04-17T15:25:52Z) - CEReBrO: Compact Encoder for Representations of Brain Oscillations Using Efficient Alternating Attention [53.539020807256904]
交互注意(CEReBrO)を用いた脳振動の表現のための圧縮法について紹介する。
トークン化方式は、チャネルごとのパッチで脳波信号を表現します。
本研究では,チャネル内時間的ダイナミックスとチャネル間空間的相関を共同でモデル化し,通常の自己アテンションに比べて6倍少ないメモリで2倍の速度向上を実現するための注意機構を提案する。
論文 参考訳(メタデータ) (2025-01-18T21:44:38Z) - Multiple Time Series Fusion Based on LSTM An Application to CAP A Phase
Classification Using EEG [56.155331323304]
本研究では,深層学習に基づく脳波チャンネルの特徴レベル融合を行う。
チャネル選択,融合,分類手順を2つの最適化アルゴリズムで最適化した。
論文 参考訳(メタデータ) (2021-12-18T14:17:49Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - Video-based Remote Physiological Measurement via Cross-verified Feature
Disentangling [121.50704279659253]
非生理的表現と生理的特徴を混同するための横断的特徴分離戦略を提案する。
次に, 蒸留された生理特性を用いて, 頑健なマルチタスク生理測定を行った。
歪んだ特徴は、最終的に平均HR値やr信号のような複数の生理的信号の合同予測に使用される。
論文 参考訳(メタデータ) (2020-07-16T09:39:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。