論文の概要: PulmoFusion: Advancing Pulmonary Health with Efficient Multi-Modal Fusion
- arxiv url: http://arxiv.org/abs/2501.17699v1
- Date: Wed, 29 Jan 2025 15:10:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-30 15:54:25.198723
- Title: PulmoFusion: Advancing Pulmonary Health with Efficient Multi-Modal Fusion
- Title(参考訳): プルモフュージョン(PulmoFusion) : マルチモーダル核融合による肺健康の向上
- Authors: Ahmed Sharshar, Yasser Attia, Mohammad Yaqub, Mohsen Guizani,
- Abstract要約: 従来のリモートスピロメトリでは、効果的な肺モニタリングに必要な精度が欠如している。
本稿では,RGBやサーマルビデオデータと患者のメタデータを統合するマルチモーダル予測モデルを用いた,新しい非侵襲的アプローチを提案する。
- 参考スコア(独自算出の注目度): 31.28925796862013
- License:
- Abstract: Traditional remote spirometry lacks the precision required for effective pulmonary monitoring. We present a novel, non-invasive approach using multimodal predictive models that integrate RGB or thermal video data with patient metadata. Our method leverages energy-efficient Spiking Neural Networks (SNNs) for the regression of Peak Expiratory Flow (PEF) and classification of Forced Expiratory Volume (FEV1) and Forced Vital Capacity (FVC), using lightweight CNNs to overcome SNN limitations in regression tasks. Multimodal data integration is improved with a Multi-Head Attention Layer, and we employ K-Fold validation and ensemble learning to boost robustness. Using thermal data, our SNN models achieve 92% accuracy on a breathing-cycle basis and 99.5% patient-wise. PEF regression models attain Relative RMSEs of 0.11 (thermal) and 0.26 (RGB), with an MAE of 4.52% for FEV1/FVC predictions, establishing state-of-the-art performance. Code and dataset can be found on https://github.com/ahmed-sharshar/RespiroDynamics.git
- Abstract(参考訳): 従来のリモートスピロメトリでは、効果的な肺モニタリングに必要な精度が欠如している。
本稿では,RGBやサーマルビデオデータと患者のメタデータを統合するマルチモーダル予測モデルを用いた,新しい非侵襲的アプローチを提案する。
提案手法は, ピーク呼気流(PEF)の回帰と強制呼気体積(FEV1)と強制バイタル容量(FVC)の分類にエネルギー効率の高いスパイキングニューラルネットワーク(SNN)を用い, 軽量CNNを用いて回帰作業におけるSNNの制限を克服する。
マルチモードデータ統合はマルチヘッド・アテンション・レイヤによって改善され、我々はK-Fold検証とアンサンブル・ラーニングを用いて堅牢性を高める。
サーマルデータを用いて呼吸サイクルベースで92%の精度で99.5%の患者を対象とするSNNモデルを構築した。
PEF回帰モデルは0.11(熱)と0.26(RGB)の相対RMSEを獲得し、FEV1/FVC予測では4.52%のMAEを達成し、最先端の性能を確立した。
コードとデータセットはhttps://github.com/ahmed-sharshar/RespiroDynamics.gitにある。
関連論文リスト
- CNN-LSTM Hybrid Deep Learning Model for Remaining Useful Life Estimation [0.0]
RUL推定のための畳み込みニューラルネットワークとLong Short-Term Memory(LSTM)ネットワークを組み合わせたハイブリッドアプローチを提案する。
以上の結果から,CNN-LSTMハイブリッドモデルが最も精度が高く,他の手法よりも優れたスコアが得られた。
論文 参考訳(メタデータ) (2024-12-20T15:48:57Z) - STAL: Spike Threshold Adaptive Learning Encoder for Classification of Pain-Related Biosignal Data [2.0738462952016232]
本稿では,EmoPainデータセットを用いた慢性腰痛 (CLBP) 分類のためのスパイキングニューラルネットワーク (SNN) の最初の応用について述べる。
本稿では,連続生体信号をスパイク列車に変換する訓練可能なエンコーダであるSpike Threshold Adaptive Learning (STAL)を紹介する。
また,SEMG と IMU データのマルチストリーム処理のためのスパイキングリカレントニューラルネットワーク (SRNN) 分類器のアンサンブルを提案する。
論文 参考訳(メタデータ) (2024-07-11T10:15:52Z) - DaFoEs: Mixing Datasets towards the generalization of vision-state
deep-learning Force Estimation in Minimally Invasive Robotic Surgery [6.55111164866752]
深部神経モデルのトレーニングを行うために,様々なソフト環境を持つ新しい視覚触覚データセット(DaFoEs)を提案する。
また,単一入力や入力シーケンスを用いて腹腔鏡ツールが行う力を予測するための可変エンコーダデコーダアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-17T14:39:55Z) - MPCNN: A Novel Matrix Profile Approach for CNN-based Sleep Apnea
Classification [0.0]
睡眠時無呼吸症(SA)は、世界的な健康問題を引き起こす重要な呼吸器疾患である。
心電図(ECG)に基づくSA診断における,いくつかの機械学習モデルとディープラーニングモデルについて検討した。
本稿では,心電図信号の包括的セグメントを深く掘り下げることで,この診断ギャップに対処する革新的な手法を提案する。
論文 参考訳(メタデータ) (2023-11-25T14:39:12Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。
CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。
睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-30T08:24:01Z) - Cross-Shaped Windows Transformer with Self-supervised Pretraining for Clinically Significant Prostate Cancer Detection in Bi-parametric MRI [6.930082824262643]
前立腺癌 (bpMRI) における臨床的に重要な前立腺癌 (csPCa) を検出するために, CSwin 変圧器 UNet モデル (CSwin 変圧器 UNet モデル) を導入した。
1500人の患者を対象とした大規模前立腺bpMRIデータセットを用いて、まずマルチタスク自己教師型学習を用いてCSwin変換器を事前訓練し、データ効率とネットワークの一般化性を向上させる。
5倍のクロスバリデーションは、自己教師型CSwin UNetが0.888 AUCと0.545 Average Precision(AP)を達成し、4つの同等モデル(Swin U)を著しく上回っていることを示している。
論文 参考訳(メタデータ) (2023-04-30T04:40:32Z) - Continuous time recurrent neural networks: overview and application to
forecasting blood glucose in the intensive care unit [56.801856519460465]
連続時間自己回帰リカレントニューラルネットワーク(Continuous Time Autoregressive Recurrent Neural Network, CTRNN)は、不規則な観測を考慮に入れたディープラーニングモデルである。
重篤なケア環境下での血糖値の確率予測へのこれらのモデルの適用を実証する。
論文 参考訳(メタデータ) (2023-04-14T09:39:06Z) - Multi-fidelity Hierarchical Neural Processes [79.0284780825048]
多要素代理モデリングは、異なるシミュレーション出力を融合させることで計算コストを削減する。
本稿では,多階層型階層型ニューラルネットワーク(MF-HNP)を提案する。
疫学および気候モデリングタスクにおけるMF-HNPの評価を行い、精度と不確実性評価の観点から競合性能を達成した。
論文 参考訳(メタデータ) (2022-06-10T04:54:13Z) - Assessing Graph-based Deep Learning Models for Predicting Flash Point [52.931492216239995]
グラフベースのディープラーニング(GBDL)モデルは初めてフラッシュポイントを予測するために実装された。
MPNNの平均R2と平均絶対誤差(MAE)は、それぞれ2.3%低、2.0K高である。
論文 参考訳(メタデータ) (2020-02-26T06:10:12Z) - Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。
これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文 参考訳(メタデータ) (2019-10-12T22:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。